I Wayan Iswara Pranidana
Universitas Pendidikan Ganesha

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Penerapan Algoritma K-Nearest Neighbors (KNN) Dengan Optimasi PCA untuk Klasifikasi Genre Musik Berdasarkan Fitur Audio Spotify I Wayan Iswara Pranidana; I Made Agus Wirawan
KARMAPATI (Kumpulan Artikel Mahasiswa Pendidikan Teknik Informatika) Vol. 15 No. 2 (2026): [ONGOING] Karmapati Vol 15 No 2 Tahun 2026
Publisher : Universitas Pendidikan Ganesha

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.23887/karmapati.v15i2.114510

Abstract

Industri musik digital mengalami pertumbuhan pesat, dengan platform seperti Spotify yang kini menyimpan lebih dari 80 juta lagu. Pengelompokan genre musik secara manual tidak lagi efisien, sehingga diperlukan sistem klasifikasi otomatis. Penelitian ini bertujuan untuk mengklasifikasikan 6 genre musik (EDM, Rap, Pop, R&B, Latin, dan Rock) dari 32.833 lagu pada Spotify Songs Dataset menggunakan algoritma K-Nearest Neighbors (KNN). Untuk mengatasi tumpang tindih pada fitur multidimensi, diterapkan Principal Component Analysis (PCA) sebagai tahap reduksi dimensi guna mereduksi noise sekaligus mempertahankan 95% varians informasi data aslinya. Selain itu, pencarian parameter optimal dilakukan secara komprehensif menggunakan Grid Search dengan 5-fold Cross-Validation untuk membandingkan metrik jarak Euclidean dan Cosine Similarity pada berbagai nilai K ganjil. Hasil optimasi menemukan bahwa KNN berkinerja terbaik menggunakan metrik jarak Cosine Similarity dengan jumlah tetangga K=15. Evaluasi menunjukkan akurasi model meningkat menjadi 48,38% dibandingkan baseline KNN standar. Genre Rock (F1-Score 0,61) dan EDM (F1-Score 0,60) memiliki performa klasifikasi terbaik, sementara Pop paling sering salah diklasifikasi (F1-Score 0,29) akibat tumpang tindih fitur yang dibuktikan melalui visualisasi sebaran PCA. Batasan akurasi ini mengonfirmasi bahwa pendekatan berbasis jarak memiliki kendala intrinsik pada dataset fitur audio numerik yang berdistribusi rapat dan saling tumpang tindih antar kelas.