Sinergi : Jurnal Ilmiah Multidisiplin
Vol. 2 No. 1 (2026): Sinergi: Jurnal Ilmiah Multidisiplin

Klasterisasi Lagu pada Dataset Spotify Berdasarkan Fitur Audio Menggunakan Algoritma K-Means

Branchris (Unknown)
Kevin Alexander Yech (Unknown)
Andri Wijaya (Unknown)



Article Info

Publish Date
03 Jan 2026

Abstract

Digital music is currently growing rapidly; however, song retrieval systems that rely solely on genres are often inadequate to meet the needs of users searching for music based on specific moods. This study aimed to cluster songs using the Spotify Songs and Artists Dataset from Kaggle based on audio features that reflect mood dimensions—specifically Valence, Energy, and Danceability—using the K-Means algorithm. This approach was selected to uncover hidden patterns and establish more personalized music categories. The research methodology followed the standard CRISP-DM framework, encompassing data preprocessing with Z-Score normalization, determination of the optimal number of clusters using the Elbow Method, and model evaluation. The experimental results demonstrated that the K-Means algorithm successfully grouped the song data into three main clusters ( ) with distinct characteristics: Happy/Cheerful, Sad/Melancholy, and Energetic/Intense. Cluster quality evaluation using the Silhouette Coefficient yielded a score of 0.30. While this score indicates some overlap typical in the music emotion spectrum, the centroid analysis proved that the algorithm effectively separated mood characteristics to support a more relevant music recommendation system. Keywords: K-Means, Spotify, Clustering, Music Information Retrieval, Mood. Abstrak Musik digital saat ini berkembang pesat, namun sistem pencarian lagu yang hanya mengandalkan genre seringkali tidak memadai untuk memenuhi kebutuhan pengguna yang mencari musik berdasarkan suasana hati (mood). Penelitian ini bertujuan untuk mengelompokkan lagu menggunakan Spotify Songs and Artists Dataset dari Kaggle berdasarkan fitur audio yang merefleksikan dimensi mood, yaitu Valence, Energy, dan Danceability, dengan algoritma K-Means. Pendekatan ini dipilih untuk mengungkap pola tersembunyi dan menciptakan kategori musik yang lebih personal. Metodologi penelitian mengikuti kerangka standar CRISP-DM, dimulai dari pra-pemrosesan data menggunakan normalisasi Z-Score, penentuan jumlah klaster optimal dengan Elbow Method, hingga evaluasi model. Hasil eksperimen menunjukkan bahwa algoritma K-Means berhasil membagi data lagu menjadi tiga klaster utama ( ) dengan karakteristik yang distingtif, yaitu klaster Bahagia (Happy/Cheerful), Sedih (Sad/Melancholy), dan Intens (Energetic/Intense). Evaluasi kualitas klaster menggunakan Silhouette Coefficient menghasilkan nilai 0,30. Meskipun nilai ini mengindikasikan adanya irisan (overlap) antar data yang wajar dalam spektrum emosi musik, analisis pusat klaster (centroid) membuktikan bahwa algoritma mampu memisahkan karakteristik mood secara efektif untuk mendukung sistem rekomendasi musik yang lebih relevan. Kata Kunci: K-Means, Spotify, Klasterisasi, Music Information Retrieval, Mood.

Copyrights © 2026






Journal Info

Abbrev

sinergi

Publisher

Subject

Aerospace Engineering Humanities Biochemistry, Genetics & Molecular Biology Education Environmental Science Health Professions Immunology & microbiology Physics Social Sciences

Description

Sinergi: Jurnal Ilmiah Multidisiplin adalah publikasi ilmiah yang bertujuan untuk memfasilitasi pertukaran gagasan, riset, serta temuan ilmiah yang berasal dari berbagai disiplin ilmu, guna memberikan kontribusi yang signifikan bagi pengembangan ilmu pengetahuan dan pemecahan masalah global. Jurnal ...