Digital music is currently growing rapidly; however, song retrieval systems that rely solely on genres are often inadequate to meet the needs of users searching for music based on specific moods. This study aimed to cluster songs using the Spotify Songs and Artists Dataset from Kaggle based on audio features that reflect mood dimensions—specifically Valence, Energy, and Danceability—using the K-Means algorithm. This approach was selected to uncover hidden patterns and establish more personalized music categories. The research methodology followed the standard CRISP-DM framework, encompassing data preprocessing with Z-Score normalization, determination of the optimal number of clusters using the Elbow Method, and model evaluation. The experimental results demonstrated that the K-Means algorithm successfully grouped the song data into three main clusters ( ) with distinct characteristics: Happy/Cheerful, Sad/Melancholy, and Energetic/Intense. Cluster quality evaluation using the Silhouette Coefficient yielded a score of 0.30. While this score indicates some overlap typical in the music emotion spectrum, the centroid analysis proved that the algorithm effectively separated mood characteristics to support a more relevant music recommendation system. Keywords: K-Means, Spotify, Clustering, Music Information Retrieval, Mood. Abstrak Musik digital saat ini berkembang pesat, namun sistem pencarian lagu yang hanya mengandalkan genre seringkali tidak memadai untuk memenuhi kebutuhan pengguna yang mencari musik berdasarkan suasana hati (mood). Penelitian ini bertujuan untuk mengelompokkan lagu menggunakan Spotify Songs and Artists Dataset dari Kaggle berdasarkan fitur audio yang merefleksikan dimensi mood, yaitu Valence, Energy, dan Danceability, dengan algoritma K-Means. Pendekatan ini dipilih untuk mengungkap pola tersembunyi dan menciptakan kategori musik yang lebih personal. Metodologi penelitian mengikuti kerangka standar CRISP-DM, dimulai dari pra-pemrosesan data menggunakan normalisasi Z-Score, penentuan jumlah klaster optimal dengan Elbow Method, hingga evaluasi model. Hasil eksperimen menunjukkan bahwa algoritma K-Means berhasil membagi data lagu menjadi tiga klaster utama ( ) dengan karakteristik yang distingtif, yaitu klaster Bahagia (Happy/Cheerful), Sedih (Sad/Melancholy), dan Intens (Energetic/Intense). Evaluasi kualitas klaster menggunakan Silhouette Coefficient menghasilkan nilai 0,30. Meskipun nilai ini mengindikasikan adanya irisan (overlap) antar data yang wajar dalam spektrum emosi musik, analisis pusat klaster (centroid) membuktikan bahwa algoritma mampu memisahkan karakteristik mood secara efektif untuk mendukung sistem rekomendasi musik yang lebih relevan. Kata Kunci: K-Means, Spotify, Klasterisasi, Music Information Retrieval, Mood.
Copyrights © 2026