Clustering merupakan metode penting dalam data mining untuk mengelompokkan data berdasarkan kemiripan. K-Means adalah salah satu algoritma yang banyak digunakan karena kesederhanaannya dalam membagi data ke dalam sejumlah klaster. Penelitian ini membandingkan hasil klasterisasi algoritma K-Means yang dilakukan oleh lima mahasiswa menggunakan lima dataset yang berbeda, dengan variasi jumlah klaster dan tahapan preprocessing. Evaluasi dilakukan menggunakan metrik internal, yaitu Silhouette Score dan Inertia. Hasil menunjukan adanya variasi signifikan dalam kualitas klaster yang dihasilkan, bergantung pada karakteristik data dan parameter yang digunakan. Nilai Silhouette Score tertinggi sebesar 0,6946 dan Inertia terendah sebesar 1,5 ditemukan pada dataset yang berbeda. Penelitian ini memberikan gambaran praktis mengenai pentingnya pemilihan parameter dan tahapan preprocessing dalam meningkatkan kualitas hasil clustering dan juga memberikan wawasan bagi pemula dalam memahami evaluasi hasil klasterisasi secara praktis.
Copyrights © 2025