Clustering merupakan metode penting dalam eksplorasi data untuk mengelompokkan objek berdasarkan kemiripan tanpa memerlukan label. Algoritma K-Means, yang banyak digunakan karena kecepatan dan kesederhanaannya, memiliki kelemahan dalam inisialisasi centroid acak yang dapat mengakibatkan konvergensi ke lokal optimal dan menurunkan kualitas clustering. Penelitian ini mengusulkan strategi inisialisasi centroid berbasis mean global untuk meningkatkan akurasi clustering. Pendekatan deterministik ini memanfaatkan distribusi data secara menyeluruh untuk membentuk centroid awal yang stabil, mengurangi ketergantungan pada acak dan mempercepat konvergensi. Evaluasi menggunakan dataset sintetik dan metrik seperti Sum of Squared Error (SSE), Silhouette Coefficient, serta waktu komputasi menunjukkan kinerja lebih baik dengan SSE lebih rendah (3,92 vs. 4,32), Silhouette Score lebih tinggi (0,65 vs. 0,62), dan eksekusi lebih cepat (0,32s vs. 0,45s) dibanding inisialisasi acak. Hasil ini membuktikan keefektifan inisialisasi mean global untuk clustering yang seimbang dan efisien, terutama pada dataset homogen. Rekomendasi penelitian selanjutnya mencakup eksplorasi metode hybrid dan dataset riil yang lebih beragam untuk validasi lebih luas
Copyrights © 2025