Penelitian ini bertujuan untuk membandingkan dua algoritma clustering yang populer, yaitu K-Means dan Hierarchical Clustering, dalam mengelompokkan data pelanggan layanan internet. Data yang digunakan mencakup informasi seperti tanggal, nomor pesanan, jenis internet, deskripsi produk, kuantitas Mbps, wilayah, kota, dan tarif IDR. Clustering adalah teknik dalam data mining yang digunakan untuk mengelompokkan data berdasarkan karakteristik yang serupa, membantu perusahaan dalam memahami pola penggunaan, segmentasi pasar, dan meningkatkan layanan kepada pelanggan. Pada penelitian ini, kedua algoritma diuji menggunakan metrik Sum of Squared Errors (SSE) untuk mengevaluasi kinerja clustering. Hasil penelitian menunjukkan bahwa algoritma K-Means lebih unggul dibandingkan dengan Hierarchical Clustering dalam hal efisiensi dan akurasi ketika mengevaluasi nilai SSE. K-Means mampu mengelompokkan data dengan lebih cepat dan menghasilkan cluster yang lebih jelas, sementara Hierarchical Clustering membutuhkan waktu komputasi yang lebih lama dan hasil clustering yang kurang optimal dalam beberapa kasus. Kesimpulannya, algoritma K-Means lebih cocok digunakan untuk analisis data pelanggan layanan internet dalam konteks ini karena keunggulannya dalam kecepatan dan akurasi clustering berdasarkan hasil pengecekan SSE. Penelitian ini memberikan panduan bagi perusahaan dalam memilih algoritma clustering yang tepat untuk mengelompokkan data pelanggan guna meningkatkan strategi bisnis dan kualitas layanan. Kata Kunci: K-Means, Hierarchical Clustering, clustering, data pelanggan, layanan internet, data mining, segmentasi pasar, Sum of Squared Errors (SSE).
Copyrights © 2024