Penelitian ini menganalisis metode Hierarchical Clustering Single Linkage dan K-Medoids dalam mengelompokkan data pendapatan dan demografi di Chicago. Dengan menggunakan data sekunder dari situs Kaggle, penelitian ini mengelompokkan 77 komunitas area berdasarkan kesamaan karakteristik sosial dan ekonomi. Hasil analisis dengan metode Hierarchical Clustering Single Linkage menunjukkan bahwa terdapat satu komunitas area yang terpisah dalam klaster kedua, sementara sisanya tergabung dalam satu klaster utama. Sebaliknya, metode K-Medoids menghasilkan dua klaster yang lebih seimbang dalam distribusi datanya. Berdasarkan visualisasi clustering, metode K-Medoids dianggap lebih baik karena mampu membagi data secara lebih seimbang. Namun, jika ditinjau dari nilai Silhouette Score dan Dunn Index, metode Hierarchical Clustering Single Linkage lebih unggul karena memiliki nilai yang lebih tinggi, menunjukkan fragmentasi klaster yang lebih jelas. Dengan demikian, pemilihan metode terbaik bergantung pada tujuan analisis, di mana K-Medoids lebih sesuai untuk interpretasi distribusi data yang lebih merata, sedangkan Hierarchical Clustering Single Linkage lebih optimal dalam kriteria klaster yang jelas. This study analyzes the Hierarchical Clustering Single Linkage and K-Medoids methods in clustering income and demographic data of communities in Chicago. Using secondary data from the Kaggle website, this study clusters 77 community areas based on similarities in social and economic characteristics. The analysis using the Hierarchical Clustering Single Linkage method reveals that one community area is isolated in the second cluster, while the rest are grouped into a single main cluster. In contrast, the K-Medoids method produces two clusters with a more balanced distribution. Based on clustering visualization, the K-Medoids method is considered superior as it provides a more evenly distributed classification. However, when evaluated using the Silhouette Score and Dunn Index, the Hierarchical Clustering Single Linkage method outperforms K-Medoids due to its higher values, indicating clearer cluster separation. Thus, the choice of the best method depends on the analytical objective, where K-Medoids is more suitable for interpreting a more balanced data distribution, while Hierarchical Clustering Single Linkage is optimal for achieving distinct cluster separation.
Copyrights © 2025