Ketenagakerjaan merupakan indikator penting dalam mendukung pembangunan ekonomi nasional. Namun, distribusi tenaga kerja di Indonesia masih menunjukkan ketimpangan antarprovinsi. Beberapa provinsi memiliki kontribusi ekonomi dan tingkat pekerjaan formal yang tinggi, sementara yang lain tertinggal. Penelitian ini bertujuan mengidentifikasi pola distribusi ketenagakerjaan antarprovinsi dengan menerapkan analisis klaster menggunakan delapan variabel dari data BPS. Mengingat adanya pencilan dalam data, deteksi outlier dilakukan menggunakan metode Local Outlier Factor (LOF) yang mengidentifikasi enam provinsi sebagai outlier yaitu Jawa Barat, Jawa Tengah, Jawa Timur, DKI Jakarta, Banten, dan Sumatera Utara. Selanjutnya, data dianalisis menggunakan dua pendekatan klasterisasi, yaitu Agglomerative Hierarchical Clustering (Single, Complete, Average Linkage, dan Ward) dan HDBSCAN untuk membandingkan ketahanan metode terhadap data outlier. Validasi kualitas klaster dilakukan dengan Silhouette Coefficient. Hasil menunjukkan bahwa metode Single Linkage memiliki nilai koefisien tertinggi, namun kurang konsisten dalam memisahkan outlier. Sebaliknya, HDBSCAN lebih adaptif terhadap data yang mengandung noise dan pencilan dengan Silhouette Coefficient sebesar 0.546. Dengan demikian, HDBSCAN dinilai lebih efektif dalam analisis klasterisasi data ketenagakerjaan yang kompleks, sementara metode AHC lebih unggul dalam membentuk klaster yang jelas jika pencilan dapat ditangani secara terpisah.
Copyrights © 2025