Clinton Lumbantoruan
Universitas Teknokrat Indonesia

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Penerapan Metode K-Means Clustering dan Principal Component Analysis (PCA) untuk Pengelompokan Provinsi di Indonesia Berdasarkan Indikator Pendidikan Clinton Lumbantoruan; Dyah Ayu Megawaty
Journal of Artificial Intelligence and Technology Information (JAITI) Vol. 4 No. 2 (2026): Volume 4 Number 2 June 2026
Publisher : PT. Tech Cart Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.58602/jaiti.v4i2.256

Abstract

Penelitian ini bertujuan untuk mengategorikan provinsi-provinsi di Indonesia berdasarkan indikator-indikator pendidikan, dengan harapan memberikan gambaran menyeluruh dan berbasis data mengenai kondisi pendidikan. Latar belakang studi ini beranjak dari adanya kesenjangan tingkat pendidikan di berbagai wilayah yang membutuhkan analisis mendalam dengan pendekatan data mining. Data yang digunakan diperoleh dari Badan Pusat Statistik (BPS) yang mencakup sejumlah indikator pendidikan, seperti rata-rata lama bersekolah, angka partisipasi kasar (APK), angka partisipasi murni (APM), angka partisipasi sekolahan (APS), serta persentase penduduk yang tidak pernah atau belum mengenyam pendidikan. Pendekatan yang diterapkan dalam penelitian ini adalah Principal Component Analysis (PCA) untuk reduksi dimensi dan K-Means Clustering untuk pengelompokan data. Langkah-langkah penelitian mencakup preprocessing data, normalisasi dengan menggunakan StandardScaler, reduksi dimensi melalui PCA, dan clustering dengan K-Means. Temuan dari penelitian ini menunjukkan bahwa dua komponen utama dari PCA mampu menerangkan hingga 79% variasi dalam data, sehingga bermanfaat dalam menyederhanakan dataset yang ada. Proses pengelompokan menghasilkan tiga kelompok provinsi dengan karakteristik pendidikan yang bervariasi, yaitu kategori tinggi, menengah, dan rendah. Penilaian menggunakan silhouette score mengindikasikan bahwa model ini memiliki kualitas pengelompokan yang baik. Temuan dari penelitian ini diharapkan dapat memberikan kontribusi dalam membantu pengambilan kebijakan pendidikan yang lebih tepat serta menjadi landasan untuk penelitian selanjutnya dengan menambahkan variabel yang lebih luas.