ABSTRAK. K-Nearest Neighbor (KNN) adalah salah satu metode klasifikasi non-parametrik yang prinsip pengerjaannya dengan mengklasifikasikan suatu objek dalam data testing berdasarkan kelas mayoritas dari k tetangga terdekatnya (neighbor) pada data training. Salah satu permasalahan yang utama pada KNN yaitu banyak variabel yang harus digunakan dalam pelaksanaannya, terlebih terdapat kasus dimana banyaknya variabel lebih besar dibanding dengan banyaknya pengamatan. Maka dari itu, Beuren & Anzanello (2019) membuat kerangka kerja baru untuk pemilihan variabel dengan menggabungkan beberapa metode, yaitu Mutual Information (MI), Algoritma Kennard Stone (KS), Statistik Anderson Darling (AD), Statistik Kruskal Wallis (KW), K-Nearest Neighbor (KNN), Leave One Out Cross Validation (LOOCV), dan Confusion Matrix. Pada penelitian ini menerapkan metode Beuren & Anzanello (2019) untuk memilih variabel untuk mengklasifikasikan desa/kelurahan ke dalam status perdesaan dan perkotaan di wilayah Bandung Raya. Dengan menggunakan algoritma K-Nearest Neighbor (KNN) dan k = 5 tetangga terdekat dari 24 variabel diperoleh kombinasi variable independent, yaitu Kepadatan Penduduk (X_8) dan Banyaknya Penduduk (X_5) adalah kombinasi yang paling cocok dalam mengklasifikasikan status perdesaan dan perkotaan pada desa/kelurahan yang ada di wilayah Bandung Raya, diperoleh hasil akurasi sebesar 80.72%.
Copyrights © 2024