Tedc
Vol 12 No 3 (2018): Jurnal TEDC

ANALISIS METODE K NEAREST NEIGHBOR IMPUTATION (KNNI) UNTUK MENGATASI DATA HILANG PADA ESTIMASI DATA SURVEY

Euis Sartika (Unknown)



Article Info

Publish Date
29 Aug 2019

Abstract

Ketidaklengkapan suatu data survey (missing data) akan menyebabkan inferensi statistik tidak dapat dilakukan. Penghilangan data yang tidak lengkap akan menyebabkan berkurangnya informasi yang dibutuhkan sehingga kurang menggambarkan kondisi yang seenarnya. Terdapat beberapa cara untuk mengatasi missing data tersebut, salah satu adalah dengan mengganti data yang hilang (missing data) tersebut. Penelitian ini bertujuan mengkaji analisis k Nearest Neighbor sebagai salah satu cara untuk mengimputasi data yang hilang. Metode ini didasarkan pada konsep jarak terdekat dari observasi (k), kemudian pada observasi tersebut diberi pembobotan. Software yang digunakan adalah R versi 3.4.3. Pada penelitian ini digunakan juga metode imputasi yang lain yaitu Series Mean dan metode Algoritma EM sebagai pembanding. Untuk membandingkan ketiga metode tersebut digunakan nilai RMSE. Hasil menunjukkan bahwa metode Series Mean menunjukkan nilai RMSE terkecil. Kelebihan lain dari k Nearest Neighbor adalah dapat digunakan untuk imputasi data berskala numerik dan kategorik. Kata kunci: missing data, k Nearest Neighbor, Series Mean, Algoritma EM, RMSE

Copyrights © 2018