Algoritma K-Nearest Neighbor (KNN) adalah salah satu algoritma dalam data mining, bekerja didasarkan pada pengukuran jarak antara tupel pada data-uji dan masing-masing data-latih untuk memutuskan luaran klasifikasi akhir. Pada algoritma ini jenis data pada tiap atribut harus berupa numerik atau kontinyu, karena dihitung jarak setiap atribut yang sama untuk setiap tupel dengan tupel yang akan dicari kelasnya. Akan tetapi pada realitanya himpunan-data yang akan diolah tidak selalu berupa numerik, tetapi dapat berupa kategorikal baik nominal maupun ordinal.Untuk data numerik dapat langsung diolah tanpa proses transformasi(pengodean), adapun untukĀ jenis data nominal pengodean ke numerik dilakukan dengan metode label umumnya berupa nomor urut, namun hal ini dirasa kurang tepat mengingat nomor urut bersifat kuantitatif , Untuk itulah digunakan pengodean dengan metode one-hot-encoding (OHE) dimana setiap item data pada suatu atribut dikonversi ke bit 1 dan 0 yang menjadikan antar obyek pada himpunan-data setara. Untuk mengetahui sejauh mana akurasi transformasi OHE dibanding transformasi label diimplementasikan pada algoritma KNN untuk prediksi kelulusan mahasiswa dimana terdapat 2 jenis atribut yakni numerik dan nominal. Berdasarkan pengujian 2 metode pengodean tersebut diketahui bahwa akurasi transformasi dengan OHE pada berbagai nilai neighbor lebih tinggi dibanding metode label, sedangkan kecepatan proses kedua metode pengodean relatif sama.
Copyrights © 2025