Claim Missing Document
Check
Articles

Found 1 Documents
Search
Journal : Jurnal Infomedia

Penerapan Algoritma Binning pada Preprocessing Data untuk Meningkatkan Akurasi Klasifikasi Multi-Kelas: Studi Kasus Data SDG Nur Fadhillah, Wiradika; Susetyoko, Ronny; Nadhori, Isbat Uzzin
Jurnal Infomedia: Teknik Informatika, Multimedia, dan Jaringan Vol 10, No 2 (2025): Jurnal Infomedia
Publisher : Politeknik Negeri Lhokseumawe

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30811/jim.v10i2.7165

Abstract

Klasifikasi data memainkan peran esensial dalam analisis data, terutama untuk data Sustainable Development Goals (SDGs) yang seringkali memiliki karakteristik kompleks seperti nilai hilang dan distribusi tidak seimbang, sehingga memerlukan tahap preprocessing yang efektif. Penelitian ini bertujuan untuk mengevaluasi secara komprehensif efektivitas tiga teknik binning, yaitu Fixed Binning, Random Binning, dan KNN Binning, dalam meningkatkan akurasi klasifikasi multikelas pada data SDGs. Teknik binning ini diimplementasikan dan diuji menggunakan tiga algoritma klasifikasi utama, yaitu Random Forest, Logistic Regression, dan Multilayer Perceptron (MLP). Penelitian ini menggunakan dua dataset yang merepresentasikan data SDGs, yaitu data pembangunan berkelanjutan dan ketahanan pangan. Dataset tersebut adalah dataset UKT dengan 2.137 entri dan dataset Ketahanan pangan dengan 514 entri. KNN Binning dipilih karena kemampuannya mengelompokkan data berdasarkan kedekatan antar instans, adaptif terhadap distribusi data yang kompleks. Hasil penelitian secara konsisten menunjukkan bahwa KNN Binning memberikan peningkatan akurasi tertinggi. Secara spesifik, kombinasi KNN Binning dengan Random Forest menghasilkan akurasi 92.25% pada dataset UKT dan 73.79% pada dataset Ketahanan pangan. Lebih lanjut, kombinasi ini juga menunjukkan peningkatan pada metrik presisi, recall, dan F1 score. Temuan ini menggarisbawahi superioritas KNN Binning dalam menangani data SDGs yang beragam dan tidak merata, sehingga memberikan kontribusi penting bagi pengembangan teknik preprocessing yang lebih akurat, andal, dan dapat meningkatkan performa model klasifikasi secara keseluruhan untuk analisis data SDGs.