Diabetes mellitus, yang sering disebut diabetes, merupakan masalah kesehatan global yang signifikan dan mempengaruhi sekitar 422 juta orang di seluruh dunia. Penyakit ini lebih umum terjadi di negara-negara dengan tingkat ekonomi rendah dan menengah, menjadikannya tantangan kesehatan yang mendesak. Pencegahan dan deteksi dini diabetes sangat penting untuk mengurangi dampaknya terhadap kesehatan individu dan masyarakat. Penelitian ini mengeksplorasi penerapan metode K-Nearest Neighbors (K-NN) untuk prediksi diabetes dengan penekanan pada penggunaan Information Gain untuk seleksi fitur. Information Gain digunakan untuk mengidentifikasi dan memilih subset atribut paling informatif dari dataset kesehatan, bertujuan untuk meningkatkan akurasi model K-NN dan mengurangi dimensi data yang tidak relevan. Penelitian dilakukan dengan menguji model K-NN dalam empat skenario rasio dataset yang berbeda (90%:10%, 80%:20%, 70%:30%, 60%:40%). Hasil eksperimen menunjukkan bahwa penerapan Information Gain secara konsisten meningkatkan akurasi model K-NN dibandingkan dengan model tanpa seleksi fitur. Pada rasio 90%:10%, model K-NN tanpa Information Gain mencapai akurasi 69,11%, sementara model dengan Information Gain mencapai akurasi 70,96%, dengan Pencarian nilai K terbaik menunjukkan bahwa model K-NN dengan Information Gain mencapai akurasi tertinggi sebesar 72,93% pada nilai K = 17.
Copyrights © 2024