Diabetes merupakan salah satu penyakit kronis yang terus meningkat secara global, termasuk di Indonesia. Pendeteksian dini terhadap risiko diabetes sangat penting untuk mencegah komplikasi serius yang dapat terjadi di masa depan. Permasalahan utama dalam prediksi diabetes terletak pada keterbatasan data klinis, distribusi kelas yang tidak seimbang, serta rendahnya akurasi dalam mendeteksi pasien yang benar-benar mengidap diabetes. Tujuan dari penelitian ini adalah untuk mengevaluasi kemampuan algoritma Naive Bayes dalam memprediksi risiko diabetes, mengidentifikasi faktor risiko utama, serta meningkatkan akurasi model melalui teknik seleksi fitur dan evaluasi performa model. Metode yang digunakan meliputi pengumpulan data dari platform Kaggle, pra-pemrosesan data (transformasi dan pemilihan atribut), pembagian data menjadi data training dan testing, serta penerapan algoritma Naive Bayes menggunakan aplikasi RapidMiner. Hasil penelitian menunjukkan bahwa model Naive Bayes mampu mencapai akurasi sebesar 76,05%, dengan recall sebesar 57,34% untuk pasien yang mengidap diabetes dan precision sebesar 68,05%. Meskipun model cukup andal dalam mengidentifikasi pasien sehat, performa dalam mendeteksi pasien diabetes masih dapat ditingkatkan melalui pemilihan fitur yang tepat dan penggunaan dataset yang lebih seimbang. Penelitian ini memberikan gambaran mengenai potensi dan keterbatasan algoritma Naive Bayes dalam klasifikasi risiko diabetes, serta dapat dijadikan dasar untuk pengembangan sistem prediksi kesehatan yang lebih akurat dan aplikatif di masa depan.
Copyrights © 2025