Diabetes mellitus adalah salah satu penyakit kronis yang semakin umum di dunia termasuk di Indonesia. Mendeteksi penyakit ini sejak dini sangatlah penting untuk mencegah munculnya komplikasi serius. Penelitian ini dilakukan untuk menganalisis prediksi penyakit diabetes menggunakan dua metode pembelajaran mesin, yaitu Naïve Bayes dan K-Nearest Neighbor (KNN). Naïve Bayes dikenal sebagai metode klasifikasi yang sederhana namun efektif berdasarkan probabilitas, sementara KNN merupakan metode klasifikasi berbasis instance yang menggunakan kedekatan data dengan data yang sudah ada. Dataset yang digunakan mencakup 8 atribut kesehatan, seperti usia, jenis kelamin, hipertensi, penyakit jantung, riwayat merokok, BMI, kadar HbA1c, dan kadar glukosa darah, dengan label target berupa status diabetes (1 untuk diabetes, 0 untuk non-diabetes). Tahapan tersebut mencakup pengolahan awal data, seperti mengisi nilai kosong, menormalisasi atribut numerik, dan mengkode atribut kategori. Naïve Bayes memanfaatkan distribusi probabilitas, sedangkan KNN mengelompokkan data berdasarkan jarak ke tetangga terdekat. KNN lebih baik digunakan untuk dataset dengan pola yang rumit, sementara Naïve Bayes lebih efisien dalam hal komputasi
Copyrights © 2025