Diabetes melitus merupakan gangguan metabolik yang terjadi ketika pankreas tidak mampu memproduksi insulindalam jumlah yang cukup atau ketika tubuh tidak dapat menggunakan insulin secara efektif, sehingga menyebabkan kadar gula darah tidak terkontrol dan berpotensi menimbulkan komplikasi jangka panjang. Penelitian ini menerapkan pendekatan data mining untuk mengklasifikasikan tingkat risiko diabetes menggunakan dua algoritma supervised learning, yaitu Naive Bayes dan k-Nearest Neighbor (k-NN), dengan tujuan membandingkan kinerja prediksi serta mengidentifikasi pola dari dataset. Proses penelitian mengikuti tahapan Knowledge Discovery in Database (KDD), meliputi seleksi data, pra-pemrosesan, transformasi, pemodelan, dan evaluasi. Seluruh eksperimen dilakukan menggunakan RapidMiner dengan skema pembagian data 80:20 melalui stratified split dan random seed tetap untuk menjaga konsistensi hasil. Evaluasi model menggunakan confusion matrix, akurasi, precision, recall, dan F1-score. Hasil menunjukkan bahwa k-NN memperoleh akurasi sebesar 81,72%, lebih tinggi dibandingkan Naive Bayes sebesar 75,42%. Dari sisi precision dan recall, Naive Bayes menghasilkan precision 86,69%, recall 93,12%, dan F1-score 89,79%, sedangkan k-NN memperoleh precision 90,68%, recall 80,33%, dan F1-score 85,19%. Meskipun k-NN unggul dalam akurasi dan precision, Naive Bayes menunjukkan keseimbangan performa yang lebih baik melalui nilai recall dan F1-score yang lebih tinggi, khususnya dalam mendeteksi kelas positif. Temuan ini menegaskan bahwa pemilihan model tidak hanya mempertimbangkan akurasi keseluruhan, tetapi juga performa pada tiap kelas, terutama pada dataset kesehatan yang cenderung tidak seimbang.