Diabetes melitus merupakan penyakit kronis yang memerlukan deteksi dini untuk mencegah terjadinya komplikasi serius. Machine learning dapat digunakan sebagai pendekatan untuk memprediksi penyakit diabetes berdasarkan data klinis pasien. Penelitian ini bertujuan untuk menganalisis performa algoritma K-Nearest Neighbors (KNN) dalam memprediksi penyakit diabetes menggunakan dataset diabetes.csv. Dataset yang digunakan terdiri dari 768 data pasien, dengan delapan fitur klinis dan satu variabel target. Tahapan penelitian meliputi exploratory data analysis (EDA), preprocessing data melalui penanganan nilai nol menggunakan imputasi median serta standarisasi fitur, pelatihan dan evaluasi model KNN, serta eksperimen variasi nilai k pada rentang 1 hingga 30. Model baseline KNN dengan nilai k = 5 menghasilkan akurasi sebesar 70,78%. Setelah dilakukan optimasi parameter, nilai k optimal diperoleh pada k = 26 dengan akurasi tertinggi sebesar 77,92%. Evaluasi menggunakan confusion matrix dan classification report menunjukkan bahwa model memiliki performa yang baik dalam mengklasifikasikan pasien non-diabetes, namun masih memiliki keterbatasan dalam mendeteksi seluruh kasus diabetes. Hal ini ditunjukkan oleh nilai recall kelas diabetes sebesar 0,56. Secara keseluruhan, algoritma KNN cukup efektif dalam memprediksi penyakit diabetes, namun sensitivitas terhadap kasus diabetes yang bersifat kritis secara medis masih perlu ditingkatkan melalui pengembangan metode atau pendekatan lanjutan
Copyrights © 2026