Diabetes merupakan penyakit serius yang disebabkan oleh ketidakmampuan pankreas dalam memproduksi insulin secara optimal. Jika tidak dideteksi dan ditangani dengan baik, diabetes dapat menyebabkan komplikasi berat seperti kebutaan, gagal jantung, bahkan kematian. Faktor-faktor penyebab diabetes antara lain keturunan, berat badan, usia, tekanan darah serta gaya hidup. Namun, gejala awal sering kali tidak terlihat sehingga diperlukan metode deteksi dini untuk mengurangi risiko komplikasi. Penelitian ini bertujuan untuk menerapkan metode klasifikasi dalam data mining menggunakan algoritma C4.5 dalam membentuk pohon Keputusan (Decision Tree) untuk mengklasifikasikan penderita penyakit diabetes. Penelitian ini menggunakan dataset dari Kaggle yang berisi 2.000 data dengan 4 atribut dan 1 label target. Data dilakukan normalisasi dan transformasi sebelum diklasifikasikan menggunakan algoritma Decision Tree C4.5. Pengujian dilakukan menggunakan confusion matrix untuk mengevaluasi performa model berdasarkan akurasi, presisi, dan recall. Dari hasil pengujian menggunakan confusion matrix, diperoleh akurasi sebesar 77%, presisi sebesar 50%, dan recall sebesar 74 %. Hasil ini menunjukkan bahwa model klasifikasi yang diterapkan memiliki kinerja yang cukup baik dalam mengidentifikasi penderita diabetes.
Copyrights © 2025