Diabetes merupakan penyakit metabolisme jangka panjang yang berdampak pada tubuh manusia dengan cara mengubah glukosa darah menjadi energi. Individu yang telah didiagnosis dengan diabetes tidak dapat mengontrol level gula dalam darah, yang akan menyebabkan peningkatan kadar gula darah dan tekanan darah. Penelitian ini bertujuan untuk menganalisis dan membandingkan visualisasi data dari empat model machine learning (Random Forest, Logistic Regression, SVC, dan Gradient Boosting ) dalam prediksi penyakit diabetes. Hasil penelitian ini diharapkan dapat memberikan panduan dalam pemilihan teknik visualisasi yang optimal untuk mendukung interpretasi hasil prediksi diabetes berbasis machine learning, serta meningkatkan efektivitas komunikasi hasil prediksi kepada praktisi medis dan pasien. Hasil penelitian memperlihatkan bahwa Gradient Boosting menempati posisi teratas dengan skor ROC AUC sebesar 0,97, disusul oleh Random Forest (0,94) dan Logistic Regression (0,93), sementara SVC mencatatkan nilai 0,84. Walaupun tingkat akurasi keseluruhan model cukup tinggi (?97%), nilai recall pada kelas positif masih rendah (0,39–0,49), yang menunjukkan adanya kendala dalam mengidentifikasi kasus minoritas pada dataset yang tidak seimbang. Variabel fisiologis, seperti BMI dan HbA1c, terbukti berperan signifikan sebagai prediktor, namun kinerja model diperkirakan dapat meningkat lebih jauh dengan mengintegrasikan faktor perilaku dan riwayat medis yang lebih terperinci.
Copyrights © 2025