Diabetes mellitus merupakan penyakit kronis dengan prevalensi yang terus meningkat secara global, sehingga deteksi dini menjadi aspek penting untuk mencegah komplikasi lebih lanjut. Perkembangan machine learning memberikan peluang signifikan dalam mendukung pengambilan keputusan medis melalui prediksi yang lebih akurat. Penelitian ini bertujuan mengembangkan model prediksi diabetes berbasis algoritma Random Forest yang dipadukan dengan Synthetic Minority Oversampling Technique (SMOTE) serta metode seleksi fitur. Dataset yang digunakan adalah Pima Indians Diabetes Database yang terdiri atas 768 sampel dengan delapan atribut prediktor. Tahapan penelitian meliputi pra-pengolahan data, penerapan SMOTE untuk mengatasi ketidakseimbangan kelas, seleksi fitur berbasis Information Gain, serta evaluasi model menggunakan skema 10-fold cross-validation. Hasil eksperimen menunjukkan bahwa integrasi SMOTE dan seleksi fitur mampu meningkatkan kinerja model dibandingkan baseline, dengan akurasi sebesar 87,93%, nilai recall 91,3% untuk kelas positif, dan area ROC 0,949. Model terbaik kemudian diimplementasikan dalam aplikasi Android berbasis standalone yang memungkinkan pengguna melakukan prediksi risiko diabetes secara mandiri melalui input tujuh atribut utama, yaitu Glucose, Pregnancies, Age, BMI, Insulin, Diabetes Pedigree Function, dan Blood Pressure. Aplikasi ini menghasilkan prediksi yang cepat, mudah diakses, serta berpotensi menjadi solusi praktis untuk mendukung upaya deteksi dini diabetes.
Copyrights © 2025