Diabetes mellitus merupakan penyakit kronis yang prevalensinya terus meningkat dan menjadi masalah kesehatan serius di berbagai negara, termasuk Indonesia. Salah satu tantangan utama dalam pengembangan model prediksi risiko diabetes adalah ketidakseimbangan data, di mana jumlah sampel kelas minoritas (penderita diabetes) jauh lebih sedikit dibandingkan kelas mayoritas (bukan penderita diabetes). Penelitian ini bertujuan untuk mengatasi masalah ketidakseimbangan data dengan mengintegrasikan metode AdaBoost dan teknik oversampling SMOTE untuk membangun model prediksi risiko diabetes yang akurat dan andal. Metode AdaBoost dipilih karena kemampuannya dalam meningkatkan akurasi prediksi melalui perbaikan kesalahan secara iteratif, sedangkan SMOTE digunakan untuk meningkatkan representasi kelas minoritas dengan menghasilkan data sintetis. Hasil penelitian menunjukkan bahwa model AdaBoost tanpa SMOTE memiliki akurasi sebesar 81,87% dan nilai ROC-AUC sebesar 0,9031, tetapi performanya cenderung lebih tinggi pada kelas mayoritas dibandingkan kelas minoritas. Setelah menerapkan AdaBoost dengan SMOTE, performa model pada kelas minoritas meningkat signifikan, dengan precision, recall, dan F1-score yang lebih seimbang antara kedua kelas. Akurasi keseluruhan model meningkat menjadi 82,83%, dan nilai ROC-AUC menjadi 0,9058. Kombinasi AdaBoost dan SMOTE terbukti efektif dalam menangani ketidakseimbangan data, memberikan prediksi yang lebih seimbang antara kelas mayoritas dan minoritas. Penelitian ini berkontribusi dalam pengembangan pendekatan prediktif berbasis machine learning untuk mendukung upaya preventif di bidang kesehatan.
Copyrights © 2025