Diabetes Mellitus merupakan masalah kesehatan di dunia yang sangat signifikan maka dari itu dibutuhkan prediksi dini dan akurat. Penelitian ini bertujuan untuk mengoptimalkan prediksi dengan membandingkan model Machine Learning (ML) dengan Random Forest dan Support Vector Machine, yang ditingkatkan dengan analisis SHAP (SHapley Additive exPlanations) untuk mencari fitur tertinggi atau berpengaruh. Penelitian ini menggunakan dataset yang terdiri dari 1000 data pasien dengan 14 fitur, dan 1 kelas. Preprocessing melibatkan pembersihan data dan duplicate, dilanjutkan dengan testing dan training data, dan hasil pengujian dengan model Random Forest mendapatkan akurasi 99%, sementara SVM mencapai 86%, lalu pengujian analisis SHAP mengungkapkan bahwa Age, Urea dan Kreatinin adalah fitur yang paling berpengaruh dari fitur yang lainnya. Hasil analisis perbandingan menunjukkan bahwa mengungguli dalam hal akurasi prediksi secara keseluruhan, dan ini sangat berkontribusi pada peningkatan metode prediksi yang optimal dan sebagai parameter klinis utama untuk diagnosis.
Copyrights © 2025