Jurnal Pustaka AI : Pusat Akses Kajian Teknologi Artificial Intelligence
Vol 6 No 1 (2026): Pustaka AI (Pusat Akses Kajian Teknologi Artificial Intelligence)

Evaluasi dan Interpretabilitas Model Machine learning untuk Prediksi Diabetes dengan Nested cross-validation dan SHAP

Tri Armawan, Errie (Unknown)
Safitri, Riana (Unknown)
Riyandari, Lutvi (Unknown)



Article Info

Publish Date
30 Apr 2026

Abstract

Penelitian ini mengevaluasi dan membandingkan kinerja tiga algoritma machine learning Logistic Regression, Random Forest, dan XGBoost untuk prediksi diabetes menggunakan nested cross-validation (5-fold outer, 3-fold inner) dengan pipeline preprocessing terintegrasi untuk mencegah data leakage. Dataset yang digunakan adalah Pima Indians Diabetes Dataset (n = 768). Uji Friedman (p = 0,819) mengonfirmasi bahwa ketiga model tidak berbeda secara statistik, sehingga Logistic Regression dipilih berdasarkan prinsip parsimoni dengan stabilitas tertinggi (AUC-ROC 72,3% ± 1,6% pada nested cross-validation) dan precision 74,8% ± 6,8%. Pada data uji independen, model mencapai akurasi 69,5%, AUC-ROC 81,4%, dan PR-AUC 65,9%. Analisis SHAP mengidentifikasi Glucose, BMI, dan DiabetesPedigreeFunction sebagai tiga prediktor teratas, yang selaras dengan kriteria diagnostik dan faktor risiko dalam pedoman American Diabetes Association dan World Health Organization. Kesesuaian ini membuktikan bahwa model mempelajari pola yang bermakna secara klinis, bukan sekadar korelasi statistik.

Copyrights © 2026






Journal Info

Abbrev

pustakaai

Publisher

Subject

Computer Science & IT Control & Systems Engineering Decision Sciences, Operations Research & Management Electrical & Electronics Engineering Mathematics

Description

Jurnal Pustaka AI adalah sebuah jurnal Double blind peer-review yang didedikasikan untuk publikasi hasil Penelitian yang berkualitas khusus bidang ilmu Teknologi Artificial Intelligence . Semua publikasi di Jurnal Pustaka AI bersifat akses terbuka yang memungkinkan artikel tersedia secara bebas ...