Stroke merupakan salah satu penyebab utama kematian dan kecacatan di berbagai negara, sehingga diperlukan metode prediksi risiko yang akurat berbasis data klinis. Namun, penelitian sebelumnya umumnya masih menghadapi permasalahan ketidakseimbangan data serta kurang memberikan interpretasi terhadap faktor klinis yang berpengaruh. Penelitian ini mengembangkan model prediksi risiko stroke dengan mengatasi ketidakseimbangan data serta meningkatkan interpretabilitas model. Dataset yang digunakan terdiri dari 5.110 data pasien dengan distribusi kelas yang tidak seimbang. Untuk mengatasi permasalahan tersebut, diterapkan metode SMOTEENN dan algoritma Balanced Random Forest, serta analisis menggunakan pendekatan Explainable Artificial Intelligence (XAI). Hasil evaluasi menunjukkan bahwa model memiliki kinerja yang cukup baik dengan nilai accuracy sebesar 79,26% dan ROC-AUC sebesar 82,01%. Namun, nilai precision yang relatif rendah (15,68%) menunjukkan masih terdapat prediksi positif yang tidak tepat, sebagai konsekuensi dari peningkatan recall sebesar 74% dalam mendeteksi kasus stroke sebagai kelas minoritas. Analisis SHAP menunjukkan bahwa usia, kadar glukosa, hipertensi, dan indeks massa tubuh merupakan faktor utama dalam prediksi risiko stroke. Penelitian ini memberikan kontribusi dalam meningkatkan deteksi kasus stroke serta menyediakan interpretasi model yang lebih transparan
Copyrights © 2026