Claim Missing Document
Check
Articles

Found 1 Documents
Search

Penerapan Random Forest Untuk Klasifikasi Risiko Penyakit Stroke Pada Rentang Usia 40-85 Tahun adjie; Muhammad Aimar Al Baihaqi; Adam Surya Dharma; Ivan Variz Febrinanda; Danurtirto Satria Prananda
JUKOMIKA (Jurnal Ilmu Komputer dan Informatika) Vol. 8 No. 2 (2025): Desember
Publisher : LPPMPP Yayasan Sejahtera Bersama Bengkulu

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.54650/jukomika.v8i2.617

Abstract

Stroke merupakan penyebab kematian dan kecacatan tertinggi ketiga di dunia dengan risiko yang meningkat tajam pada usia 40 tahun ke atas. Sebagian besar penelitian sebelumnya pada dataset Stroke Prediction (Kaggle) melaporkan akurasi tinggi namun tidak membahas dampak ketidakseimbangan kelas yang sangat ekstrem (rasio ~1:19) dan jarang memfokuskan analisis pada rentang usia risiko tinggi. Penelitian ini menerapkan algoritma Random Forest untuk klasifikasi risiko stroke khusus pada individu berusia 40–85 tahun menggunakan dataset sebanyak 2.875 data setelah filtering usia. Dataset memiliki ketidakseimbangan kelas tinggi (stroke 8.42%, non-stroke 91.58%). Tahapan preprocessing meliputi pemeriksaan missing value dan duplicate data (tidak ditemukan) serta standarisasi fitur numerik menggunakan Z-Score Standardization (mean = 0, std = 1). Model dievaluasi dengan 10-Fold Stratified Cross Validation pada perangkat lunak Orange Data Mining. Hasil menunjukkan Random Forest mencapai akurasi 96,5%, AUC 0,914 (kelas stroke), precision 96,3%, recall 96,5%, F1-score 96,2%, dan MCC 0,750. Analisis feature importance mengidentifikasi usia, kadar glukosa rata-rata, dan BMI sebagai tiga prediktor terkuat. Dibandingkan dengan Logistic Regression, Decision Tree, SVM, dan Naive Bayes, Random Forest menunjukkan performa paling unggul. Penelitian ini memberikan kontribusi berupa model klasifikasi yang andal dan interpretabel pada populasi usia 40–85 tahun serta rekomendasi klinis berbasis variabel paling berpengaruh.