Stroke menjadi salah satu penyakit serius di seluruh dunia dengan dampak fatal yang menyebabkan kecacatan fisik serta mental. Deteksi dan prediksi dini stroke penting untuk mencegah dampak buruk pada kesehatan pasien. Dalam upaya meningkatkan kualitas prediksi dan deteksi stroke, penelitian ini berfokus pada analisis dan pemodelan prediktif menggunakan teknik Exploratory Data Analysis (EDA) dan algoritma klasifikasi, khususnya Support Vector Machine (SVM) dan Random Forest Classifier (RFC). Melalui EDA (Exploratory Data Analysis), kita bisa mendapatkan pemahaman yang lebih mendalam tentang faktor risiko dan indikator potensial yang terkait dengan stroke. Hasil yang didapat menunjukkan bahwa melalui analisis korelasi, ditemukan usia (umur) memiliki korelasi positif yang kuat dengan kejadian stroke, menunjukkan semakin tua usia seseorang, semakin tinggi risiko terkena stroke dalam dataset ini. Model RFC memiliki performa lebih baik dengan akurasi 91% dibandingkan SVM dengan akurasi 90% pada data uji setelah penyetelan hiperparameter. Kedua model efektif dalam mengidentifikasi risiko stroke. Dalam perbandingan ROC-AUC, keduanya menunjukkan kinerja yang sangat baik, SVM memiliki hasil 0.901 dan RFC memiliki hasil 0.910.
Copyrights © 2023