Stroke merupakan salah satu penyebab utama kematian dan kecacatan di dunia, sehingga diperlukan metode klasifikasi yang andal untuk mendukung deteksi dini dan pengambilan keputusan medis. Penelitian ini bertujuan untuk mengevaluasi kinerja algoritma Naive Bayes dalam klasifikasi penyakit stroke serta menganalisis dampak ketidakseimbangan data terhadap performa model. Metode penelitian yang digunakan adalah pendekatan kuantitatif dengan eksperimen komputasional menggunakan algoritma Naive Bayes. Dataset yang digunakan merupakan healthcare stroke dataset yang tersedia secara publik, terdiri dari 5.110 instance dengan delapan atribut, yaitu gender, hypertension, heart_disease, ever_married, work_type, residence_type, smoking_status, dan stroke sebagai variabel target. Proses eksperimen dilakukan menggunakan WEKA Explorer dengan dua skema evaluasi, yaitu percentage split (66%) dan 10-fold cross-validation. Hasil penelitian menunjukkan bahwa model Naive Bayes menghasilkan akurasi keseluruhan yang tinggi, yaitu di atas 94%, pada kedua skema evaluasi. Namun, performa model dalam mendeteksi kasus stroke sangat rendah, yang ditunjukkan oleh nilai true positive rate (TPR) yang kecil pada kelas stroke. Masalah utama yang ditemukan adalah ketidakseimbangan kelas yang signifikan dalam dataset, di mana kasus stroke hanya mencakup sekitar 5% dari total data. Kondisi ini menyebabkan model menjadi bias terhadap kelas mayoritas (non-stroke) dan gagal mengenali sebagian besar kasus stroke yang sebenarnya. Sebagai rekomendasi, penelitian selanjutnya disarankan untuk menerapkan teknik penanganan data tidak seimbang, seperti resampling (misalnya SMOTE), penyesuaian bobot kelas, atau penggunaan algoritma klasifikasi alternatif yang lebih robust terhadap data imbalanced, agar sensitivitas deteksi kasus stroke dapat ditingkatkan.
Copyrights © 2025