Infotech: Jurnal Informatika & Teknologi
Vol 6 No 2 (2025): INFOTECH: Jurnal Informatika & Teknologi

Pengaruh ketidakseimbangan data terhadap kinerja Algoritma Naive Bayes dalam klasifikasi stroke

Muhammad Azis Sularso (Universitas Pamulang, Jl. Raya Puspitek, Tangerang Selatan 15310, Indonesia)
Jupron Jupron (Universitas Pamulang)



Article Info

Publish Date
31 Dec 2025

Abstract

Stroke merupakan salah satu penyebab utama kematian dan kecacatan di dunia, sehingga diperlukan metode klasifikasi yang andal untuk mendukung deteksi dini dan pengambilan keputusan medis. Penelitian ini bertujuan untuk mengevaluasi kinerja algoritma Naive Bayes dalam klasifikasi penyakit stroke serta menganalisis dampak ketidakseimbangan data terhadap performa model. Metode penelitian yang digunakan adalah pendekatan kuantitatif dengan eksperimen komputasional menggunakan algoritma Naive Bayes. Dataset yang digunakan merupakan healthcare stroke dataset yang tersedia secara publik, terdiri dari 5.110 instance dengan delapan atribut, yaitu gender, hypertension, heart_disease, ever_married, work_type, residence_type, smoking_status, dan stroke sebagai variabel target. Proses eksperimen dilakukan menggunakan WEKA Explorer dengan dua skema evaluasi, yaitu percentage split (66%) dan 10-fold cross-validation. Hasil penelitian menunjukkan bahwa model Naive Bayes menghasilkan akurasi keseluruhan yang tinggi, yaitu di atas 94%, pada kedua skema evaluasi. Namun, performa model dalam mendeteksi kasus stroke sangat rendah, yang ditunjukkan oleh nilai true positive rate (TPR) yang kecil pada kelas stroke. Masalah utama yang ditemukan adalah ketidakseimbangan kelas yang signifikan dalam dataset, di mana kasus stroke hanya mencakup sekitar 5% dari total data. Kondisi ini menyebabkan model menjadi bias terhadap kelas mayoritas (non-stroke) dan gagal mengenali sebagian besar kasus stroke yang sebenarnya. Sebagai rekomendasi, penelitian selanjutnya disarankan untuk menerapkan teknik penanganan data tidak seimbang, seperti resampling (misalnya SMOTE), penyesuaian bobot kelas, atau penggunaan algoritma klasifikasi alternatif yang lebih robust terhadap data imbalanced, agar sensitivitas deteksi kasus stroke dapat ditingkatkan.

Copyrights © 2025






Journal Info

Abbrev

infotech

Publisher

Subject

Computer Science & IT Control & Systems Engineering Energy Engineering Industrial & Manufacturing Engineering

Description

e-commerce, e-learning, e-manufacturing, e-government, IT Government, IT Management, Supply Chain Management & ERP, Business Process Management, Robotic system, Smarts Sensor Networks, Intelligent Transportasi System, Smarts Villages, Smarts City, Smarts Cloud Technology, Software Engineering, Data ...