Penyakit kardiovaskular merupakan salah satu penyebab utama kematian global, sehingga deteksi dini melalui sistem prediksi yang andal sangat krusial untuk memungkinkan intervensi medis yang tepat waktu dan efektif. Penelitian ini bertujuan untuk meningkatkan akurasi prediksi risiko penyakit jantung dengan mengoptimalkan model Extreme Gradient Boosting (XGBoost) melalui penyetelan hiperparameter yang sistematis. Pendekatan yang digunakan menggabungkan GridSearchCV dengan validasi silang 5-fold untuk menjelajahi ruang parameter secara komprehensif, dengan fokus pada optimasi metrik ROC AUC pada dataset medis berukuran besar (70.000 sampel). Hasil menunjukkan bahwa model yang telah dioptimalkan mencapai performa tinggi (Akurasi: 0,9930; ROC AUC: 0,9997). Meskipun perbedaan numerik terhadap model baseline (Akurasi: 0,9926; ROC AUC: 0,9996) relatif kecil, secara klinis perbaikan ini bermakna signifikan—terutama karena mengurangi jumlah false negatives sebanyak 1,2 kasus, yang berpotensi menyelamatkan nyawa melalui deteksi dini yang lebih akurat. Analisis feature importance mengidentifikasi tekanan darah tinggi, usia, dan diabetes sebagai prediktor utama risiko penyakit jantung. Temuan ini menegaskan bahwa pendekatan penyetelan hiperparameter yang terstruktur dapat memberikan dampak material dalam konteks prediksi medis berbasis data tabular. Penelitian ini memberikan kontribusi pada bidang data mining medis dengan menunjukkan efektivitas hyperparameter tuning untuk meningkatkan sistem prediksi penyakit kardiovaskular.
Copyrights © 2025