Abstrak - Penyakit jantung masih menjadi salah satu penyebab utama kematian di dunia, termasuk di Indonesia, sehingga deteksi dini terhadap faktor risikonya menjadi sangat penting untuk menekan angka kematian dan meningkatkan kualitas hidup pasien. Penelitian ini menerapkan algoritma XGBoost untuk membangun model prediksi risiko penyakit jantung menggunakan dataset cardio_train.csv dari Kaggle, yang berisi data kesehatan pasien meliputi usia, jenis kelamin, tekanan darah, kolesterol, serta variabel lain yang relevan. Tahapan penelitian meliputi pra-pemrosesan data, pelatihan model, evaluasi performa menggunakan metrik akurasi dan AUC, serta analisis feature importance. Hasil menunjukkan bahwa model XGBoost mampu mencapai precision sebesar 0,72, recall sebesar 0,77, F1-score sebesar 0,74, akurasi sebesar 73%, serta nilai AUC sebesar 0,795, yang menandakan kemampuan klasifikasi yang cukup baik. Fitur-fitur seperti tekanan darah sistolik (ap_hi), usia (age), dan kolesterol merupakan faktor dominan dalam proses prediksi. Dengan hasil ini, XGBoost dapat direkomendasikan sebagai metode dalam pengembangan sistem pendukung keputusan untuk deteksi dini penyakit jantung secara otomatis.
Copyrights © 2025