Peningkatan prevalensi serangan jantung di Indonesia telah menjadi isu kesehatan publik yang signifikan karena penyakit ini konsisten termasuk penyebab kematian tertinggi secara nasional. Meskipun berbagai studi epidemiologis telah mengidentifikasi faktor risiko klinis maupun perilaku, pendekatan berbasis data untuk prediksi individual masih relatif terbatas, terutama pada konteks populasi Indonesia dengan karakteristik heterogen. Untuk menjawab kesenjangan tersebut, penelitian ini mengembangkan model prediktif serangan jantung menggunakan algoritma Light Gradient Boosting Machine (LightGBM) yang dikenal efisien pada data berukuran besar. Dataset terdiri dari 158.355 observasi dan 28 fitur demografis, gaya hidup, dan indikator medis. Prosedur prapemrosesan mencakup imputasi nilai hilang, pengkodean variabel kategorikal, seleksi fitur menggunakan Principal Component Analysis (PCA), serta penyeimbangan distribusi kelas melalui Synthetic Minority Over-Sampling Technique (SMOTE). Kinerja prediksi dievaluasi menggunakan metrik klasifikasi standar, di mana LightGBM mencapai akurasi 83,39% (train) dan 77,92% (test); presisi 85,67% dan 79,38%; recall 80,19% dan 75,44%; F1-score 82,84% dan 77,36%; serta AUC-ROC 91,84% dan 87,37%. Analisis komponen utama menunjukkan kontribusi varians yang tinggi pada fitur terkait pola konsumsi, penggunaan obat, stres, dan hipertensi. Hasil ini mengindikasikan bahwa LightGBM merupakan pendekatan yang menjanjikan untuk mendukung deteksi risiko serangan jantung secara lebih awal dan berpotensi meningkatkan strategi mitigasi penyakit kardiovaskular di Indonesia.
Copyrights © 2025