"JAMASTIKA" Jurnal Mahasiswa Teknik Informatika
Vol. 4 No. 2 (2025): Volume 4 Nomor 2 Oktober 2025

Penerapan Algoritma Random Forest dan Teknik SMOTE untuk Prediksi Kematian Akibat Gagal Jantung Menggunakan RapidMiner

Islamiyatul Addewiyah (Unknown)
Zaehol Fatah (Unknown)



Article Info

Publish Date
30 Oct 2025

Abstract

Penelitian ini mengusulkan pengembangan model klasifikasi yang efektif untuk memprediksi risiko kematian akibat gagal jantung, memanfaatkan kombinasi algoritma Random Forest dan teknik Synthetic Minority Oversampling Technique (SMOTE). Penyakit gagal jantung merupakan penyebab utama morbiditas dan mortalitas global, dengan kemampuan prediksi yang akurat menjadi krusial untuk intervensi dini dan peningkatan prognosis pasien. Tantangan signifikan dalam pengembangan model prediktif di bidang medis adalah ketidakseimbangan kelas pada dataset, di mana jumlah kasus minoritas (misalnya, pasien meninggal) jauh lebih sedikit dibandingkan kelas mayoritas (pasien bertahan hidup), menyebabkan bias pada model. Untuk mengatasi ini, teknik SMOTE diterapkan untuk menyeimbangkan distribusi data dengan menghasilkan sampel sintetis dari kelas minoritas. Dataset yang digunakan berasal dari Kaggle, terdiri dari 299 data rekam medis pasien dengan 13 atribut klinis relevan. Proses penelitian meliputi tahapan preprocessing data, balancing data menggunakan SMOTE, pelatihan model menggunakan Random Forest, dan evaluasi komprehensif. Evaluasi kinerja model dilakukan menggunakan metrik-metrik standar seperti akurasi, presisi, recall, F1-score, dan Area Under the Receiver Operating Characteristic (AUC). Hasil eksperimen menunjukkan bahwa model yang dikembangkan mampu mencapai akurasi sebesar 84.60%, presisi 90.49%, recall 86.79%, dan nilai AUC sebesar 0.916. Nilai F1-score yang tinggi sebesar 88.59% lebih lanjut menegaskan keseimbangan yang baik antara presisi dan recall model. Temuan ini mengindikasikan bahwa kombinasi Random Forest dan SMOTE secara signifikan meningkatkan kemampuan prediksi kematian akibat gagal jantung, menawarkan alat yang berpotensi berharga bagi tenaga medis dalam mengidentifikasi pasien berisiko tinggi dan merencanakan strategi intervensi yang lebih optimal. Kata Kunci: classification, heart failure, random forest, rapidminer, smote.   This study proposes the development of an effective classification model to predict the risk of mortality from heart failure, utilizing a combination of the Random Forest algorithm and the Synthetic Minority Oversampling Technique (SMOTE). Heart failure is a leading cause of global morbidity and mortality, with accurate predictive capabilities being crucial for early intervention and improved patient prognosis. A significant challenge in developing predictive models in the medical field is class imbalance in datasets, where the number of minority cases (e.g., deceased patients) is significantly lower than the majority class (surviving patients), leading to model bias. To address this, the SMOTE technique is applied to balance the data distribution by generating synthetic samples from the minority class. The dataset used is from Kaggle, comprising 299 patient medical records with 13 relevant clinical attributes. The research process includes data preprocessing, data balancing using SMOTE, model training with Random Forest, and comprehensive evaluation. Model performance evaluation is conducted using standard metrics such as accuracy, precision, recall, F1-score, and Area Under the Receiver Operating Characteristic (AUC). Experimental results demonstrate that the developed model achieved an accuracy of 84.60%, precision of 90.49%, recall of 86.79%, and an AUC value of 0.916. A high F1-score of 88.59% further confirms a good balance between the model's precision and recall. These findings indicate that the combination of Random Forest and SMOTE significantly enhances the predictive capability for heart failure mortality, offering a potentially valuable tool for medical professionals in identifying high-risk patients and planning more optimal intervention strategies. Keyword: classification, heart failure, random forest, rapidminer, smote.

Copyrights © 2025






Journal Info

Abbrev

jamastika

Publisher

Subject

Computer Science & IT

Description

Terbit dua kali setahun pada bulan April dan Oktober berisi tulisan ilmiah tentang mahasiswa teknik informatika, tulisan yang dimuat berupa hasil penelitian dari mahasiswa Teknik ...