Jurnal Ilmiah KOMPUTASI
Vol. 23 No. 1 (2024): Jurnal Ilmiah Komputasi : Vol. 23 No 1, Maret 2024

Implementasi Data Mining Dalam Melakukan Prediksi Penyakit Diabetes Menggunakan Metode Random Forest Dan Xgboost

Salsabil, Muhammad (Unknown)
Azizah, Nuril Lutvi (Unknown)
Eviyanti, Ade (Unknown)



Article Info

Publish Date
12 Mar 2024

Abstract

Penyakit diabetes telah menjadi isu global dalam bidang kesehatan. Penelitian ini berfokus pada implementasi dua teknik data mining yaitu Random Forest dan XGBoost untuk memproyeksikan perkembangan penyakit diabetes. Kedua metode ini memanfaatkan dataset klinis dan biokimia yang terkait dengan diabetes. Setelah fase preprocessing, dilakukan evaluasi performa menggunakan metrik evaluasi seperti akurasi, presisi, recall dan f1 score. Dataset yang digunakan sebanyak 768 entri dan 9 indikator yang diperoleh dari platform Kaggle. Dalam Penelitian ini data diolah melalui tahap preprocessing diantaranya handling missing value, handling outlier dan normalisasi data, dan didapatkan data yang akan diolah sebesar 688. Setelah didapat data hasil preprocessing, dilakukan tahapan pelatihan dan pengujian dengan Cross Validation dan dilakukan pengujian untuk mengetahui parameter-parameter terbaik yang akan digunakan, lalu dilakukan evaluasi kinerja model Random Forest dan XGBoost menggunakan metrik akurasi, presisi, recall, dan F1-score. Hasil evaluasi model menunjukkan performa yang baik dalam penelitian ini, didapatkan hasil akurasi keseluruhan dalam penggunaan random forest sebesar 74% dan penggunaan XGBoost sebesar 76%.Penyakit diabetes telah menjadi isu global dalam bidang kesehatan. Penelitian ini berfokus pada implementasi dua teknik data mining yaitu Random Forest dan XGBoost untuk memproyeksikan perkembangan penyakit diabetes. Kedua metode ini memanfaatkan dataset klinis dan biokimia yang terkait dengan diabetes. Setelah fase preprocessing, dilakukan evaluasi performa menggunakan metrik evaluasi seperti akurasi, presisi, recall dan f1 score. Dataset yang digunakan sebanyak 768 entri dan 9 indikator yang diperoleh dari platform Kaggle. Dalam Penelitian ini data diolah melalui tahap preprocessing diantaranya handling missing value, handling outlier dan normalisasi data, dan didapatkan data yang akan diolah sebesar 688. Setelah didapat data hasil preprocessing, dilakukan tahapan pelatihan dan pengujian dengan Cross Validation dan dilakukan pengujian untuk mengetahui parameter-parameter terbaik yang akan digunakan, lalu dilakukan evaluasi kinerja model Random Forest dan XGBoost menggunakan metrik akurasi, presisi, recall, dan F1-score. Hasil evaluasi model menunjukkan performa yang baik dalam penelitian ini, didapatkan hasil akurasi keseluruhan dalam penggunaan random forest sebesar 74% dan penggunaan XGBoost sebesar 76%.

Copyrights © 2024






Journal Info

Abbrev

komputasi

Publisher

Subject

Computer Science & IT

Description

Jurnal Ilmiah Komputasi ISSN : 1412-9434 adalah jurnal ilmiah di bidang Komputer dan Komunikasi yang memuat tulisan-tulisan ilmiah mengenai penelitian-penelitian di bidang: perangkat keras, perangkat lunak, komputasi, jaringan komputer dan komunikasi data. Jurnal terbit empat kali dalam setahun ...