Dalam penelitian ini, algoritma Random Forest dan XGBoost dibandingkan dalam klasifikasi penyakit paru-paru menggunakan data demografi pasien. Dataset yang digunakan terdiri dari 30.000 data pasien dengan 9 atribut dan 1 label yang diambil dari Kaggle. Tahapan penelitian termasuk pengumpulan data, Preprocessing, pembagian data, dan klasifikasi data menggunakan kedua algoritma. Hasil menunjukkan bahwa algoritma XGBoost memiliki akurasi 94% dan AUC 0.98, sedangkan algoritma Random Forest memiliki akurasi 91% dan AUC 0.97. Meskipun Random Forest lebih cepat dan lebih mudah diinterpretasikan, XGBoost bekerja lebih baik dengan data yang kompleks dengan hasil yang lebih konsisten. Melalui penggunaan teknik regularisasi dan penanganan outliers yang lebih baik, XGBoost juga dapat mengatasi masalah overfitting dengan lebih baik. Studi ini memberikan panduan untuk peneliti dan praktisi dalam memilih algoritma terbaik untuk tugas klasifikasi medis, terutama yang berkaitan dengan penyakit paru-paru.
Copyrights © 2024