Diabetes merupakan penyakit kronis dengan prevalensi global yang terus meningkat, termasuk di Indonesia. Deteksi dini sangat penting untuk mencegah komplikasi serius yang terkait dengan kondisi ini. Seiring dengan kemajuan teknologi, pendekatan machine learning semakin banyak diterapkan dalam klasifikasi penyakit dan prediksi risiko. Penelitian ini bertujuan untuk membandingkan kinerja dua algoritma gradient boosting, yaitu XGBoost dan CatBoost, dalam mengklasifikasikan risiko diabetes berdasarkan data medis pasien. Dataset yang digunakan adalah Diabetes Dataset, yang terdiri dari delapan fitur medis dan satu label target. Penelitian ini mencakup proses pra-pemrosesan data, pelatihan model dengan pembagian data latih dan uji, serta evaluasi menggunakan metrik klasifikasi seperti akurasi, presisi, recall, dan F1-score. XGBoost dipilih karena efisiensinya dalam komputasi serta adanya regularisasi bawaan yang membantu mencegah overfitting pada data numerik berskala besar. Sementara itu, CatBoost digunakan karena kemampuannya dalam menangani fitur kategorikal secara langsung melalui teknik random permutation dan ordered boosting. Hasil dari penelitian ini diharapkan dapat berkontribusi pada pengembangan sistem prediksi diabetes yang lebih akurat dan efisien serta menjadi referensi dalam penerapan algoritma boosting di bidang medis.
Copyrights © 2025