Pertumbuhan industri teknologi finansial (fintech) di Indonesia membawa risiko peningkatan kredit bermasalah atau non-performing loan. Penelitian ini bertujuan membandingkan performa dua algoritma machine learning, yaitu Random Forest dan XGBoost, dalam memprediksi keterlambatan pembayaran pinjaman online menggunakan dataset Lending Club dari Kaggle yang terdiri dengan 1.048.575 baris data. Kontribusi ilmiah penelitian ini terletak pada analisis komparatif penggunaan Class Weight dan SMOTE pada dataset skala besar serta penerapan threshold tuning untuk optimasi model. Hasil penelitian ini menunjukkan bahwa XGBoost yang dioptimalkan melalui GridSearchCV dan Threshold Tuning menghasilkan akurasi 78,87%% dan ROC-AUC 0,7211. Namun secara analitis, rendahnya nilai Recall (7,21%) pada XGBoost menunjukkan sifat model yang sangat konservatif. Sebaliknya, Random Forest dengan Class Weight menghasilkan F1-Score tertinggi (0,3673) dan lebih sensitif mendeteksi kasus gagal bayar. Penelitian ini menyimpulkan bahwa meskipun XGBoost unggul dalam presisi, Class Weight lebih efektif daripada SMOTE dalam mempertahankan integritas distribusi data asli untuk identifikasi Risiko.
Copyrights © 2026