Prediksi gagal bayar dalam bisnis P2P lending sangat penting sebagai bagian manajemen risiko, namun pada prakteknya sering dihadapkan pada tantangan data berdimensi tinggi, ketidakseimbangan kelas, dan kebutuhan interpretasi model black box. Salah satu tantangan utama adalah dilema pemilihan fitur, apakah menggunakan metode Explainable AI (XAI) seperti SHAP yang akurat secara teoritis namun membutuhkan resource komputasi lebih, atau menggunakan metode gain bawaan model seperti LightGBM yang jauh lebih efisien. Penelitian ini bertujuan untuk menentukan secara empiris apakah resource komputasi SHAP memberikan keunggulan kinerja yang signifikan dibandingkan metode gain LightGBM untuk tugas global feature ranking dalam prediksi gagal bayar. Penelitian menggunakan dataset Lending Club, metodologi penelitian membandingkan peringkat fitur dari kedua metode melalui skema forward feature selection iteratif. Pendekatan ini diuji pada data asli dan data yang diseimbangkan menggunakan teknik oversampling ADASYN. Hasil penelitian menunjukkan dua temuan utama. Pertama, ADASYN efektif meningkatkan recall (metrik utama) sekitar 10%. Kedua, kinerja prediktif model yang dihasilkan dari peringkat fitur berbasis gain LightGBM dan berbasis SHAP adalah identik secara statistik, dengan deviasi metrik di bawah 0.6%. Kinerja optimal juga tercapai hanya dengan 15-20 fitur teratas. Kesimpulannya, resource komputasi SHAP tidak dapat dibenarkan untuk tugas global feature ranking dalam skenario ini. Metode gain bawaan LightGBM terbukti memadai dan efisien, berkontribusi pada pengembangan model yang lebih sederhana tanpa mengorbankan daya prediksi
Copyrights © 2025