Pemetaan kontribusi institusi pendidikan tinggi terhadap Sustainable Development Goals merupakan tantangan krusial untuk akuntabilitas global dan capaian World Class University. Meskipun model-model canggih rentan terhadap overfitting dan menuntut sumber daya komputasi besar pada data yang tidak seimbang, penelitian ini mengeksplorasi algoritma XGBoost sebagai solusi efisien untuk klasifikasi SDGs pada dokumen akademik universitas. Penelitian ini menggunakan dataset sebanyak 148136 dokumen, diproses dengan TF−IDF, dan dioptimasi dengan hyperparameter tuning serta class sample weighting untuk mitigasi imbalance. Hasil evaluasi menunjukkan model yang stabil dengan accuracy 0.92, precision 0.92, recall 0.89, dan F1−score 0.90 pada dataset uji. Meskipun kinerja agregat tinggi, analisis log loss dan confusion matrix mengindikasikan adanya overfitting lokal pada kategori minoritas, yang menyebabkan recall rendah di kelas-kelas tersebut. Secara keseluruhan, model XGBoost terbukti valid sebagai alat ukur efektif untuk memetakan kontribusi universitas terhadap SDGs, sekaligus memberikan panduan strategis berbasis data untuk mengidentifikasi celah dan mendorong keseimbangan capaian WCU
Copyrights © 2025