Stunting merupakan permasalahan kesehatan masyarakat yang serius di Indonesia. Penelitian ini merupakan studi metodologis yang bertujuan mengevaluasi efektivitas Bayesian Optimization (BO) dalam mengoptimasi hyperparameter algoritma Extreme Gradient Boosting (XGBoost) untuk klasifikasi risiko stunting. Karena keterbatasan akses microdata individu dari SSGI dan SDKI, penelitian ini menggunakan dataset simulasi yang dikonstruksi berdasarkan distribusi statistik agregat resmi Kementerian Kesehatan dan Badan Pusat Statistik. Dataset terdiri atas 12.847 record dengan 14 fitur prediktor. Tahapan penelitian meliputi pembentukan dataset simulasi, pra-pemrosesan, seleksi fitur dengan mutual information, penanganan imbalanced class dengan SMOTE, dan optimasi hyperparameter melalui 50 iterasi BO menggunakan library Optuna. Model dibandingkan dengan Logistic Regression, Random Forest, SVM, XGBoost default, XGBoost-Grid Search, dan XGBoost-Random Search. Hasil eksperimen menunjukkan XGBoost-BO mencapai accuracy 91,8%, F1-score 90,4%, dan AUC-ROC 95,3%, mengungguli seluruh model pembanding (p < 0,05). BO meningkatkan F1-score 5,7 poin persentase dibandingkan XGBoost default dengan efisiensi komputasi 34 kali lebih baik dari Grid Search. Analisis SHAP mengidentifikasi berat badan lahir, tinggi badan ibu, dan pendapatan keluarga per kapita sebagai faktor dominan. Hasil studi ini menjadi landasan metodologis untuk validasi pada data riil setelah perizinan akses diperoleh.
Copyrights © 2026