Penelitian ini menghadapi tantangan dalam memodelkan Indeks Kebahagiaan 2021 dari Badan Pusat Statistik (BPS) yang memiliki dimensi fitur sangat tinggi dan potensi redundansi, yang dapat menurunkan akurasi dan interpretabilitas model. Tujuan utama penelitian ini adalah untuk mengidentifikasi fitur-fitur paling berpengaruh dalam data tersebut untuk meningkatkan akurasi, efisiensi komputasi, dan transparansi model prediksi berbasis pohon keputusan. Metodologi mencakup pra-pemrosesan data dengan imputasi modus, transformasi Yeo-Johnson, dan Robust Scaler. Tiga algoritma regresi diuji: Decision Tree, Random Forest, dan Gradient Boosting Regressor, yang dioptimalkan menggunakan Particle Swarm Optimization (PSO). Model terbaik dievaluasi menggunakan metrik R², MSE, RMSE, dan MAE serta dianalisis lebih lanjut menggunakan SHAP untuk interpretasi. Hasil menunjukkan bahwa Gradient Boosting Regressor adalah model paling unggul dengan nilai R² sebesar 0,696 saat menggunakan 20 fitur terseleksi. Selain itu, sebagai bentuk implementasi praktis, model diimplementasikan ke dalam sebuah aplikasi web interaktif berbasis Flask yang memungkinkan pengguna memasukkan data melalui antarmuka kuisioner dan menerima prediksi indeks kebahagiaan secara real-time. Integrasi ini menjembatani hasil riset dengan pemanfaatan nyata oleh pengguna akhir.
Copyrights © 2025