PM2.5 menjadi salah satu indikator penting dalam menilai kualitas udara di wilayah perkotaan karena sensitif terhadap aktivitas transportasi, industri, serta dinamika pertumbuhan penduduk. Penelitian ini bertujuan untuk memetakan pola PM2.5 di Jakarta dan Tangerang serta membangun model prediksi berbasis machine learning. Data Jakarta (2021–2025) dan Tangerang (2020–2023) melalui proses pembersihan, imputasi nilai hilang, normalisasi, dan penyelarasan struktur. Rekayasa fitur diterapkan untuk memperkuat karakteristik temporal sebelum model Random Forest dan Gradient Boosting dilatih dengan rasio 80:20. Evaluasi menggunakan R², RMSE, dan MAE menunjukkan bahwa konsentrasi PM2.5 di Jakarta cenderung lebih tinggi dan berfluktuasi. Gradient Boosting memperoleh performa paling konsisten, sedangkan analisis feature importance mengidentifikasi PM10 dan NO₂ sebagai variabel paling berpengaruh. Temuan ini menegaskan bahwa pendekatan machine learning mampu meningkatkan efektivitas pemantauan kualitas udara dan mendukung strategi pengendalian polusi yang berbasis data.
Copyrights © 2025