Beberapa dekade terakhir, isu kualitas udara menjadi masalah di kota-kota besar di dunia, terutama Daerah Khusus Jakarta. Penelitian ini membandingkan performa dari tiga tree-based model random forest (RF), extra trees (ET), dan gradient boosting classifier (GBC) dalam memprediksi kualitas udara di Daerah Khusus Jakarta dengan mengguankan data Automatic Weather Station BMKG dan ISPU Daerah Khusus Jakarta selama 2018 – 2021. Penelitian ini bertujuan untuk menentukan pemodelan terbaik serta mencari faktor terpenting yang memengaruhi kualitas udara di Daerah Khusus Jakarta berdasarkan nilai accuracy, precision, recall, f1-score, confusion metrics, dan (receiver operating characterist) ROC/AUC serta pengujian terhadap parameter menggunakan feature importance plot. Berdasarkan feature importance plot dari ketiga model tersebut menunjukan bahwa parameter IPSU O3 merupakan parameter yang sangat memengaruhi kualitas udara, serta arah dan kecepatan angin merupakan faktor meteorologis yang paling memengaruhi kualitas udara. Berdasarkan pengujian keakuratan model tersebut menujukan nilai yang hampir sama antara ketiga tree-based model tersebut dengan nilai accuracy 0.8646 – 0.8821, precision 0.8755 – 0.8870, recall 0.8646 – 0.8821, f1-score 0.8674 – 0.8816 serta AUC 0.9286 – 0.9441. Berdasarkan ketiga tree-based model tersebut, model random forest (RF) menunjukan kemapuan terbaik dibandingkan dengan dua model lainnya dengan nilai accuracy 0.8821, precision 0.8870, recall 0.8821, f1-score 0.8816, dan AUC 0.9425.
Copyrights © 2025