Jurnal Ilmu Teknik dan Komputer
Vol. 10 No. 1 (2026)

Analisa Perbandingan Model Machine Learning Untuk Prediksi Dampak Kesehatan Dari Kualitas Udara

Zakha Aditya Hadinsyah (University of Jember)
Ahnaf Alvarez Sutrisno (University of Jember)
Devies Ade Irawan (University of Jember)



Article Info

Publish Date
31 Jan 2026

Abstract

Polusi udara masih menjadi salah satu permasalahan kesehatan masyarakat yang paling serius di tingkat global, karena paparan jangka panjang terhadap polutan berbahaya dapat meningkatkan risiko penyakit pernapasan, gangguan kardiovaskular, serta angka rawat inap. Penelitian ini bertujuan untuk membandingkan kinerja prediktif dua model machine learning berbasis ensemble, yaitu Random Forest dan Extreme Gradient Boosting (XGBoost), dalam mengklasifikasikan tingkat dampak kesehatan berdasarkan indikator kualitas udara. Penelitian ini menggunakan Air Quality and Health Impact Dataset yang diperoleh dari Kaggle dan menerapkan tahapan metodologi yang sistematis, meliputi analisis data eksploratif, prapemrosesan data, penskalaan fitur, penanganan ketidakseimbangan kelas menggunakan stratified sampling dan metode Synthetic Minority Over-sampling Technique (SMOTE), pembangunan model baseline, serta optimasi hiperparameter menggunakan RandomizedSearchCV. Dataset mencakup konsentrasi polutan udara (PM2.5, PM10, NO₂, SO₂, dan O₃), variabel meteorologi, serta indikator kesehatan harian. Hasil eksperimen menunjukkan bahwa kedua model mampu mempelajari pola hubungan antara paparan polusi udara dan risiko kesehatan masyarakat, namun XGBoost secara konsisten menunjukkan performa yang lebih unggul dibandingkan Random Forest. Setelah proses tuning, model XGBoost mencapai tingkat akurasi sebesar 0,9003 dengan nilai F1-score tertimbang sebesar 0,8902. Analisis feature importance menunjukkan bahwa indeks kualitas udara, partikulat PM2.5 dan PM10, konsentrasi ozon, serta jumlah rawat inap merupakan faktor yang paling berpengaruh dalam proses klasifikasi. Secara keseluruhan, hasil penelitian ini menegaskan bahwa Extreme Gradient Boosting merupakan pendekatan yang andal dan efektif untuk memprediksi dampak kesehatan akibat kualitas udara, serta memiliki potensi besar untuk mendukung pengembangan sistem peringatan dini dan kebijakan kesehatan lingkungan berbasis data.

Copyrights © 2026






Journal Info

Abbrev

jitkom

Publisher

Subject

Civil Engineering, Building, Construction & Architecture Computer Science & IT Control & Systems Engineering Electrical & Electronics Engineering Industrial & Manufacturing Engineering

Description

Ilmu Teknik Ilmu komputer komputasi mekanik control dan system engineering industrial dan manufacturing engineer civil engineer, building, construction dan architecture electrical dan electronics ...