Penelitian ini bertujuan untuk mengevaluasi kualitas udara serta tingkat polusi menggunakan algoritma Gaussian Naive Bayes sebagai metode klasifikasi. Algoritma ini didasarkan pada Teorema Bayes dengan asumsi bahwa setiap variabel fitur saling independen. Data yang digunakan berupa dataset kualitas udara yang telah di kelompokkan ke dalam beberapa kategori. Evaluasi model dilakukan menggunakan metrik akurasi, precision, recall, f1-score, dan confusion matrix. Hasil pengujian memperlihatkan bahwa model mampu memperoleh akurasi 93% pada data uji. Kategori “Good” menunjukkan performa terbaik dengan nilai precision, recall, dan f1-score mendekati 1.00. Kategori “Moderate” juga menampilkan hasil konsisten dengan precision dan recall sekitar 0.94. Sementara itu, kategori “Hazardous” memiliki precision 0.88, sedangkan kategori “Poor” memperoleh precision terendah, yaitu 0.79, karena sering tertukar dengan kelas lain. Meski begitu, recall dan f1-score kategori “Poor” tetap berada pada tingkat yang cukup baik. Confusion matrix menunjukkan bahwa sebagian besar prediksi berada pada klasifikasi yang tepat. Selain itu, hasil klasterisasi menggunakan K-Means mengindikasikan bahwa nilai k optimal adalah 4 sesuai dengan titik elbow, yang konsisten dengan jumlah kategori kualitas udara dalam penelitian ini.
Copyrights © 2025