Journal of Electronics and Instrumentation
Vol. 2 No. 3 (2025)

Perbandingan Algoritma Logistic Regression Dan K-Nearest Neighbors Dalam Klasifikasi Kualitas Udara Berdasarkan Data Sekunder Kaggle

Mila Hidayatul Aula (Unknown)



Article Info

Publish Date
13 May 2026

Abstract

Polusi udara merupakan salah satu isu lingkungan utama yang berdampak langsung pada kesehatan manusia. Oleh karena itu, klasifikasi kualitas udara menjadi hal penting untuk mendukung sistem peringatan dini. Penelitian ini bertujuan membandingkan kinerja dua algoritma machine learning, yaitu Logistic Regression (LR) dan K-Nearest Neighbors (KNN), dalam mengklasifikasikan kualitas udara dengan target empat kelas, yaitu Baik, Sedang, Buruk, dan Berbahaya. Variabel data yang digunakan merupakan sembilan parameter, seperti suhu, kelembaban, konsentrasi PM2.5, konsentrasi PM10, konsentrasi NO2, konsentrasi SO2, konsentrasi CO, jarak dengan kawasan Industri, dan kepadatan penduduk. Data yang digunakan terdiri dari 5000 sampel yang telah melalui proses normalisasi dan penyeimbangan kelas menggunakan SMOTE. Evaluasi model dilakukan menggunakan confusion matrix, akurasi, precision, recall, dan F1-score, serta cross validation 5-fold dan uji paired t-test. Hasil menunjukkan bahwa LR unggul dibandingkan KNN dengan akurasi 94,33% dan F1-score macro 0,92. Uji t menunjukkan perbedaan performa signifikan (p<0,05). Berdasarkan hasil ini, algoritma Logistic Regression direkomendasikan sebagai metode klasifikasi yang lebih efektif dalam studi kualitas udara.

Copyrights © 2025






Journal Info

Abbrev

JEI

Publisher

Subject

Computer Science & IT Control & Systems Engineering Electrical & Electronics Engineering Engineering Physics

Description

Artikel JEI ditekankan pada aplikasi Elektronika dan Instrumentasi diberbagai bidang ilmu sains dan teknologi, seperti Fisika Material, Fisika Nuklir, Geofisika, Biofisika, Biologi, Kimia, Elektronika, Geografi, Fisika Kebumian, Fisika Kelautan, Fisika Lingkungan, Astronomi, dan ilmu science ...