Claim Missing Document
Check
Articles

Found 1 Documents
Search

Perbandingan Algoritma Logistic Regression Dan K-Nearest Neighbors Dalam Klasifikasi Kualitas Udara Berdasarkan Data Sekunder Kaggle Mila Hidayatul Aula
Journal of Electronics and Instrumentation Vol. 2 No. 3 (2025)
Publisher : Jurusan Fisika, FMIPA Universitas Jember

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.19184/jei.v2i3.60009

Abstract

Polusi udara merupakan salah satu isu lingkungan utama yang berdampak langsung pada kesehatan manusia. Oleh karena itu, klasifikasi kualitas udara menjadi hal penting untuk mendukung sistem peringatan dini. Penelitian ini bertujuan membandingkan kinerja dua algoritma machine learning, yaitu Logistic Regression (LR) dan K-Nearest Neighbors (KNN), dalam mengklasifikasikan kualitas udara dengan target empat kelas, yaitu Baik, Sedang, Buruk, dan Berbahaya. Variabel data yang digunakan merupakan sembilan parameter, seperti suhu, kelembaban, konsentrasi PM2.5, konsentrasi PM10, konsentrasi NO2, konsentrasi SO2, konsentrasi CO, jarak dengan kawasan Industri, dan kepadatan penduduk. Data yang digunakan terdiri dari 5000 sampel yang telah melalui proses normalisasi dan penyeimbangan kelas menggunakan SMOTE. Evaluasi model dilakukan menggunakan confusion matrix, akurasi, precision, recall, dan F1-score, serta cross validation 5-fold dan uji paired t-test. Hasil menunjukkan bahwa LR unggul dibandingkan KNN dengan akurasi 94,33% dan F1-score macro 0,92. Uji t menunjukkan perbedaan performa signifikan (p<0,05). Berdasarkan hasil ini, algoritma Logistic Regression direkomendasikan sebagai metode klasifikasi yang lebih efektif dalam studi kualitas udara.