Studi ini bertujuan untuk mengklasifikasikan kualitas air sungai menggunakan tiga algoritma machine learning: Random Forest, Support Vector Classifier (SVC), dan Logistic Regression. Tujuan dari penelitian ini adalah untuk membandingkan kinerja ketiga algoritma tersebut berdasarkan accuracy, precision, recall, dan F1-score guna menentukan model yang paling sesuai untuk pemantauan kualitas air. Dataset yang digunakan diperoleh dari portal Satu Data Jakarta, yang berisi pengukuran kualitas air dari 23 sungai berdasarkan parameter fisik dan kimia seperti pH, dissolved oxygen (DO), biochemical oxygen demand (BOD), total dissolved solids (TDS), suhu, dan kekeruhan. Data tersebut melalui proses preprocessing melalui pembersihan, categorical encoding, dan feature scaling sebelum digunakan untuk pelatihan dan pengujian model. Hasil penelitian menunjukkan bahwa algoritma Random Forest mencapai accuracy tertinggi (93,33%) dan F1-score sebesar 0,87, diikuti oleh SVC dan Logistic Regression. Logistic Regression menghasilkan precision tertinggi, sementara Random Forest memberikan keseimbangan terbaik antara precision dan recall. Temuan ini menunjukkan bahwa Random Forest merupakan algoritma yang paling efektif dan adaptif untuk klasifikasi kualitas air sungai, menawarkan kinerja yang andal untuk mendukung pemantauan lingkungan dan pengelolaan air yang berkelanjutan.
Copyrights © 2026