Air merupakan sumber kehidupan terutama bagi kehidupan manusia, maka dari itu kuualitas air tersebut wajib dijaga demi keberlangsungan kehidupan manusia dan alam sekitarnya. Adanya pembangunan yang semakin pesat mendorong banyaknya penggunaan lahan di sepanjang aliran sungai. Hal ini bisa dilihat, terutama sungai-sungai di perkotaan, yang berubah fungsi menjadi permukiman dan kegiatan industri. Perubahan fungsi ini menimbulkan kekhawatiran akan menurunnya kualitas air yang mengalir sepanjang sungai tersebut. Adapun tujuan dari penelitian ini adalah menerapkan metode data mining untuk mengklasifikasi kualitas air berdasarkan parameter kualitas air meliputi mikrobiologi, kimia anorganik, dan parameter kimia. Beberapa algoritma yang diuji performanya seperti algoritma decision tree, naive bayes dan k-nearest neighbor. Adapun metode pengujian yang digunakan yaitu k-fold cross validation dan kurva ROC. Hasil metode data mining pada dataset kualitas air berupa komparasi performance dari ketiga algoritma tersebut sehingga akan didapatkan algoritma terbaik dalam mengklasifikasi kualitas air. Berdasarkan komparasi algoritma hasil pengujian semua metode yang digunakan maka dapatkan bahwa algoritma decesion tree menjadi algoritma yang paling akurat dalam mengklasifikasi data kualitas air dengan akurasi sebesar 94,94% dan nilai AUC sebesar 0,865 sehingga termasuk golongan klasifikasi yang baik.
Copyrights © 2022