Diabetes merupakan suatu penyakit menahun (kronis) berupa gangguan metabolis yang ditandai dengan kadar gula darah yang melebihi batas normal. Prediksi awal penyakit Diabetes menjadi sesuatu yang penting agar tidak menjadi ancaman serius bagi penderitanya. Penelitian ini akan melakukan optimasi metode Machine Learning dengan reduksi fitur Particle Swarm Optimazation (PSO) dan perbandingan dataset training dan dataset testing untuk menemukan metode dengan performance terbaik dalam prediksi penyakit Diabetes. Metode Machine Learning yang dimaksud adalah metode klasifikasi Decision Tree (DT), Iterative Dichotomiser 3 (ID3), Random Forest (RF), Support Vector System (SVM), Naïve Bayes (NB), K-Nearest Neighbor (KNN) dan Neural Network (NN). Komparasi dilakukan dengan cara pada tiap matode, dataset yang digunakan dibagi menjadi data training dan data testing (validasi) dengan perbandingan 70:30, 80:20 dan 90:10. Pengukuran dengan cara tiap perbandingan dilihat nilai akurasi dan nilai AUC (kurva ROC) tertinggi pada data testing untuk menemukan performance terbaik. Dari olah data yang dilakukan diketahui untuk nilai Akurasi perbandingan data 70:30 metode DT, ID3 dan RF yang menghasilkan nilai tertinggi sama yaitu 96,79%. Untuk perbandingan 80:20 metode DT dan ID3 menghasilkan nilai tertinggi yaitu 97,12%. Dan perbandingan 90:10, metode ID3 menghasilkan nilai tertinggi yaitu 96,19%. Untuk nilai AUC metode RF menghasilkan nilai tertinggi untuk 3 perbandingan yaitu 0,995; 0,995 dan 0,998. Selanjutnya diketahui bahwa metode RF dan NN menjadi metode yang paling stabil dalam pengolahan menggunakan split data 70:30, 80:20 dan 90:10 ditinjau dari nilai akurasi dan nilai AUC.
Copyrights © 2026