Mathvision : Jurnal Matematika
Vol 7 No 1 (2025): Maret 2025

Evaluasi Kinerja Algoritma Machine learning pada Dataset Skala Besar

Lusiyanti, Desy (Unknown)
Musdalifah, Selvy (Unknown)
Sahari, Agusman (Unknown)
Fajri, Iman Al (Unknown)



Article Info

Publish Date
30 Mar 2025

Abstract

Di era digital, volume data yang dihasilkan terus meningkat secara eksponensial, menuntut pengembangan metode analisis yang lebih efisien dan akurat. Machine Learning (ML) telah menjadi pendekatan utama dalam pengolahan dataset skala besar, termasuk dalam analisis kualitas air. Penelitian ini bertujuan untuk mengevaluasi performa beberapa algoritma ML dalam mengklasifikasikan kualitas air berdasarkan dataset berskala besar yang diperoleh dari sumber daring. Model yang diuji mencakup Logistic Regression (LR), Decision Tree (DT), Random Forest (RF), XGBoost (XGB), K-Nearest Neighbors (KNN), dan Support Vector Machine (SVM). Metodologi yang diterapkan mencakup preprocessing data dengan imputasi median untuk menangani missing values serta K-Fold Cross Validation (k=10) untuk memastikan hasil yang lebih generalizable. Evaluasi model dilakukan berdasarkan metrik akurasi, precision, recall, F1-score, dan waktu komputasi. Hasil penelitian menunjukkan bahwa XGBoost memiliki performa terbaik dengan akurasi 67%, diikuti oleh Decision Tree, KNN, dan SVM dengan akurasi 65%, sedangkan Logistic Regression dan Random Forest memiliki akurasi 63%. Temuan ini mengonfirmasi bahwa model berbasis gradient boosting seperti XGBoost lebih unggul dalam menangani kompleksitas dataset skala besar dibandingkan model berbasis regresi atau pohon keputusan tunggal. Penelitian ini berkontribusi dalam memberikan rekomendasi bagi akademisi dan praktisi dalam memilih algoritma ML yang paling efisien dan optimal untuk analisis kualitas air. Rekomendasi untuk penelitian selanjutnya mencakup eksplorasi optimasi hyperparameter, balancing dataset, serta pengujian dengan dataset real-time untuk validasi lebih lanjut.

Copyrights © 2025






Journal Info

Abbrev

mv

Publisher

Subject

Mathematics

Description

Focus and Scope : Analisis Aljabar Matematika Terapan Pemodelan Matematika Sistem dan Kontrol Matematika Diskrit dan Kombinatorik Statistik dan Stokastik Optimasi Ilmu Komputasi Matematika ...