Claim Missing Document
Check
Articles

Found 1 Documents
Search

Analisis Perbandingan Algoritma K-Nearest Neighbor dan Ensemble Learning dalam Klasifikasi Penyakit Obesitas Tondang, Sarihot; Prasetyo, Ramadhan Roy; Fulvian, Rafi; Sitorus, Yosua Goldstein; Chrisnawati, Giantika
RIGGS: Journal of Artificial Intelligence and Digital Business Vol. 4 No. 2 (2025): Mei - Juli
Publisher : Prodi Bisnis Digital Universitas Pahlawan Tuanku Tambusai

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.31004/riggs.v4i2.994

Abstract

Penelitian ini bertujuan untuk membandingkan performa tiga algoritma machine learning, yaitu K-Nearest Neighbors (KNN), Random Forest, dan Gradient Boosting, dalam tugas klasifikasi tingkat obesitas berdasarkan dataset UCI “Estimation of Obesity Levels”. Dataset ini terdiri dari 2111 sampel dengan 17 atribut, termasuk fitur numerik dan kategorikal, serta label klasifikasi “NObeyesdad” dengan tujuh kelas obesitas. Proses pra-pemrosesan data melibatkan normalisasi menggunakan StandardScaler untuk fitur numerik, one-hot encoding untuk fitur kategorikal, dan Synthetic Minority Oversampling Technique (SMOTE) untuk mengatasi ketidakseimbangan kelas. Model-model dilatih menggunakan pipeline yang mencakup pra-pemrosesan dan klasifikasi, dengan optimasi hyperparameter melalui GridSearchCV dan validasi silang 5-fold. Evaluasi dilakukan dengan metrik akurasi, precision, recall, F1-score, dan analisis confusion matrix. Hasil menunjukkan bahwa Random Forest mencapai performa tertinggi dengan akurasi 98.6%, diikuti oleh Gradient Boosting dengan akurasi 98.1%, dan KNN dengan akurasi 86.8%. Random Forest menunjukkan stabilitas prediksi yang superior, terutama pada kelas-kelas dengan fitur serupa, sementara Gradient Boosting juga menawarkan performa yang konsisten. KNN, meskipun sederhana, cenderung kurang stabil dalam menangani data multi-kelas yang kompleks. Penelitian ini memberikan wawasan penting mengenai penerapan algoritma machine learning dalam diagnosis obesitas, dengan Random Forest sebagai pilihan terbaik untuk klasifikasi akurat dan stabil.