Jurnal Komputasi
Vol. 14 No. 1 (2026)

Perbandingan Kinerja Algoritma Ensemble dan Boosting untuk Prediksi Diabetes pada Data Tidak Seimbang Menggunakan SMOTE

Hardiyanti P, Cicin (Unknown)
Danianti, Dita (Unknown)



Article Info

Publish Date
30 Apr 2026

Abstract

Sebagai salah satu penyakit kronis yang terus meningkat secara global, diagnosis dini diabetes sangat penting untuk mencegah komplikasi yang lebih serius. Untuk memprediksi risiko diabetes, metode pembelajaran mesin telah banyak digunakan. Namun, masalah utama yang sering muncul adalah ketidakseimbangan distribusi kelas pada dataset medis, yang dapat menghambat model klasifikasi. Penelitian ini bertujuan untuk melakukan analisis komparatif terhadap beberapa algoritma machine learning dalam memprediksi risiko diabetes pada dataset yang tidak seimbang serta mengevaluasi dampak penerapan teknik oversampling Synthetic Minority Oversampling Technique (SMOTE). Dataset yang digunakan berasal dari Diabetes Prediction Dataset yang tersedia di Kaggle dengan jumlah sekitar 100.000 data dan distribusi kelas positif sekitar 8,5%. Penelitian ini membandingkan lima algoritma klasifikasi, yaitu Logistic Regression, Random Forest, XGBoost, LightGBM, dan CatBoost. Evaluasi model dilakukan menggunakan metode Stratified 5-fold Cross Validation dengan metrik evaluasi Precision, Recall, F1-score, ROC-AUC, dan PR-AUC. Hasil penelitian menunjukkan bahwa model berbasis boosting memiliki performa yang lebih unggul dibandingkan model lainnya. LightGBM memperoleh nilai PR-AUC tertinggi sebesar sekitar 0,89 dengan ROC-AUC sebesar 0,9785, diikuti oleh CatBoost dan XGBoost dengan performa yang sangat mendekati. Menurut analisis confusion matrix, model terbaik mampu mendeteksi kasus diabetes dengan akurasi sekitar 97%, ketepatan sekitar 93,6%, dan recall sekitar 70%. Hasil penelitian ini menunjukkan bahwa algoritma boosting, khususnya LightGBM, dapat memprediksi diabetes dengan baik pada dataset medis yang tidak seimbang

Copyrights © 2026






Journal Info

Abbrev

komputasi

Publisher

Subject

Computer Science & IT Control & Systems Engineering Decision Sciences, Operations Research & Management Electrical & Electronics Engineering Engineering

Description

Jurnal Komputasi E-ISSN 2541-0350 P-ISSN 2541-0296 publised by Departement Computer Science, Faculty of Mathematics and Natural Sciences, University of Lampung. peer-reviewed journal. This journal covers all topics of computer science which includes: Computer Science Information System Software ...