Jurnal Sarjana Teknik Informatika
Vol. 14 No. 2 (2026): Juni

Analisis Kinerja XGBoost dengan Penanganan Imbalanced Dataset Menggunakan SMOTE-Tomek pada Klasifikasi Penyakit Diabetes

Rohmi Dyah Astuti (Institut Teknologi Sumatera)
Christyan Tamaro Nadeak (Institut Teknologi Sumatera)
Ade Lailani (Unknown)



Article Info

Publish Date
10 Jun 2026

Abstract

Penyakit diabetes merupakan salah satu penyakit kronis yang mengalami peningkatan jumlah penderita secara signifikan dalam beberapa tahun terakhir dan memerlukan deteksi dini yang akurat. Ketepatan dalam proses klasifikasi penyakit diabetes sangat penting untuk membantu penanganan medis dan mengurangi risiko komplikasi pada pasien. Namun, permasalahan ketersediaan data yang tak seimbang pada data kesehatan seringkali menyebabkan model klasifikasi menjadi bias terhadap kelas mayoritas dimana jumlah penderita diabetes lebih sedikit dibanding jumlah bukan penderita diabetes. Penelitian ini bertujuan untuk menganalisis performa algoritma XGBoost dengan penerapan metode SMOTE-Tomek dalam menangani ketidakseimbangan data pada klasifikasi penyakit diabetes. Dataset yang digunakan terdiri dari 5288 data dengan 14 fitur merupakan faktor-faktor pendukung resiko terkena penyakit diabetes. Proses penelitian meliputi prapemrosesan data, pembagian data latih dan data uji, penanganan imbalanced dataset menggunakan SMOTE-Tomek, pelatihan model XGBoost dengan hyperparameter tuning menggunakan GridSearchCV, serta evaluasi model menggunakan metrik akurasi, precision, recall, F1-score, dan ROC-AUC. Dengan pembagian data latih dan data uji sebesar 80:20, hasil penelitian menunjukkan bahwa tanpa penanganan data tidak seimbang, model menghasilkan nilai precision sebesar 0,61, recall sebesar 0,30, dan F1-score sebesar 0,40 pada kelas minoritas. Setelah penerapan SMOTE-Tomek, nilai recall dan F1-score meningkat menjadi 0,45, meskipun precision menurun menjadi 0,45. Selain itu, nilai ROC-AUC meningkat dari 0,64 menjadi 0,70, yang menunjukkan peningkatan kemampuan model dalam membedakan kelas. Dengan demikian, kombinasi SMOTE-Tomek dan XGBoost terbukti mampu meningkatkan performa model dalam menangani dataset tidak seimbang, khususnya dalam mendeteksi kelas minoritas pada kasus klasifikasi penyakit diabetes.

Copyrights © 2026






Journal Info

Abbrev

JSTIF

Publisher

Subject

Computer Science & IT

Description

JSTIE (Jurnal Sarjana Teknik Informatika) (E-Journal) adalah jurnal online ditujukan sebagai sarana publikasi dari makalah yang disarikan dari hasil penelitian mahasiswa Teknik Informatika. Focus and Scope: Rekayasa Perangkat Lunak (Software Engineering) Pengetahuan dan Data Mining (Data Mining) ...