Rohmi Dyah Astuti
Institut Teknologi Sumatera

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Analisis Kinerja XGBoost dengan Penanganan Imbalanced Dataset Menggunakan SMOTE-Tomek pada Klasifikasi Penyakit Diabetes Rohmi Dyah Astuti; Christyan Tamaro Nadeak; Ade Lailani
Jurnal Sarjana Teknik Informatika Vol. 14 No. 2 (2026): Juni
Publisher : Program Studi Informatika, Universitas Ahmad Dahlan

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.12928/jstie.v14i2.32255

Abstract

Penyakit diabetes merupakan salah satu penyakit kronis yang mengalami peningkatan jumlah penderita secara signifikan dalam beberapa tahun terakhir dan memerlukan deteksi dini yang akurat. Ketepatan dalam proses klasifikasi penyakit diabetes sangat penting untuk membantu penanganan medis dan mengurangi risiko komplikasi pada pasien. Namun, permasalahan ketersediaan data yang tak seimbang pada data kesehatan seringkali menyebabkan model klasifikasi menjadi bias terhadap kelas mayoritas dimana jumlah penderita diabetes lebih sedikit dibanding jumlah bukan penderita diabetes. Penelitian ini bertujuan untuk menganalisis performa algoritma XGBoost dengan penerapan metode SMOTE-Tomek dalam menangani ketidakseimbangan data pada klasifikasi penyakit diabetes. Dataset yang digunakan terdiri dari 5288 data dengan 14 fitur merupakan faktor-faktor pendukung resiko terkena penyakit diabetes. Proses penelitian meliputi prapemrosesan data, pembagian data latih dan data uji, penanganan imbalanced dataset menggunakan SMOTE-Tomek, pelatihan model XGBoost dengan hyperparameter tuning menggunakan GridSearchCV, serta evaluasi model menggunakan metrik akurasi, precision, recall, F1-score, dan ROC-AUC. Dengan pembagian data latih dan data uji sebesar 80:20, hasil penelitian menunjukkan bahwa tanpa penanganan data tidak seimbang, model menghasilkan nilai precision sebesar 0,61, recall sebesar 0,30, dan F1-score sebesar 0,40 pada kelas minoritas. Setelah penerapan SMOTE-Tomek, nilai recall dan F1-score meningkat menjadi 0,45, meskipun precision menurun menjadi 0,45. Selain itu, nilai ROC-AUC meningkat dari 0,64 menjadi 0,70, yang menunjukkan peningkatan kemampuan model dalam membedakan kelas. Dengan demikian, kombinasi SMOTE-Tomek dan XGBoost terbukti mampu meningkatkan performa model dalam menangani dataset tidak seimbang, khususnya dalam mendeteksi kelas minoritas pada kasus klasifikasi penyakit diabetes.