Penyakit diabetes merupakan salah satu penyakit kronis yang mengalami peningkatan jumlah penderita secara signifikan dalam beberapa tahun terakhir dan memerlukan deteksi dini yang akurat. Ketepatan dalam proses klasifikasi penyakit diabetes sangat penting untuk membantu penanganan medis dan mengurangi risiko komplikasi pada pasien. Namun, permasalahan ketersediaan data yang tak seimbang pada data kesehatan seringkali menyebabkan model klasifikasi menjadi bias terhadap kelas mayoritas dimana jumlah penderita diabetes lebih sedikit dibanding jumlah bukan penderita diabetes. Penelitian ini bertujuan untuk menganalisis performa algoritma XGBoost dengan penerapan metode SMOTE-Tomek dalam menangani ketidakseimbangan data pada klasifikasi penyakit diabetes. Dataset yang digunakan terdiri dari 5288 data dengan 14 fitur merupakan faktor-faktor pendukung resiko terkena penyakit diabetes. Proses penelitian meliputi prapemrosesan data, pembagian data latih dan data uji, penanganan imbalanced dataset menggunakan SMOTE-Tomek, pelatihan model XGBoost dengan hyperparameter tuning menggunakan GridSearchCV, serta evaluasi model menggunakan metrik akurasi, precision, recall, F1-score, dan ROC-AUC. Dengan pembagian data latih dan data uji sebesar 80:20, hasil penelitian menunjukkan bahwa tanpa penanganan data tidak seimbang, model menghasilkan nilai precision sebesar 0,61, recall sebesar 0,30, dan F1-score sebesar 0,40 pada kelas minoritas. Setelah penerapan SMOTE-Tomek, nilai recall dan F1-score meningkat menjadi 0,45, meskipun precision menurun menjadi 0,45. Selain itu, nilai ROC-AUC meningkat dari 0,64 menjadi 0,70, yang menunjukkan peningkatan kemampuan model dalam membedakan kelas. Dengan demikian, kombinasi SMOTE-Tomek dan XGBoost terbukti mampu meningkatkan performa model dalam menangani dataset tidak seimbang, khususnya dalam mendeteksi kelas minoritas pada kasus klasifikasi penyakit diabetes.