Klasifikasi dini diabetes mellitus merupakan langkah krusial dalam memitigasi risiko komplikasi medis, namun efektivitasnya kerap terhambat oleh masalah ketidakseimbangan distribusi kelas (imbalanced class) pada data medis. Kondisi tersebut menyebabkan algoritma klasifikasi cenderung menunjukkan bias terhadap kelas mayoritas serta mengabaikan kelas minoritas yang memiliki signifikansi klinis lebih tinggi. Penelitian ini bertujuan untuk mengevaluasi pengaruh teknik Synthetic Minority Over-sampling Technique (SMOTE) terhadap performa algoritma K-Nearest Neighbor (KNN) dengan memanfaatkan dataset Pima Indians Diabetes. Simulasi dilaksanakan menggunakan perangkat lunak Altair Studio melalui penerapan variasi parameter K=3, 5, dan 10 serta divalidasi dengan metode 10-Fold Cross Validation. Hasil penelitian menunjukkan bahwa integrasi SMOTE secara konsisten meningkatkan kinerja model dengan eskalasi akurasi rata-rata sebesar 2,07%. Peningkatan paling signifikan teridentifikasi pada konfigurasi K=3, di mana akurasi meningkat dari 68,88% menjadi 73,70% (naik 4,82%), sementara akurasi maksimal tercapai pada K=10 dengan nilai 75,40%. Selain itu, penerapan SMOTE terbukti meningkatkan nilai recall kelas minoritas secara substansial, yakni dari 53,36% menjadi 81,20% pada K=3, meskipun disertai munculnya trade-off terhadap nilai precision. Temuan ini menegaskan bahwa penyeimbangan data melalui metode SMOTE mampu menghasilkan model klasifikasi yang lebih adil dan reliabel dalam mendeteksi penyakit diabetes.
Copyrights © 2026