Permasalahan ketidakseimbangan kelas pada data klasifikasi biner dapat menyebabkan model bias terhadap kelas mayoritas dan menurunkan performa dalam memprediksi kelas minoritas. Penelitian ini bertujuan untuk mengevaluasi pengaruh metode penyeimbangan data Synthetic Minority Over-sampling Technique (SMOTE) dan kombinasi SMOTE dengan Edited Nearest Neighbor (SMOTE-ENN) terhadap performa model klasifikasi. Dataset yang digunakan adalah Bank Marketing dengan variabel target berupa keputusan nasabah dalam menerima tawaran produk deposito. Metode yang digunakan meliputi pengumpulan data, preprocessing data, splitting data, resampling data, modeling dan evaluasi performa. Tiga algoritma machine learning yang digunakan dalam penelitian ini, yaitu Logistic Regression, Naïve Bayes, dan Random Forest. Evaluasi model dilakukan menggunakan metrik accuracy, sensitivity, specificity, dan G-Means. Hasil penelitian menunjukkan bahwa penerapan SMOTE meningkatkan sensitivity model terhadap kelas minoritas, namun cenderung menurunkan specificity. SMOTE-ENN memberikan hasil yang lebih seimbang antara sensitivitas dan spesifisitas karena mampu mengurangi data outlier dan overlapping. Model Random Forest dengan data hasil SMOTE-ENN menghasilkan performa paling seimbang secara keseluruhan berdasarkan keempat metric evaluasi. Penelitian ini menyimpulkan bahwa pemilihan metode penyeimbangan data yang tepat berpengaruh signifikan terhadap kualitas klasifikasi pada data tidak seimbang.
Copyrights © 2025