Dalam data nyata, ada banyak situasi di mana jumlah instance di satu class jauh lebih sedikit daripada jumlah instance di class lain. Keadaan ini disebut sebagai masalah dataset tidak seimbang (imbalance class). Imbasnya kinerja klasifikasi biasanya menurun di beberapa aplikasi data mining. Pada penelitian ini, diidentifkasi bahwa dataset performansi rating iklan TV yang digunakan memiliki permasalahan imbalance class yang sangat besar dimana instance yang memiliki nilai rating tinggi, jauh lebih sedikit dibandingkan instance yang memiliki nilai rating kecil dan menengah. Sehingga diperlukan metode over-sampling untuk mengatasi permasalahan imbalance class tersebut. Metode yang dapat digunakan adalah Synthetic Minority Over-sampling Technique (SMOTE). Untuk memvalidasi keefektifan model yang diusulkan, dilakukan dua skenario eksperimental yaitu: pertama algoritma ANN langsung digunakan untuk pemodelan tanpa mempertimbangkan ketidakseimbangan kelas, dan kedua dilakukan over-sampling SMOTE untuk meningkatkan jumlah dataset agar mencapai dataset yang seimbang. Hasil eksperimen menunjukkan bahwa performansi ANN+SMOTE mencapai akurasi sebesar 87.06% dibandingkan ANN yang hanya sebesar 86.35%. Penerapan Teknik SMOTE terbukti dapat mengatasi masalah ketidakseimbangan data dan mendapatkan hasil klasifikasi yang lebih baik.
Copyrights © 2020