Pertumbuhan e-commerce di Indonesia sangat pesat, terbukti dengan data penggunainternet yang terus meningkat dari tahun ke tahun, serta adanya pandemi virus COVID-19 yang mengharuskan masyarakat untuk melakukan social distancing.Tokopedia merupakansalahsatu penyedia e-commerce yang umum digunakan masyarakatIndonesia saat ini, khususnya generasi milenial. Data review hanya akan dilabelisebagai dua jenis sentimen, yaitu sentimen positif dan sentimen negatif kemudianmetode klasifikasi sentimen positif dan sentimen negatif dilakukan denganmenggunakan beberapa metode,yakniSupport Vector Machine, Naïve Bayes,dan Logistic Regression.Hasil pelabelan kelas sentimen pada data review Tokopedia diperoleh 3125 review dengan jumlah review positif sebanyak 2598 review dan review negatif sebanyak 527 review. Pada penelitian ini akan menggunakan dua jenis model pembagian data, yaitu dengan split data 80:20 dan k-fold cross validation.Ketidakseimbanganbanyak data padatiapkelassentimenditanganimengunakanteknik SMOTE.Penerapan SMOTE terbukti dapat meningkatkan kinerja pada data tidak seimbang, sehingga hal tersebut menunjukkan bahwa SMOTE lebih efektif dalam meningkatkan ketepatan akurasi klasifikasi daripada non-SMOTE. Metode klasifikasi yang tepat digunakan untuk klasifikasi review pengguna Tokopedia adalah k-fold cross validation Support Vector Machine-SMOTE karena karena memiliki nilai AUC paling tinggi.
Copyrights © 2022