Ketidakseimbangan kelas pada dataset ulasan aplikasi berpotensi menimbulkan bias sistematis pada model klasifikasi sentimen berbasis machine learning. Penelitian ini mengevaluasi empat strategi penanganan ketidakseimbangan data, yaitu baseline, SMOTE, class weighting, dan kombinasi keduanya pada tiga algoritma klasifikasi, yakni Support Vector Machine (SVM), Random Forest, dan Logistic Regression menggunakan 10.000 ulasan dari aplikasi ChatGPT di Google Play Store. Representasi fitur dilakukan dengan TF-IDF dan dievaluasi menggunakan 5-fold cross-validation. Skenario baseline mencapai akurasi tertinggi sebesar 0,90, namun memiliki F1-score makro terendah berkisar antara 0,52 hingga 0,55 yang mengindikasikan dominasi kelas mayoritas. Penerapan class weighting secara konsisten menghasilkan F1-score makro tertinggi sebesar 0,58 untuk SVM dan Logistic Regression, sementara SMOTE tidak menunjukkan peningkatan yang konsisten. Hasil ini menegaskan adanya trade-off antara akurasi dan keseimbangan kinerja antarkelas, serta efektivitas strategi penanganan ketidakseimbangan bersifat bergantung pada algoritma yang digunakan.
Copyrights © 2026