Ketidakseimbangan kelas (imbalanced dataset) merupakan salah satu tantangan utama dalam analisissentimen, karena model cenderung bias terhadap kelas mayoritas sehingga menurunkan kemampuandalam mengenali kelas minoritas. Penelitian ini mengusulkan penerapan teknik oversampling ADASYN(Adaptive Synthetic Sampling) untuk meningkatkan performa model Naïve Bayes pada data sentimenterkait kebijakan PPKM di Indonesia. Dataset yang digunakan berisi sekitar 20.000 tweet berbahasaIndonesia yang telah dilabeli menjadi tiga kelas sentimen: positif, negatif, dan netral, dengan distribusikelas yang didominasi oleh sentimen netral sebesar ±75%. Tahap preprocessing dilakukan melalui casefolding, tokenization, cleaning, normalization, dan stemming, kemudian pembobotan teks dihitungmenggunakan TF-IDF. Model Naïve Bayes diuji pada berbagai nilai parameter α (alpha) pada ADASYN untuk menentukan tingkat oversampling terbaik. Hasil menunjukkan bahwa model baseline tanpa penyeimbangan data menghasilkan akurasi tinggi namun memiliki recall dan F1-score rendah pada kelas minoritas. Penerapan ADASYN mampu meningkatkan performa keseluruhan, khususnya recall pada kelas positif dan negatif. Nilai α antara 0,3–0,4 memberikan keseimbangan terbaik antara stabilitas akurasi dan peningkatan performa kelas minoritas. Penelitian ini menegaskan bahwa teknik penyeimbangan data berperan penting untuk meningkatkan keadilan dan kualitas prediksi pada analisis sentimen berkelas tidak seimbang.
Copyrights © 2026