Ketidakseimbangan data (imbalanced data) sering menjadi tantangan utama dalam analisis sentimen, terutama ketika model pembelajaran mesin cenderung mengabaikan kelas minoritas yang justru memuat informasi kritis. Penelitian ini mengevaluasi efektivitas teknik class balancing dengan metode resampling, yaitu Random Under-Sampling (RUS) dan Synthetic Minority Over-sampling Technique (SMOTE), dalam meningkatkan performa model LSTM (Long Short-Term Memory) untuk analisis sentimen kesehatan mental. Hasil penelitian menunjukkan bahwa metode SMOTE dapat meningkatkan F1-score pada kelas “Suicidal” dari 64,4% menjadi 72,6%, meskipun terjadi penurunan pada kelas “Depression” dari 73,4% menjadi 59,9%. Sementara itu, metode RUS cenderung menurunkan performa secara keseluruhan, dengan akurasi model turun dari 80,5% menjadi 77,8% akibat penghapusan data secara acak yang mengurangi kualitas representasi data. Penelitian ini menyimpulkan bahwa meskipun teknik resampling dapat membantu menyeimbangkan data, namun penerapannya pada data teks memerlukan kehati-hatian untuk menghindari efek negatif pada performa model.
Copyrights © 2025