Studi ini meneliti analisis sentimen lagu-lagu tradisional Indonesia menggunakan model IndoBERT yang telah disempurnakan melalui penggabungan augmentasi data kontekstual dan tekstual. Kumpulan data tersebut terdiri dari komentar pengguna yang terkait dengan lagu-lagu klasik Indonesia, yang dipecah ke dalam sentimen positif, negatif, dan netral. Dua strategi augmentasi diterapkan: augmentasi tekstual menggunakan teknik pembuatan teks dan augmentasi kontekstual yang memanfaatkan kesamaan semantik. Evaluasi dilakukan dengan menggunakan metrik akurasi, presisi, recall, dan skor F1. Hasil penelitian menunjukkan bahwa model yang dibor pada kumpulan data asli mencapai kinerja yang seimbang dan stabil (akurasi: 0,86). Augmentasi tekstual, meskipun menghasilkan variasi data yang tinggi, mengurangi akurasi model (0,63) dan memperkenalkan bias terhadap sentimen negatif. Sebaliknya, augmentasi kontekstual mempertahankan stabilitas kinerja dan bahkan sedikit meningkatkan presisi (0,87). Temuan ini menunjukkan bahwa augmentasi kontekstual lebih efektif untuk memperkaya kumpulan sentimen data tanpa mengorbankan kinerja model. Temuan ini menyoroti efektivitas pengintegrasian model bahasa yang telah dikembangkan sebelumnya dan strategi augmentasi data untuk menganalisis sentimen dalam sumber daya rendah.
Copyrights © 2025