Penelitian ini mengevaluasi pengaruh teknik augmentasi dan fine‑tuning terhadap kinerja model BERT multibahasa pada tugas klasifikasi sentimen ulasan film berbahasa Indonesia. Dataset awal terdiri dari 1.200 ulasan; 80% digunakan untuk pelatihan dan validasi (n = 960) dan 20% untuk pengujian (n = 240). Data pelatihan diperluas melalui augmentasi menjadi 2.880 sampel sintetis untuk keperluan fine‑tuning. Model kemudian di‑fine‑tune pada korpus yang diperluas dan dievaluasi menggunakan metrik akurasi, precision, recall, dan F1. Pada set pengujian diperoleh akurasi 82,5%, precision untuk kelas positif 76,0%, recall 95,0%, dan F1‑score 84,44%. Matriks kebingungan menunjukkan TP = 114, FN = 6, FP = 36, dan TN = 84, yang mengindikasikan sensitivitas tinggi terhadap ulasan positif namun terdapat proporsi false positive yang relatif besar. Temuan ini mengindikasikan bahwa augmentasi meningkatkan kemampuan model dalam menangkap sinyal positif (tingginya recall), namun memerlukan penyesuaian lebih lanjut untuk mengurangi kesalahan prediksi positif (meningkatkan precision). Secara keseluruhan, hasil penelitian menyediakan bukti bahwa BERT multibahasa mampu menangani tugas sentimen berbahasa Indonesia dengan performa memadai apabila didukung strategi augmentasi dan prosedur validasi yang tepat.
Copyrights © 2025