Sistem text-to-gloss merupakan salah satu komponen dalam pengembangan teknologi komunikasi inklusif bagi komunitas ruli, khususnya untuk Bahasa Isyarat Indonesia (BISINDO). Penelitian ini mengimplementasikan model FLAN-T5 dengan teknik Low-Rank Adaptation (LoRA) untuk mengatasi keterbatasan dataset dalam tugas konversi text-to-gloss BISINDO. Augmentasi data berbasis combining preprocessing diterapkan untuk memperkaya dataset yang terbatas melalui lemmatisasi, menghasilkan dataset augmentasi sebesar 3000 pasangan text-gloss dari 1500 data asli. Model FLAN-T5 dikonfigurasi dengan LoRA rank 8 pada matriks Query dan Value, melatih hanya 0,44% dari total parameter. Evaluasi dilakukan menggunakan metrik BLEU, ROUGE-1, ROUGE-2, dan ROUGE-L untuk membandingkan performa model dengan data asli dan data augmentasi. Hasil eksperimen menunjukkan peningkatan signifikan pada seluruh metrik evaluasi untuk model yang dilatih dengan data augmentasi dibandingkan model dengan data asli. Analisis kualitatif terhadap 50 sampel prediksi mengidentifikasi tiga pola kesalahan utama, duplikasi kata yang mengindikasikan masalah stopping criteria decoder, kehilangan kata penting yang menunjukkan keterbatasan pemahaman semantik, dan error lemmatisasi pada preprocessing morfologi bahasa Indonesia. Penelitian ini membuktikan bahwa kombinasi FLAN-T5 dengan LoRA dan augmentasi data dapat meningkatkan performa sistem text-to-gloss BISINDO dengan mengurangi risiko overfitting pada kondisi dataset low-resource language, namun memerlukan pengembangan dataset yang lebih besar dan metode augmentasi yang lebih beragam untuk mencapai hasil yang lebih baik.
Copyrights © 2026