Deteksi sarkasme dalam teks berbahasa Indonesia masih menjadi tantangan dalam pemrosesan bahasa alami (NLP), terutama pada media sosial yang kaya ekspresi pragmatis. Studi ini mengusulkan pendekatan hybrid yang mengintegrasikan model IndoBERT dengan empat kelompok fitur pragmatis, yaitu emoji, tipografi, tanda baca ekspresif, dan pola leksikal seperti intensifier dan hiperbola, untuk meningkatkan akurasi deteksi sarkasme. Evaluasi dilakukan pada dua domain media sosial, yaitu Twitter dan Reddit Indonesia. Pada domain Twitter, model hybrid meningkatkan F1-Score secara numerik dari 71.60% menjadi 72.35%. Namun, uji McNemar dengan tingkat signifikansi α = 0.05 menunjukkan bahwa perbedaan performa keseluruhan tidak signifikan secara statistik, meskipun terjadi peningkatan Recall yang signifikan secara numerik. Sebaliknya, pada domain Reddit, model baseline IndoBERT menunjukkan performa yang lebih baik dengan perbedaan yang signifikan secara statistik berdasarkan uji McNemar pada α = 0.05. Analisis kesalahan menunjukkan bahwa fitur pragmatis efektif dalam menangkap sarkasme yang bersifat eksplisit, tetapi kurang optimal untuk sarkasme yang lebih implisit dan kontekstual. Temuan ini menunjukkan bahwa integrasi fitur linguistik pragmatis dapat menjadi pelengkap penting bagi model transformer dalam sistem NLP berbahasa Indonesia, khususnya pada domain dengan ekspresi sarkasme yang lebih eksplisit serta untuk aplikasi seperti moderasi konten dan chatbot sosial.
Copyrights © 2026