Bahasa kasar adalah ungkapan yang mengandung frasa atau kata-kata kasar dan dikomunikasikan secara lisan atau tertulis kepada lawan bicara (individu atau kelompok), yang berdampak mempercepat terjadinya konflik sosial jika disertai dengan ujaran kebencian. Twitter, sebagai Platform media sosial yang banyak digunakan, sering menjadi wadah penyebaran bahasa kasar dalam berbagai bentuk, seperti sarkasme dan penghinaan. Oleh karena itu, diperlukan sistem deteksi otomatis untuk menyaring konten negatif guna menjaga kualitas interaksi di dunia maya. Penelitian ini mengembangkan model deteksi bahasa kasar di Twitter menggunakan BiLSTM dengan Word Embedding FastText. Tahapan penelitian meliputi pengumpulan data, Pelabelan, Preprocessing, klasifikasi, evaluasi, serta prediksi dan visualisasi deteksi bahasa. Model BiLSTM dibandingkan dengan CNN dan LSTM, serta dilakukan perbandingan performa antara Word2Vec dan FastText sebagai metode Word Embedding. Hasil penelitian menunjukkan bahwa BiLSTM dengan FastText memiliki akurasi tertinggi, yaitu 87%, dengan F1-Score sebesar 85%, mengungguli CNN (79%) dan LSTM (82%). Selain itu, FastText terbukti lebih efektif dibandingkan Word2Vec, dengan hasil akurasi yang lebih tinggi dan kemampuan menangani kata-kata baru atau slang lebih baik. BiLSTM mampu menangkap konteks bahasa kasar secara lebih akurat, terutama dalam memahami struktur kalimat yang kompleks. Namun, masih terdapat tantangan dalam mengklasifikasikan kata-kata yang ambigu atau kontekstual.
Copyrights © 2025