Twitter salah satu media sosial yang banyak digunakan saat ini, terutama untuk mengeluarkan pendapat secara bebas. Tidak adanya mekanisme penyeleksian kata-kata dan kalimat pada twitter, menyebabkan siapa saja dapat melontarkan ujaran kebencian maupun penggunaan bahasa kasar terhadap orang atau golongan lain. Ujaran kebencian dan bahasa kasar sering ditemukan pada twitter dalam berbagai kasus maupun topik percakapan, seperti perseteruan antar kelompok, ketidakpuasan terhadap produk, sampai kepada protes terhadap kebijakan pemerintah. Penelitian ini mengusulkan penggunaan deep learning untuk mengklasifikasi apakah tweet mengandung ujaran kebencian atau bahasa kasar. Metode yang digunakan Convolutional Neural Network dengan input fitur teks word embedding word2vec. Beberapa skenario pengujian dilakukan untuk mendapatkan hasil optimal dengan melakukan training pada 90% data. Model final yang dipilih diterapkan terhadap data testing sebanyak 10% dari data set, memperoleh akurasi untuk kelas hate speech sebesar 84,92%, dan untuk kelas abusive 91,47%. Hasilnya sangat baik dan kompetitif bila dibandingkan dengan metode-metode machine learning konvensional.
Copyrights © 2022