Fitri Dwi Kartikasari
Unknown Affiliation

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

HATE SPEECH DETECTION PADA VIDEO MENGGUNAKAN METODE KNN DAN NAIVE BAYES Christopher Kelvin Pintoro Kwan; Vincentius Riandaru Prasetyo; Fitri Dwi Kartikasari
CALYPTRA Vol. 13 No. 2 (2025): Calyptra : Jurnal Ilmiah Mahasiswa Universitas Surabaya (Mei)
Publisher : Perpustakaan Universitas Surabaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstract—Hate speech has had many negative impacts in Indonesia, such as riots, physical and verbal altercations, divisions in society, and many more. Social media is the place to spread hate speech most quickly. Not only through text posts, It is quite common to find hate speech in the form of videos. In this research, researchers will create a model that applies machine learning models to detect hate speech in videos, where currently most machine learning models are used to detect hate speech in text form only. In its application, the model will convert the input video into text using Google API. Then classification will be carried out using KNN to classify whether the video is hate speech or not, and Naive Bayes to classify the context of the video. In an unbalanced dataset, the classification results obtained for hate speech classification were 74% and for video context classification the accuracy was 45%. In a balanced dataset but overfitting occurs, the accuracy obtained in hate speech classification is 93% and in video context classification the accuracy is 55%. Based on the test results, it was found that the model used can have good accuracy if the dataset used is balanced between labels and there is no overfitting on the labels. Keywords: Hate Speech, Machine Learning, KNN, Naive Bayes Abstrak—Hate speech atau ujaran kebencian sudah memberikan banyak dampak yang negatif di Indonesia seperti kerusuhan, pertengkaran fisik maupun verbal, perpecahan di masyarakat, dan masih banyak lagi. Sosial media menjadi tempat untuk menyebarkan hate speech paling cepat. Tidak hanya melalui postingan teks, cukup sering juga ditemukan hate speech berbentuk video. Dalam penelitian ini, peneliti akan membuat model yang menerapkan model machine learning untuk mendeteksi adanya hate speech dalam video dimana saat ini kebanyakan model machine learning digunakan untuk mendeteksi hate speech dalam bentuk teks saja. Dalam penerapannya, model akan mengubah video yang diinput menjadi teks menggunakan Google API. Kemudian klasifikasi akan dilakukan menggunakan KNN untuk mengklasifikasikan apakah video hate speech atau bukan, dan naive bayes untuk mengklasifikasikan konteks dari video. Pada dataset yang tidak seimbang hasil klasifikasi yang didapatkan pada klasifikasi hate speech adalah 74% dan klasifikasi konteks video didapatkan akurasi sebesar 45%. Pada dataset yang seimbang namun terjadi overfitting akurasi yang didapatkan pada klasifikasi hate speech adalah 93% dan pada klasifikasi konteks video didapatkan akurasi 55%. Berdasarkan hasil uji coba didapatkan bahwa model yang digunakan dapat memiliki akurasi yang baik apabila dataset yang digunakan seimbang antar label dan tidak ada overfitting pada label. Kata kunci: hate speech, machine learning, knn, naive bayes