Claim Missing Document
Check
Articles

Found 1 Documents
Search

SISTEM KLASIFIKASI KOMENTAR MEDIA SOSIAL UNTUK DETEKSI DINI CYBERBULLYING MENGGUNAKAN TF-IDF DAN SUPPORT VECTOR MACHINE Okta Vianda, Famela; Profesio Putra, Fajri
Jurnal INSTEK (Informatika Sains dan Teknologi) Vol 11 No 1 (2026): APRIL
Publisher : Department of Informatics Engineering, Faculty of Science and Technology, Universitas Islam Negeri Alauddin, Makassar, Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.24252/instek.v11i1.66745

Abstract

Cyberbullying merupakan permasalahan yang terus meningkat pada berbagai platform media sosial, khususnya pada kolom komentar yang ditandai dengan penggunaan bahasa informal, singkatan, dan istilah slang yang beragam. Kondisi ini menyebabkan proses identifikasi komentar bermuatan perundungan menjadi kompleks dan kurang efektif jika dilakukan secara manual. Selain itu, metode klasifikasi berbasis deep learning yang memiliki akurasi tinggi umumnya membutuhkan sumber daya komputasi yang besar, sehingga kurang efisien untuk implementasi deteksi dini secara otomatis. Oleh karena itu, penelitian ini mengusulkan pendekatan berbasis machine learning menggunakan Support Vector Machine (SVM) dengan representasi fitur Term Frequency–Inverse Document Frequency (TF-IDF). Dataset yang digunakan terdiri dari 8.000 komentar berbahasa Indonesia yang diperoleh dari platform YouTube dan TikTok, sehingga merepresentasikan lingkungan multiplatform dengan variasi bahasa yang tinggi. Tahapan pengolahan data meliputi preprocessing teks (cleaning, normalisasi, tokenisasi, filtering, dan stemming), ekstraksi fitur menggunakan TF-IDF, serta klasifikasi menggunakan SVM dengan kernel linear. Model dievaluasi menggunakan skema pembagian data 70:30 dengan metrik accuracy, precision, recall, dan F1-score. Hasil pengujian menunjukkan bahwa model mencapai akurasi sebesar 80,75%, precision 83% pada kelas cyberbullying, serta F1-score sebesar 0,81. Hasil ini menunjukkan bahwa SVM mampu memberikan performa yang stabil dalam menangani data teks berdimensi tinggi dengan kompleksitas bahasa yang beragam. Kontribusi utama penelitian ini terletak pada penggunaan dataset multiplatform berbahasa Indonesia serta evaluasi efektivitas SVM dalam mendukung sistem deteksi dini cyberbullying yang efisien secara komputasi.