Tingginya aktivitas di media sosial diikuti dengan meningkatnya kasus cyberbullying yang meresahkan masyarakat, terutama di kalangan selebriti. Penelitian ini bertujuan untuk membandingkan performa algoritma Naïve Bayes dan Support Vector Machine (SVM) dalam mengklasifikasi kalimat berbahasa Indonesia yang mengandung unsur cyberbullying. Metode yang digunakan meliputi preprocessing data (tokenization, stemming, dan stopwords removal), serta ekstraksi fitur dengan TF-IDF dan Bag of Words. Dataset berjumlah 650 komentar Twitter berlabel dari situs Kaggle yang bisa diakses pada tautan sebagai berikut: https://www.kaggle.com/datasets/markini/cyberbullying-twitter-bahasa-indonesia. Hasil eksperimen menunjukkan bahwa SVM mencapai akurasi 88 persen, lebih tinggi dibandingkan Naïve Bayes yang mencapai 82. Evaluasi juga dilakukan berdasarkan metrik precision, recall, dan F1-score. Penelitian ini memberikan kontribusi terhadap pengembangan sistem deteksi otomatis cyberbullying berbasis NLP, serta implikasi praktis dalam membantu moderasi konten media sosial secara lebih akurat dan efisien.
Copyrights © 2025