Cyberbullying saat ini dipandang sebagai salah satu persoalan serius dalam lingkungan, khususnya Tiktok, karena berpotensi menimbulkan dampak negatif terhadap kondisi psikologis dan kenyamanan pengguna. Sifat komentar yang pendek, tidak baku, serta bergantung konteks menyebabkan pendekatan klasifikasi yang hanya mengandalkan fitur leksikal sederhana belum mampu memahami makna secara utuh. Berdasarkan permasalahan tersebut, penelitian ini berfokus pada upaya merepresentasikan konteks semantik komentar berbahasa Indonesia secara lebih efektif untuk meningkatkan ketepatan deteksi cyberbullying. Tujuan penelitian adalah menganalisis efektivitas pendekatan representasi semantik berbasis konteks menggunakan model hybrid dalam mendeteksi komentar cyberbullying pada TikTok. Metode yang diusulkan mengombinasikan IndoBERT sebagai feature extractor untuk menghasilkan vektor representasi semantik dan algoritma K-Nearest Neighbor (KNN) sebagai klasifier berdasarkan kedekatan fitur. Data yang digunakan berupa komentar TikTok berbahasa Indonesia yang telah dilabeli sebagai cyberbullying dan non-cyberbullying. Hasil pengujian menunjukkan bahwa representasi semantik berbasis IndoBERT mampu mendukung kinerja klasifikasi KNN secara efektif dan menghasilkan performa deteksi yang stabil. Model hybrid ini mencapai nilai akurasi sebesar 81% yang mengindikasikan kemampuan model dalam membedakan komentar bullying dan non-bullying secara efektif. Secara keseluruhan, penelitian ini membuktikan bahwa integrasi representasi semantik berbasis konteks dan klasifikasi berbasis kedekatan vektor berpotensi menjadi solusi yang relevan dan adaptif untuk deteksi cyberbullying berbasis teks pada platform TikTok.
Copyrights © 2026