Penyebaran komentar spam perjudian daring di YouTube semakin meningkat dan mengganggu pengalaman pengguna. Komentar-komentar ini sering kali menggunakan pola bahasa tertentu, seperti simbol dan variasi kata, untuk menghindari deteksi otomatis. Meskipun YouTube telah menerapkan sistem filter spam, banyak komentar masih lolos deteksi, yang menunjukkan perlunya metode yang lebih akurat dan adaptif. Penelitian ini bertujuan untuk menganalisis pola bahasa dalam komentar spam perjudian daring dan mengembangkan model deteksi berbasis pembelajaran mesin menggunakan K-Nearest Neighbors (KNN) dan Naïve Bayes (NB). Dataset dikumpulkan menggunakan YouTube Data API v3, diproses melalui tahapan normalisasi, cleaning, analisis statistik, visualisasi, dan pelabelan sebelum diterapkan pada pemodelan pembelajaran mesin. Fitur teks diekstraksi menggunakan Term Frequency-Inverse Document Frequency (TF-IDF) dan Bag of Words (BoW), dengan pengoptimalan hiperparameter dilakukan menggunakan GridSearchCV untuk meningkatkan kinerja model. Evaluasi model didasarkan pada metrik accuracy dan F1-Score. Hasilnya menunjukkan bahwa model Naïve Bayes dengan TF-IDF mencapai kinerja tertinggi, dengan akurasi 99% setelah normalisasi dan 98% setelah cleaning, mengungguli Naïve Bayes dengan BoW dan KNN. Temuan ini berkontribusi pada pengembangan sistem deteksi spam yang lebih efektif, khususnya dalam mengidentifikasi pola bahasa tertentu yang digunakan dalam komentar spam perjudian di YouTube. Dengan pendekatan ini, diharapkan dapat dikembangkan sistem moderasi otomatis yang lebih efisien untuk menyaring komentar spam dan meningkatkan kualitas interaksi pengguna di platform YouTube.
Copyrights © 2026