Penyebaran spam judi online ilegal di kolom komentar YouTube telah menjadi masalah serius yang sulit diatasi oleh filter konvensional. Penelitian ini bertujuan untuk membangun sebuah sistem deteksi otomatis yang efektif menggunakan machine learning. Metode yang diusulkan menerapkan algoritma Random Forest dengan pendekatan Hybrid Feature Engineering yang inovatif. Pendekatan ini tidak hanya menganalisis fitur leksikal dari teks menggunakan TF-IDF, tetapi juga mengekstrak 11 fitur anomali dan perilaku untuk menangkap taktik penyamaran spammer. Untuk mengatasi masalah ketidakseimbangan kelas pada dataset yang terdiri dari 2.708 komentar berlabel manual, teknik SMOTE diterapkan pada data latih. Hasil evaluasi model pada data uji menunjukkan performa yang sangat tinggi, dengan akurasi mencapai 94.65% dan F1-Score sebesar 0.89 untuk kelas "Judol". Analisis feature importance mengonfirmasi bahwa fitur rekayasa anomali, seperti pola merek-angka, secara signifikan berkontribusi pada keberhasilan model. Penelitian ini membuktikan bahwa pendekatan hibrida mampu menciptakan model klasifikasi yang robust dan akurat untuk memerangi konten promosi judi online
Copyrights © 2025