Penyebaran iklan judi online di Indonesia terus meningkat meskipun berbagai upaya pemblokiran telah dilakukan. Iklan-iklan ini menyebar luas melalui media sosial dan situs daring, sehingga dibutuhkan sistem otomatis yang mampu menyaring konten iklan judi secara efektif. Penelitian ini mengusulkan pendekatan deteksi anomali satu kelas (one-class anomaly detection) sebagai metode penyaringan awal berbasis pembelajaran hanya dari data teks judi. Untuk merepresentasikan teks, digunakan contextual embedding IndoBERT yang menghasilkan vektor fitur berdimensi 768. Selanjutnya, dilakukan analisis komparatif terhadap tiga algoritma deteksi anomali: One-Class SVM, Isolation Forest, dan Autoencoder. Pengujian dilakukan dalam dua skenario: data seimbang dan tidak seimbang. Pada skenario seimbang, OCSVM menunjukkan performa terbaik dengan F1-score mencapai 91%. Sementara itu, dalam skenario tidak seimbang yang meniru kondisi dunia nyata, model Autoencoder mendapatkan recall terbaik mencapai 94% dengan jumlah false positive yang sangat rendah. Hasil ini menunjukkan bahwa Autoencoder layak direkomendasikan sebagai sistem penyaringan awal sebelum proses klasifikasi lanjutan atau validasi manual dilakukan.
Copyrights © 2025