Konten radikalisme Islam dalam konteks prosedural merujuk pada konten yang memprovokasi kekerasan, menyebarkan kebencian, dan menentang nasionalisme melalui dakwah Islam di situs web Indonesia. Definisi radikalisme berbeda di setiap negara, dan di Indonesia, radikalisme diidentifikasi dengan isu provokasi serta kebencian terhadap SARA (Suku, Agama, Ras, Antargolongan). Deteksi konten SARA sangat menantang karena jumlahnya yang besar, sistem yang tidak terstruktur, dan banyaknya gangguan yang disebabkan oleh beragam interpretasi. Masalah ini dapat mengancam persatuan dan keharmonisan agama di Indonesia. Berdasarkan kondisi ini, diperlukan sistem untuk membedakan apakah suatu konten bersifat radikal atau tidak. Kami mengusulkan pendekatan text mining menggunakan ambang DF dan ekstraksi fitur berbasis otak manusia. Sistem ini terdiri dari beberapa langkah, termasuk pengumpulan data, pra-pemrosesan, text mining, seleksi fitur, klasifikasi untuk pengelompokan data berdasarkan label kelas, perhitungan kesamaan untuk pemrosesan data pelatihan, dan visualisasi untuk menentukan apakah konten tersebut radikal atau tidak. Penelitian ini diharapkan dapat memberikan literasi kepada pengguna yang mengakses situs web yang terpapar paham radikal, sehingga dapat menekan penyebaran provokasi di situs web di Indonesia. Hasil eksperimen menunjukkan bahwa kombinasi validasi silang 10 kali lipat dan metode k-Nearest Neighbor (kNN) sebagai metode klasifikasi mencapai akurasi sebesar 66,37% dengan nilai k sebesar 7, berdasarkan data yang dikumpulkan menggunakan web scrapping dari situs yang diblokir oleh Kementerian Komunikasi dan Informatika Indonesia (Menkominfo).
Copyrights © 2024