Claim Missing Document
Check
Articles

Found 1 Documents
Search

Analisis Sentimen untuk Deteksi Penipuan pada Twitter Menggunakan TF-IDF dan Naive Bayes Meyda, Najwa; Akbar, Muhammad Tafarel; Nurdin, Muhamad; Surya, Septian Handita; Ibad, Alghozi Irsyadul; Nursodiq, Ahmad
RIGGS: Journal of Artificial Intelligence and Digital Business Vol. 5 No. 1 (2026): Februari - April
Publisher : Prodi Bisnis Digital Universitas Pahlawan Tuanku Tambusai

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.31004/riggs.v5i1.4991

Abstract

Penipuan digital melalui media sosial, khususnya Twitter, semakin marak dan menimbulkan kerugian bagi masyarakat. Penelitian ini bertujuan untuk menganalisis sentimen dan mendeteksi konten penipuan pada tweet berbahasa Indonesia menggunakan pendekatan pembelajaran mesin. Dataset diperoleh dari Twitter pada periode 2022–2025 dengan proses pengambilan data berdasarkan kata kunci terkait penipuan digital. Sebanyak 2.593 tweet digunakan setelah melalui proses pembersihan dan penghapusan duplikasi, dengan distribusi 1.829 tweet non-penipuan dan 764 tweet penipuan. Data kemudian dilabeli secara manual menjadi dua kelas, yaitu penipuan dan non-penipuan. Tahapan praproses meliputi pembersihan teks, tokenisasi, stemming menggunakan Sastrawi Stemmer, filtering stopword, dan normalisasi huruf. Ekstraksi fitur dilakukan menggunakan metode Term Frequency–Inverse Document Frequency (TF-IDF) dengan konfigurasi unigram dan bigram. Model klasifikasi utama dibangun menggunakan algoritma Multinomial Naive Bayes dengan penanganan ketidakseimbangan kelas melalui pembobotan sampel (sample weight). Sebagai pembanding, dilakukan pula eksperimen menggunakan algoritma Decision Tree dengan pengaturan class weight balanced. Hasil pengujian menunjukkan bahwa model Naive Bayes mencapai akurasi sebesar 87,09% dengan recall kelas penipuan sebesar 94,12%, yang menunjukkan kemampuan model dalam mendeteksi tweet penipuan secara efektif. Model Decision Tree menghasilkan akurasi lebih tinggi sebesar 96,53% dengan recall penipuan 92,81%. Analisis fitur menunjukkan bahwa kata-kata seperti “tipu”, “scam”, “modus”, dan “deepfake” memiliki pengaruh kuat dalam klasifikasi penipuan. Penelitian ini diharapkan dapat menjadi dasar pengembangan sistem deteksi penipuan berbasis teks pada media sosial.