Ong, Jesen
Unknown Affiliation

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

EKSTRAKSI BERITA HOAX PADA TURN BACK HOAX BERBASIS PENDEKATAN TF-IDF & COSINE SIMILARITY HIDAYAT, WILLIAM; Ong, Jesen; Muhdhor, Umar; Irsyad, Hafiz; Rahman, Abdul
Computing Insight : Journal of Computer Science Vol 7 No 2 (2025)
Publisher : Universitas Muhammadiyah Surabaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30651/comp_insight.v7i2.26678

Abstract

Perkembangan teknologi telah membawa perubahan besar dalam kehidupan masyarakat. Salah satunya akses terhadap berita dan artikel yang semakin mudah, dan bebas. Namun, fenomena ini juga memunculkan permasalahan serius, yaitu penyebaran berita hoaks yang sangat cepat dan masif. Penelitian ini bertujuan untuk mengekstraksi informasi penting dari artikel hoaks yang dipublikasikan di situs TurnBackHoax.id menggunakan pendekatan text mining berbasis TF-IDF dan cosine similarity. Data artikel hoaks diperoleh melalui teknik web scraping dengan pustaka Python seperti requests dan BeautifulSoup, diikuti oleh tahap prapemrosesan teks yang meliputi case folding, penghapusan tanda baca, angka, serta stopwords, dan stemming. Teks yang telah diproses kemudian direpresentasikan dalam bentuk vektor numerik menggunakan metode TF-IDF untuk menentukan bobot kata berdasarkan frekuensi dan kelangkaannya dalam korpus. Selanjutnya, cosine similarity digunakan untuk mengukur tingkat kemiripan antar dokumen, sementara kata kunci diekstraksi berdasarkan bobot TF-IDF tertinggi. Visualisasi Word Cloud juga diterapkan untuk menggambarkan kata-kata dominan secara visual. Berdasarkan hasil evaluasi, metode yang digunakan dalam penelitian ini berhasil mencapai tingkat ketepatan sebesar 93,15%, menunjukkan efektivitas pendekatan TF-IDF dan Cosine Similarity dalam menganalisis dan mengelompokkan artikel hoaks. Hasil penelitian menunjukkan bahwa pendekatan ini efektif dalam mengidentifikasi kata kunci penting dan mengelompokkan artikel hoaks berdasarkan kemiripan konten. Kata kunci : Cosine Similarity,Hoaks,Text Mining, TF-IDF, kata kunci