Perkembangan teknologi telah membawa perubahan besar dalam kehidupan masyarakat. Salah satunya akses terhadap berita dan artikel yang semakin mudah, dan bebas. Namun, fenomena ini juga memunculkan permasalahan serius, yaitu penyebaran berita hoaks yang sangat cepat dan masif. Penelitian ini bertujuan untuk mengekstraksi informasi penting dari artikel hoaks yang dipublikasikan di situs TurnBackHoax.id menggunakan pendekatan text mining berbasis TF-IDF dan cosine similarity. Data artikel hoaks diperoleh melalui teknik web scraping dengan pustaka Python seperti requests dan BeautifulSoup, diikuti oleh tahap prapemrosesan teks yang meliputi case folding, penghapusan tanda baca, angka, serta stopwords, dan stemming. Teks yang telah diproses kemudian direpresentasikan dalam bentuk vektor numerik menggunakan metode TF-IDF untuk menentukan bobot kata berdasarkan frekuensi dan kelangkaannya dalam korpus. Selanjutnya, cosine similarity digunakan untuk mengukur tingkat kemiripan antar dokumen, sementara kata kunci diekstraksi berdasarkan bobot TF-IDF tertinggi. Visualisasi Word Cloud juga diterapkan untuk menggambarkan kata-kata dominan secara visual. Berdasarkan hasil evaluasi, metode yang digunakan dalam penelitian ini berhasil mencapai tingkat ketepatan sebesar 93,15%, menunjukkan efektivitas pendekatan TF-IDF dan Cosine Similarity dalam menganalisis dan mengelompokkan artikel hoaks. Hasil penelitian menunjukkan bahwa pendekatan ini efektif dalam mengidentifikasi kata kunci penting dan mengelompokkan artikel hoaks berdasarkan kemiripan konten. Kata kunci : Cosine Similarity,Hoaks,Text Mining, TF-IDF, kata kunci