Perkembangan pesat data digital menuntut metode cerdas untuk mengelompokkan teks secara otomatis dan akurat. Salah satu pendekatan yang menjanjikan adalah memadukan representasi kata berbasis word embedding dengan model deep learning yang mampu memahami konteks urutan kata. Mengkaji klasifikasi teks dengan menggabungkan fitur ekstraksi GloVe dan algoritma Long Short-Term Memory (LSTM) untuk mengelompokkan dokumen berita dari dataset 20 Newsgroups. Teks terlebih dahulu melalui pra-pemrosesan pembersihan tanda baca, case folding, penghapusan stopword, tokenisasi, dan stemming lalu setiap kata direpresentasikan sebagai vektor berdimensi tetap menggunakan model GloVe yang mampu menangkap makna dan hubungan semantik secara global. Vektor ini menjadi masukan jaringan LSTM yang belajar mengenali pola urutan kata dan konteks topik. Evaluasi dengan metrik akurasi, presisi, recall, dan F1-score menunjukkan kinerja tinggi: akurasi 0,9562, presisi 0,9701, recall 0,9485, dan F1-score 0,9701. Hasil ini menegaskan bahwa kombinasi GloVe dan LSTM efektif serta kompetitif, mampu menghasilkan klasifikasi teks yang presisi dan seimbang, sehingga layak diterapkan pada berbagai aplikasi pemrosesan bahasa alami yang memerlukan pengelompokan dokumen secara otomatis dan akurat.
Copyrights © 2025