Penelitian ini bertujuan untuk mengimplementasikan metode Term Frequency-Inverse Document Frequency (TF-IDF) dan Cosine Similarity dalam mengekstraksi kata kunci dari abstrak artikel jurnal guna mengidentifikasi topik penelitian dalam periode tertentu. Harapannya, pengguna dapat menganalisis tren topik dan memperoleh gambaran komprehensif mengenai dinamika keilmuan di bidang Teknik Informatika dan Sistem Informasi. Penelitian ini menggunakan pendekatan eksperimental kuantitatif dengan tahapan: pengumpulan data dari 11 artikel jurnal JATISI Vol 6 No. 1 (2019), pre-processing data (case folding, penghapusan tanda baca dan angka, tokenisasi, stopword removal, dan stemming), pembobotan menggunakan TF-IDF, serta pengukuran relevansi antardokumen dengan Cosine Similarity. Hasil penelitian berhasil mengekstraksi kata kunci dari dokumen dan memberikan peringkat berdasarkan persentase kemunculannya, serta menghasilkan matriks cosine similarity untuk mengidentifikasi kemiripan antartulisan. Namun, nilai presisi 0.05, recall 0.04, dan F1-score 0.04 menunjukkan bahwa model ini belum mampu memberikan prediksi yang memadai untuk kasus ini. Temuan ini dapat dijadikan acuan bahwa model/metode tersebut tidak direkomendasikan tanpa modifikasi signifikan, sekaligus menjadi dasar untuk eksplorasi solusi alternatif di masa depan.
Copyrights © 2025