Penjiplakan atau plagiarisme masih sering terjadi, terutama dalam dunia akademik. Penjiplakan banyak dilakukan terutama saat menyelesaikan tugas akhir atau skripsi. Untuk menghindari kegiatan plagiat perlu dilakukan dengan mendeteksi kemiripan atau kesamaan judul TA. Deteksi Similaritas dilakukan untuk memeriksa kesamaan dokumen dengan dokumen lain. Salah satu solusi untuk memeriksa / mendeteksi kemiripan dokumen secara cepat dan tepat adalah dengan penerapan algoritma Cosine Similarity dan pembobotan TF-IDF. Penelitian ini bertujuan untuk mengetahui kinerja dari algoritma Cosine Similarity dalam mendeteksi tingkat kemiripan tugas akhir atau penelitian. Dengan memanfaatkan preprocessing teks yang terdiri dari case folding, tokenizing, stopword removal, dan stemming yang selanjutnya dilakukan perhitungan pembobotan TF-IDF dan nilai kemiripan menggunakan cosine similarity sehingga mendapatkan nilai persentase kemiripan. Hasil dari percobaan pada penelitian ini adalah berupa tingkat kemiripan dari judul tugas akhir yang dibandingkan, dengan pengujian confusion matrix diperoleh nilai accuracy memliki rata-rata sebesar 89.7%, precision 72.4%, dan recall 94.6%.
Copyrights © 2024