Information Technology Education Journal
Vol. 3, No. 3, September (2024)

Integrasi Tf-Idf Dan Algoritma Cosine Similarity Untuk Deteksi Tingkat Kemiripan Judul Penelitian (Studi Kasus Mahasiswa Fakultas Ilmu Komputer UNISAN Gorontalo)

Nasrullah, Asmaul Husnah (Unknown)



Article Info

Publish Date
05 Dec 2024

Abstract

Penjiplakan atau plagiarisme masih sering terjadi, terutama dalam dunia akademik. Penjiplakan banyak dilakukan terutama saat menyelesaikan tugas akhir atau skripsi. Untuk menghindari kegiatan plagiat perlu dilakukan dengan mendeteksi kemiripan atau kesamaan judul TA. Deteksi Similaritas dilakukan untuk memeriksa kesamaan dokumen dengan dokumen lain. Salah satu solusi untuk memeriksa / mendeteksi kemiripan dokumen secara cepat dan tepat adalah dengan penerapan algoritma Cosine Similarity dan pembobotan TF-IDF. Penelitian ini bertujuan untuk mengetahui kinerja dari algoritma Cosine Similarity dalam mendeteksi tingkat kemiripan tugas akhir atau penelitian. Dengan memanfaatkan preprocessing teks yang terdiri dari case folding, tokenizing, stopword removal, dan stemming yang selanjutnya dilakukan perhitungan pembobotan TF-IDF dan nilai kemiripan menggunakan cosine similarity sehingga mendapatkan nilai persentase kemiripan. Hasil dari percobaan pada penelitian ini adalah berupa tingkat kemiripan dari judul tugas akhir yang dibandingkan, dengan pengujian confusion matrix diperoleh nilai accuracy memliki rata-rata sebesar 89.7%, precision 72.4%, dan recall 94.6%.

Copyrights © 2024






Journal Info

Abbrev

INTEC

Publisher

Subject

Computer Science & IT Education

Description

INTEC Journal is published by the Informatics and Computer Engineering Education Study Program at Makassar State University. INTEC Journal is published periodically three times a year, containing articles on research results and / or critical studies in the field of Informatics and Computer ...