JUSTIN (Jurnal Sistem dan Teknologi Informasi)
Vol 12, No 1 (2024)

Optimasi Rabin Karp dengan Rolling Hash dan k-Gram pada Similarity Check Dokumen Abstrak Jurnal

Yuliyanti, Siti (Unknown)
Fiitriani Dewi, Euis Nur (Unknown)
Rachman, Andi Nur (Unknown)



Article Info

Publish Date
31 Jan 2024

Abstract

Rolling hash digunakan untuk mengatasi masalah hash pada Rabin Karp dengan memperbaharui kemunculan string berulang dengan menghitung nilai hash dari substring, dimana nilai hash dihitung lebih cepat dengan nilai hash lama sehingga dapat dibandingkan secara konstan. Kemudian penelitian ini menambahkan k-gram untuk melakukan pergerakan dari kata satu ke kata didepannya, dengan tujuan mampu meningkatkan akurasi dengan pengechekan teks pada dokumen yang lebih spesifik. Tahapan penelitian meliputi pengumpulan dataset yang berasal dari dokumen abstrak jurnal yang kemudian dilakukan praproses mulai dari cleansing, case folding, filtering, stemming dengan stopword selanjutnya implementasi rolling hash dan k-gram pada Rabin Karp untuk meningkatkan sensifitas pada similarity check serta mengetahui peningkatan presentase ketepatan dalam mendeteksi kemiripan dokumen. Hasil penelitian Hasil pengujian menunjukan k=7 menunjukan kemiripan lebih tinggi dibanding k=5 karena penelitian ini menggunakan panjang karakter jurnal n dengan nilai kemiripan tertinggi yaitu k=7 pada dokumen jurnal 4 yaitu kemiripan abstrak 49,93% dan kemiripan judul 14,00% sedangkan untuk k=5 yaitu 12,01% kemiripan abstrak dan 4,17% kemiripan judul sehingga k-gram, basis, dan modulo berpengaruh terhadap perhitungan similarity dokumen.

Copyrights © 2024






Journal Info

Abbrev

justin

Publisher

Subject

Computer Science & IT

Description

JUSTIN aims to publish research results and thoughts among academics, researchers, scientists, and practitioners in the field of informatics/computer science so that they are freely available to the public, and support the exchange of knowledge. The scope of JUSTIN is but is not limited to the ...