Rolling hash digunakan untuk mengatasi masalah hash pada Rabin Karp dengan memperbaharui kemunculan string berulang dengan menghitung nilai hash dari substring, dimana nilai hash dihitung lebih cepat dengan nilai hash lama sehingga dapat dibandingkan secara konstan. Kemudian penelitian ini menambahkan k-gram untuk melakukan pergerakan dari kata satu ke kata didepannya, dengan tujuan mampu meningkatkan akurasi dengan pengechekan teks pada dokumen yang lebih spesifik. Tahapan penelitian meliputi pengumpulan dataset yang berasal dari dokumen abstrak jurnal yang kemudian dilakukan praproses mulai dari cleansing, case folding, filtering, stemming dengan stopword selanjutnya implementasi rolling hash dan k-gram pada Rabin Karp untuk meningkatkan sensifitas pada similarity check serta mengetahui peningkatan presentase ketepatan dalam mendeteksi kemiripan dokumen. Hasil penelitian Hasil pengujian menunjukan k=7 menunjukan kemiripan lebih tinggi dibanding k=5 karena penelitian ini menggunakan panjang karakter jurnal n dengan nilai kemiripan tertinggi yaitu k=7 pada dokumen jurnal 4 yaitu kemiripan abstrak 49,93% dan kemiripan judul 14,00% sedangkan untuk k=5 yaitu 12,01% kemiripan abstrak dan 4,17% kemiripan judul sehingga k-gram, basis, dan modulo berpengaruh terhadap perhitungan similarity dokumen.
Copyrights © 2024