Plagiarism merupakan tindakan menjiplak karya orang lain dan mengakui sebagai hasil karya pribadinya. Pada penelitian ini melakukan pendeteksian similaritas dari dokumen dengan menghitung similaritas dokumen menggunakan algoritma Ratcliff/Obershelp. Tipe dokumen yang diuji adalah .pdf. Dokumen yang digunakan untuk perbandingan teks ini adalah dokumen yang berbahasa Indonesia. Tahapan preprocessing pada penelitian ini dilakukan dengan menghitung nilai similaritas yang terdiri dari case folding, tokenisasi, filtering, dan stemming. Setelah proses preprocessing maka tahap selanjutnya adalah dilakukan perhitungan menggunakan algoritma Ratcliff/Obershelp. Pada pengujian menggunakan 150 data dokumen yang akan dihitung nilai similaritasnya menggunakan algoritma Ratcliff/Obershelp menghasilkan nilai similaritas dokumen dengan tingkat kemiripan berdasarkan tiga kategori (tinggi, sedang dan rendah). Hasil deteksi similaritas pada penelitian ini diharapkan dapat membantu proses pengerjaan pendeteksian perbandingan dua buah dokumen dalam jumlah yang sangat banyak.
Copyrights © 2024