Sebatik
Vol 25 No 1 (2021): Juni 2021

APLIKASI PENDETEKSI KESAMAAN DOKUMEN DENGAN MENGGUNAKAN ALGORITMA JARAK JARO WINKLER DAN LEVENSHTEIN

Ravi Ahmad Salim (Teknik Informatika, Universitas Gunadarma)
M Ridwan Dwi Septian (Teknik Informatika, Universitas Gunadarma)
Suhartini Suhartini (Sistem Komputer, Universitas Gunadarma)
Dyah Anggraini (Sistem Informasi, Universitas Gunadarma)
Qomariyah Qomariyah (Sistem Informasi, Universitas Gunadarma)



Article Info

Publish Date
01 Jun 2021

Abstract

Peranan teknologi di era revolusi 4.0 membuat penggunaan teknologi informasi dan komunikasi semakin luas. Peranan ini juga mencakup segala bidang, salah satunya untuk mempermudah pengguna dalam mendapatkan informasi yang tersedia secara bebas dan tanpa biaya. Akan tetapi hal ini memungkinkan terjadinya pengambilan informasi tertulis (karya tulis, penulisan ilmiah, dokumen dan lain sebagainya) tanpa mencantumkan referensi (menjiplak) yang biasa dikenal sebagai tindakan plagiarism. Teknologi informasi pengukur tingkat plagiat suatu dokumen teks berhubungan dengan pencarian informasi dari data yang ada. Dokumen teks merupakan sesuatu yang tertulis atau tercetak yang dapat digunakan sebagai keterangan. Untuk membuat suatu informasi tertentu dibutuhkan waktu yang lama untuk memproses hasil kemiripan dari seluruh isi dokumen teks. Pemrosesan text mining menggunakan beberapa algoritma. Salah satunya adalah algoritma Jarak Jaro Winkler dan Jarak Levenshtein . Jarak Jaro Winkler adalah sebuah algoritma menghitung panjang kata dalam dokumen, kata yang sama, dan jumlah transposisi. Sedangkan algoritma Jarak Levenshtein digunakan untuk menghitung jarak yang dibutuhkan untuk mengubah satu kata menjadi kata lain. Untuk itu dibuat aplikasi pendeteksi untuk melihat kemiripan dokumen teks dengan menerapkan Algoritma jarak Jaro Winkler dan jarak Levenshtein. Kedua algoritma ini diimplementasikan dan menampilkan hasil dari perhitungan antara Jaro Winkler dan jarak Levenshtein dalam sebuah aplikasi. Dengan melihat perbandingan kedua algoritma ini pengguna dapat mengetahui algoritma mana yang akan menghasilkan keluaran yang lebih baik jika dibandingkan dengan pencarian kemiripan secara manual.

Copyrights © 2021






Journal Info

Abbrev

sebatik

Publisher

Subject

Computer Science & IT

Description

SEBATIK merupakan jurnal kumpulan artikel hasil penelitian, karya ilmiah, maupun program pengabdian masyarakat dari seluruh civitas akademik di Indonesia dalam rangka mengitegrasikan informasi. SEBATIK menyediakan layanan publikasi terbuka untuk semua kalangan umum, baik di semua lingkungan ...