Sains Data Jurnal Studi Matematika dan Teknologi
Vol 2, No 2: July-December 2024

Deteksi Kemiripan Dokumen Abstrak Skripsi menggunakan Metode Jaro-Winkler Distance dan Synonym Recognition

Muhammad Syahrullah (Universitas Trunojoyo Madura)
Fika Hastarita Rachman (Universitas Trunojoyo Madura)
Ika Oktavia Suzanti (Universitas Trunojoyo Madura)



Article Info

Publish Date
30 Dec 2024

Abstract

Natural Language Processing (NLP) terus berkembang hingga saat ini. Dalam 10 tahun terakhir, NLP berkembang pesat seiring meningkatnya ketersediaan teks elektronik saat ini. Salah satu contoh aplikasi yang mengimplementasikan pendekatan NLP adalah Similarity Detection atau deteksi kemiripan. Deteksi kemiripan digunakan untuk mengetahui seberapa mirip dokumen teks satu dengan lainnya. Dokumen teks merupakan sebuah tulisan yang tercetak yang bertujuan untuk menerangkan atau memberikan sebuah informasi tertentu. Pada penelitian ini, metode Jaro-Winkler Distance dikombinasikan dengan Synonym Recognition untuk mendeteksi nilai persentase kemiripan dari dokumen abstrak skripsi. Abstrak skripsi yang digunakan adalah abstrak skripsi dari Program Studi Infromatika Fakultas Teknik Universitas Trunojoyo Madura dengan jumlah 110 abstrak. Dari uji coba yang telah dilakukan, diperoleh hasil bahwa dengan menggunakan kombinasi metode Jaro-Winkler Distance dengan Synonym Recognition dinilai kurang efektif karena score yang dihasilkan lebih rendah. Uji coba dilakukan menggunakan data sintetis potongan dan data sintetis gabungan. Tujuan dari dibuatnya data sintetis untuk menjadi ground truth atau acuan peneliti terhadap nilai similarity yang asli dari query yaitu agar dapat menghasilkan nilai Error Rate dari kinerja metode Jaro-Winkler Distance dan Synonym Recognition. Error Rate yang diperoleh tanpa menggunakan Synonym Recognition memiliki nilai sebesar 0.005511, sedangkan menggunakan Synonym Recognition diperoleh nilai sebesar 0.0397.

Copyrights © 2024






Journal Info

Abbrev

sainsdata

Publisher

Subject

Computer Science & IT Electrical & Electronics Engineering Engineering Mathematics Physics

Description

Sains Data Jurnal Studi Matematika dan Teknologi, published by the STAI Nurul Islam Mojokerto. Its a biannual refereed journal concerned with the practice and processes of mathematics and technologies. It provides a forum for academics, practitioners and community representatives to explore issues ...