Garuda - Garba Rujukan Digital

Article Per Year (5 Year)

p-Index From 2021 - 2026

P-Index

This Author published in this journals

All Journal LOGIK@

B. P. Pratama

Program Studi Matematika Fakultas Sains dan Teknologi UIN Syarif Hidayatullah Jakarta

Author-ID : 2589225

Computer Science & IT Mathematics

Published : 1 Documents Claim Missing Document

Claim Missing Document

Articles

ANALISIS KINERJA ALGORITMA LEVENSHTEIN DISTANCE DALAM MENDETEKSI KEMIRIPAN DOKUMEN TEKS B. P. Pratama; S. A. Pamungkas
LOGIK@ Vol 6, No 2 (2016)
Publisher : Universitas Islam Negeri Syarif Hidayatullah Jakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (790.599 KB)

Akhir-akhir ini, plagiarisme pada dokumen teks merupakan salah satu permasalahan akademik yang semakin meningkat. Secara umum, tindak plagiarisme dilakukan dengan mengubah struktur kata dalam kalimat dan struktur kalimat dalam paragraf, serta melakukan penyisipan, penghapusan, atau penggantian kata. Pada penelitian ini, dibangun sebuah sistem yang mampu mendeteksi tingkat kemiripan antar dokumen teks menggunakan algoritma Levenshtein distance dengan menambahkan proses case folding, tokenizing, stopword removal, stemming, dan sorting. Proses pencocokan string pada algoritma ini dapat menghasilkan nilai distance yang menjadi penentu persentase bobot similarity. Analisa penggunaan stopword removal, stemming, dan sorting dilakukan untuk melihat pengaruhnya terhadap kinerja algoritma Levenshtein distance. Simulasi algoritma ini dilakukan terhadap dua data set dan satu data real. Pada data set 1 dilakukan pengubahan struktur kata dalam kalimat, pada data set 2 pengubahan struktur kalimat dalam paragraf, dan pada data real tidak dilakukan pengubahan apapun karena data real merupakan dokumen abstrak dari jurnal penelitian. Hasil simulasi menunjukkan bahwa penggunaan sorting sangat berpengaruh bagi algoritma Levenshtein distance. Hasil terbaik pada data set 1 ditunjukan pada proses yang menggunakan stopword removal, stemming, dan sorting sekaligus. Hasil terbaik pada data set 2 diperlihatkan pada proses yang menggunakan stopword dan stemming yang digabungkan dengan sorting. Hasil terbaik pada data real diperlihatkan pada proses stemming-sorting.

Co-Authors S. A. Pamungkas

Title

Found 1 Documents
Search

Abstract

Title Search

Found 1 Documents Search

Abstract

Title

Found 1 Documents
Search