JIPI (Jurnal Ilmiah Penelitian dan Pembelajaran Informatika)
Vol 9, No 3 (2024)

Penerapan Algoritma Boyer Moore yang di Modifikasi untuk stemmer Bahasa Indonesia

Kasim, Rafli Junaidi (Unknown)
Utami, Ema (Unknown)



Article Info

Publish Date
22 Aug 2024

Abstract

Proses stemming dalam Natural Language Processing (NLP) adalah tahap penting dalam pra-pemrosesan data untuk mengurai bentuk kata menjadi kata dasar. Dalam konteks bahasa Indonesia, proses ini melibatkan penghapusan imbuhan untuk menemukan kata dasar. Beberapa metode stemming yang umum digunakan termasuk Porter stemmer, Lancaster stemmer, Snowball stemmer, dan Nazief Andriani stemmer. Meskipun banyak penelitian telah dilakukan untuk meningkatkan akurasi stemming, penelitian ini menyoroti peran algoritma string matching, terutama algoritma Boyer Moore, dalam mencocokkan hasil stemming dengan kamus kata. Namun, implementasi langsung algoritma Boyer Moore menghadapi kendala karena mencocokkan pattern pada seluruh teks, yang harusnya hanya pada bagian kanan kata. Oleh karena itu, algoritma ini dimodifikasi agar sesuai dengan kebutuhan dan tetap mempertahankan kinerjanya. Studi terdahulu menunjukkan bahwa algoritma Boyer Moore memiliki kinerja yang lebih cepat dibandingkan dengan beberapa algoritma string matching lainnya seperti Knuth Morris Pratt, Brute Force, dan Rabin Karp. Hasil penelitian ini berhasil mencapai tingkat akurasi sebesar 95,2% dari total 500 kata yang diproses. Hasil dari penilitian ini juga menunjukan kesalahan stemming yang terjadi hanya diakibatkan dari understemming dan beberapa yang kata tidak ter-stemming.

Copyrights © 2024






Journal Info

Abbrev

Publisher

Subject

Computer Science & IT Education

Description

JIPI (Jurnal Ilmiah Penelitian dan Pembelajaran Informatika) e-ISSN: 2540 - 8984 was made to accommodate the results of scientific work in the form of research or papers are made in the form of journals, particularly the field of Information Technology. JIPI is a journal that is managed by the ...