Intan Juwita
Teknik Komputer; Universitas Islam 45

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Algoritma Stemming Sebagai Pra-Proses Pengecekan Kemiripan Naskah Rahmadya Trias Handayanto; Ahmad Wafiq Amrillah; Intan Juwita; Muhammad Arifin; Setiaji Setiaji; Reyvan Karani
Bahasa Indonesia Vol 5 No 2 (2018): Bina Insani ICT Journal (Desember 2018)
Publisher : Lembaga Penelitian dan Pengabdian Masyarakat Universitas Bina Insani

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (536.368 KB)

Abstract

Abstrak: Proses pencarian kata dasar dari suatu kata dalam Bahasa Indonesia lebih sulit dari pada bahasa Inggris. Proses yang dikenal dengan istilah stemming itu membutuhkan algoritma tertentu dalam mencari kata dasar suatu kata. Berbeda dengan bahasa Inggris yang hanya mengenal akhiran, dalam Bahasa Indonesia dikenal awalan, akhiran dan sisipan sehingga proses stemming jauh lebih rumit. Beberapa algoritma stemming untuk Bahasa Indonesia telah banyak diterapkan untuk proses temu kembali. Penelitian ini mencoba menerapkan algoritma stemming untuk mengecek kemiripan naskah berdasarkan kata dasarnya. Selain itu sebuah aplikasi sederhana dibuat untuk menguji akurasi proses stemming yang diusulkan. Kata kunci: kata dasar, kemiripan naskah, Matlab, pemrosesan teks, temu kembali. Abstract: Searching a root of word in Indonesian is more difficult that English. This process, which is called stemming, need specific algorithms in finding the root. Whereas in English usually the roots are found by separating the suffixes, in Indonesia are found by separating preffixes, suffixes, and inffixes as well, so it adds the complexity of stemming process. Many stemming algorithms have been proposed in information retrieval, but in this study, the stemming was also used for similarity check of papers. In addition, a prototype was created for checking the proposed-algorithm’s accuracy. Keywords: information retrieval, Matlab, root word, similarity, text processing.