Information Retrieval (IR) memiliki fungsi untuk memisahkan dokumen-dokumen yang relevan dari sekumpulan dokumen yang ada. Terdapat sebuah proses penting pada IR, yaitu stemming. Stemming adalah proses untuk mengurangi kata-kata berimbuhan menjadi bentuk kata dasar. Pada beberapa penelitian sering menggunakan stemming yang berbeda-beda, bahkan ada penelitian yang telah mencoba membandingkan dua algoritma stemming. Sedangkan pada penelitian ini membandingkan empat algoritma stemming. Tujuan penelitian ini adalah untuk mengungkapkan pengaruh stemming pada IR menggunakan dokumen bahasa Indonesia. Algoritma stemming yang digunakan pada penelitian ini adalah Porter, Sastrawi, Idris, dan Arifin Setiono. Kinerja masing-masing algoritma stemming diukur berdasarkan nilai presisi dan kebutuhan waktu. Terdapat 120 dokumen berbahasa Indonesia yang digunakan untuk mengukur kinerja masing-masing algoritma. Berdasarkan hasil eksperimen diperoleh bahwa kinerja terbaik untuk presisi adalah stemming Sastrawi. Sedangkan kinerja terbaik dari segi kebutuhan waktu adalah stemming Arifin Setiono. Kinerja presisi masing-masing stemming Sastrawi, Arifin Setiono, Porter, dan Idris adalah 70.3%, 55.8%, 49.9%, dan 32.2%. Sedangkan kinerja kebutuhan waktu rata-rata masing-masing stemming Arifin Setiono, Sastrawi, Idris, dan Porter adalah sebesar 0,123 detik, 160.1 detik, 168.8 detik, dan 188.4 detik. Abstract Information Retrieval (IR) has the function of separating relevant documents from a set of existing documents. An important process in IR is stemming. Stemming is the process of reducing affixed words into basic word forms. In several studies, different stemming is often used, and even studies have tried to compare two stemming algorithms. In this study, four stemming algorithms were compared. The purpose of this study was to reveal the effect of stemming on IR using Indonesian language documents. The stemming algorithms used in this study were Porter, Sastrawi, Idris, and Arifin Setiono. The performance of each stemming algorithm was measured based on the accuracy value and time requirements. There were 120 Indonesian language documents used to measure the performance of each algorithm. Based on the experimental results, it was obtained that the best performance for precision was the Sastrawi stemming. While the best performance in terms of time requirements was the Arifin Setiono stemming. The precision performance of each stemming of Sastrawi, Arifin Setiono, Porter, and Idris is 70.3%, 55.8%, 49.9%, and 32.2%. Meanwhile, the average time requirement performance of each stemming of Arifin Setiono, Sastrawi, Idris, and Porter is 0.123 sec, 160.1 sec, 168.8 sec, and 188.4 sec.
Copyrights © 2025