Claim Missing Document
Check
Articles

Found 2 Documents
Search

Exploring Stemming Techniques in Ambon Malay Languages: A Systematic Literature Review Carolina, Vinnesa Patricia; Utami, Ema; Yaqin, Ainul
Jambura Journal of Informatics VOL 6, N0 1: APRIL 2024
Publisher : Universitas Negeri Gorontalo

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.37905/jji.v6i1.24954

Abstract

Stemming in Ambonese posed a significant challenge due to its extensive lexicon, encompassing approximately 127,000 base words as recorded in the Kamus Besar Bahasa Indonesia (Indonesian Dictionary). This complexity arises from the task of extracting base words from those with affixes, necessitating the removal of various affixes such as prefixes, infixes, suffixes, and their combinations. This process greatly influences analytical outcomes. To address this linguistic complexity, several stemming algorithms were developed. These include Nazief Adriani, Enhanced Confix Stripping, Sastrawi, and Tala, each offering unique techniques to handle stemming complexities in Indonesian. The selection of the appropriate algorithm is crucial for ensuring the accuracy and reliability of the stemming process within the analytical framework. In conducted stemming research, there were variations in methods used. The most frequently used algorithm was Nazief Adriani, with 17 recorded cases, followed by Enhanced Confix Stripping with 12 cases. Sastrawi, although less frequent, was used in 4 cases, while Tala appeared in 1 case. This diversity reflects the available choices in selecting a fitting stemming method. However, this may relate to factors such as ongoing research projects, funding availability, or other external conditions affecting research production during that period. Consequently, stemming research remains an interesting and relevant topic, with the potential for continued growth and significant contributions to text processing and linguistic research in the future.
Riset Jurnal Literatur : Penggunaan Metode Stemming Pada Bahasa Daerah Melayu-Ambon Carolina, Vinnesa Patricia; Utami, Ema; Yaqin, Ainul
Journal of Electrical Engineering and Computer (JEECOM) Vol 6, No 1 (2024)
Publisher : Universitas Nurul Jadid

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33650/jeecom.v6i1.8517

Abstract

Stemming dalam bahasa Ambon merupakan tantangan yang signifikan karena lexiconnya yang luas, mencakup sekitar 127.000 kata dasar seperti yang tercatat dalam Kamus Besar Bahasa Indonesia. Hal ini disebabkan oleh kompleksitas stemming yang timbul dari tugas untuk mengekstrak kata-kata dasar dari kata-kata yang memiliki imbuhan, yang memerlukan penghapusan berbagai imbuhan seperti awalan, sisipan, akhiran, dan kombinasinya. Proses ini memiliki pentingan yang besar karena sangat memengaruhi kualitas hasil analisis.Untuk mengatasi kompleksitas linguistik ini, beberapa algoritma stemming telah dikembangkan. Algoritma-algoritma ini termasuk Nazief & Adriani, Enhanced Confix Stripping, Sastrawi, dan Tala, masing-masing menawarkan teknik unik untuk menangani kompleksitas stemming dalam bahasa Indonesia. Pemilihan algoritma yang tepat sangat penting untuk memastikan akurasi dan kehandalan proses stemming dalam kerangka analisis.Dalam penelitian stemming yang telah dilakukan, terdapat variasi dalam metode-metode yang digunakan. Algoritma stemming yang paling sering digunakan adalah Nazief & Adriani, dengan 17 kasus tercatat. Kemudian, Enhanced Confix Stripping juga cukup populer dengan 12 kasus. Sastrawi, meskipun dengan frekuensi yang lebih rendah, tetap digunakan dalam 4 kasus. Sedangkan algoritma Tala, meskipun jarang digunakan, tetap muncul dalam 1 kasus. Hal ini mencerminkan diversitas dan pilihan yang tersedia dalam memilih metode stemming yang sesuai dengan kebutuhan penelitian. Meskipun demikian, hal ini mungkin terkait dengan faktor-faktor seperti proyek penelitian yang sedang berlangsung, ketersediaan dana, atau kondisi eksternal lainnya yang memengaruhi produksi penelitian pada periode tersebut. Dengan demikian, penelitian tentang stemming tetap menjadi topik yang menarik dan relevan, dengan potensi untuk terus berkembang dan memberikan kontribusi yang berarti dalam pemrosesan teks dan penelitian linguistik di masa mendatang.