JSiI (Jurnal Sistem Informasi)
Vol. 12 No. 1 (2025)

Implementation of Conditional Random Fields Algorithm for Part of Speech Tagging in Madurese Language

Rizky Sulaiman (Unknown)
Setio Basuki (Unknown)



Article Info

Publish Date
21 Mar 2025

Abstract

Penelitian ini berfokus pada penerapan Conditional Random Fields (CRF) untuk Part of Speech (POS) Tagging dalam bahasa Madura. Mengingat keterbatasan sumber daya pemrosesan bahasa alami (NLP) untuk bahasa daerah, khususnya bahasa Madura, studi ini bertujuan untuk mengembangkan model POS tagging yang akurat. Dataset yang digunakan berisi 73.051 kata yang dikumpulkan dari berbagai sumber, seperti media sosial, artikel, dan percakapan sehari-hari. Data ini melalui tahapan pra-pemrosesan, termasuk pembersihan, tokenisasi, dan pelabelan manual dengan kategori POS yang mencakup 15 jenis tag. Model CRF dilatih menggunakan fitur morfologis dan kontekstual untuk mengenali pola linguistik dalam bahasa Madura. Model ini mencapai akurasi yang kompetitif sebesar 95%, yang menunjukkan kemampuannya dalam menangkap pola linguistik bahasa Madura secara efektif. Model ini berkinerja baik dalam kategori POS umum seperti kata benda (NN), kata kerja (VB), dan kata sifat (JJ), dengan F1-score sebesar 0,96 untuk kata benda dan 0,89 untuk kata kerja. Namun, tantangan muncul pada kategori yang lebih jarang seperti Foreign Word (FW) dan Adverb (RB), terutama disebabkan oleh variasi dialek dan penggunaan kata serapan. Penelitian ini memberikan kontribusi penting dalam pengembangan sumber daya NLP untuk bahasa daerah dan dapat digunakan dalam berbagai aplikasi seperti penerjemahan otomatis, asisten virtual, serta pelestarian bahasa Madura. Penelitian mendatang disarankan memperluas dataset dan mengeksplorasi model berbasis neural network untuk lebih meningkatkan kinerja POS tagging.

Copyrights © 2025






Journal Info

Abbrev

jsii

Publisher

Subject

Computer Science & IT Decision Sciences, Operations Research & Management

Description

JSiI (Jurnal Sistem Informasi) is a scientific journal published by the Department of Information System Universitas Serang Raya (UNSERA). This journal contains scientific papers from Academics, Researchers, and Practitioners about research on information systems. JSiI (Jurnal Sistem Informasi) is ...