Jurnal Transformatika
Vol. 20 No. 2 (2023): January 2023

Optimization of the Stemming Technique on Text Preprocessing President 3 Periods Topic

Albab, M. Ulil (Unknown)
P., Yohana Karuniawati (Unknown)
Fawaiq, Mohammad Nur (Unknown)



Article Info

Publish Date
20 Jan 2023

Abstract

Stemming merupakan suatu proses untuk menemukan kata dasar dari sebuah kata. Penelitian ini bertujuan untuk melakukan tahapan text pre-processing pada data twitter yang menyebutkan topik Presiden 3 Periode , yaitu sebanyak 797 data yang didapatkan dari crawling twitter mulai tanggal 15 April 2022 sampai dengan 30 April 2022, sekaligus melakukan optimasi salah satu teknik stemming terhadap teks berbahasa Indonesia yang memang belum banyak dilakukan. Banyaknya kata yang diolah sebanyak 9401 kata. Optimasi yang dilakukan yaitu dengan memodifikasi kamus bahasa dan menambahkan kata-kata yang dimasukkan dalam stopword sehingga dapat menghasilkan jumlah kata ter-stemming yang semakin meningkat. Sebelum dilakukan optimasi, prosentase keberhasilan stemming mencapai 95,86%, setelah dilakukan optimasi meningkat menjadi 99,93%.

Copyrights © 2023






Journal Info

Abbrev

TRANSFORMATIKA

Publisher

Subject

Computer Science & IT

Description

Transformatika is a peer reviewed Journal in Indonesian and English published two issues per year (January and July). The aim of Transformatika is to publish high-quality articles of the latest developments in the field of Information Technology. We accept the article with the scope of Information ...