AbstrakRegular expression atau regex merupakan metode ekstraksi fitur yang menemukan substring pada sebuah teks yang cocok dengan harapan dapat meningkatkan kompleksitas waktu atau akurasi dengan melakukan preprocessing teks. Permasalahan praproses teks salah satunya kurang memperhatikan ektraksi fitur untuk proses klasifikasi sentiment, sehingga akurasi yang diperoleh kurang optiomal. Inovasi utama dari pendekatan penelitian ini yaitu mengembangkan pengklasifikasi teks berbasis ekspresi reguler sehingga menghasilkan performance kinerja algoritma yang baik. Tahapan penelitian ini, yaitu pengumpulan dataset lalu mengklasifikasikan sentiment dengan Naïve Bayes dan dalam praproses teks dilakukan ektraksi fiitur regular expression. Hasil rata-rata akurasi yang dihasilkan dengan ekstraksi ciri sebesar 88,05% dan yang tidak menggunakan 79,26% sehingga dapat disimpulkan bahwa penggunaan ekstraksi fitur pada praproses dapat meningkatkan akurasi sebesar 8,08% dari 1000 data latih dan 400 data uji. Kata kunci: ekstraksi fitur, regex, regular expression, substringAbstractRegular expression or regex is a feature extraction method that finds matching substrings in a text in hopes of increasing time complexity or accuracy by preprocessing the text. One of the problems with text preprocessing is the lack of attention to feature extraction for the sentiment classification process, so the accuracy obtained is not optimal. This research stage begins with collecting a dataset and then classifying sentiment using Naïve Bayes, which pre-processes the text by extracting features with regular expressions. The main innovation of this research approach is to develop a text classifier based on regular expressions so as to produce good algorithm performance. The average accuracy produced by feature extraction is 88.05% and 79.26% is not used, so it can be concluded that the use of feature extraction in pre-processing can increase accuracy by 8.08% from 1000 training data and 400 test data.Keywords:  extraction feature, regex, regular expression, substring
Copyrights © 2023