cover
Contact Name
-
Contact Email
-
Phone
-
Journal Mail Official
-
Editorial Address
-
Location
Unknown,
Unknown
INDONESIA
Jurnal Linguistik Komputasional
ISSN : -     EISSN : 26219336     DOI : -
Core Subject : Science,
Jurnal Linguistik Komputasional (JLK) menerbitkan makalah orisinil di bidang lingustik komputasional yang mencakup, namun tidak terbatas pada : Phonology, Morphology, Chunking/Shallow Parsing, Parsing/Grammatical Formalisms, Semantic Processing, Lexical Semantics, Ontology, Linguistic Resources, Statistical and Knowledge based methods, POS tagging, Discourse, Paraphrasing/Entailment/Generation, Machine Translation, Information Retrieval, Text Mining, Information Extraction, Summarization, Question Answering, Dialog Systems, Spoken Language Processing, Speech Recognition and Synthesis.
Arjuna Subject : -
Articles 67 Documents
KLASIFIKASI SENTIMEN EMOSI PADA DATASET GOEMOTION MENGGUNAKAN LSTM Satrio, Bagus; Dahlan, Bulan Fitri; Fathan, Fathir; Muwafa, Fadhil Zahran; Zanzabili, Muhammad Reyhan; Abdiansah, Abdiansah
Jurnal Linguistik Komputasional Vol 7 No 1 (2024): Vol. 7, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v7i1.145

Abstract

Penelitian ini membahas tentang pengembangan sistem klasifikasi sentimen emosi pada teks menggunakan metode deep-learning LSTM (Long Short Term Memory) dengan dataset yang digunakan yaitu dataset GoEmotion. Sistem ini bertujuan untuk mengidentifikasi emosi tersirat yang terkandung dalam suatu teks secara tepat dan efisien ke dalam 28 jenis bentuk emosi. Metode yang digunakan dalam penelitian ini adalah LSTM atau Long Short Term Memory untuk mendeteksi dan mengklasifikasikan emosi berdasarkan teks. Program dalam penelitian ini dibuat menggunakan bahasa pemrograman python dengan menggunakan beberapa library yang telah tersedia. Hasil dari eksperimen ini menunjukkan bahwa model LSTM mampu mengenali dan mengklasifikasikan emosi yang terkandung di dalam sebuah teks secara cukup baik dengan akurasi tertinggi mencapai angka 0.36 (36% akurasi). Sistem klasifikasi ini digunakan untuk dapat mengatasi masalah terkait dengan pengenalan emosi yang terkandung dalam suatu teks atau kalimat.
Fine-Tuning BERT untuk Menangani Ambiguitas Pada POS Tagging Bahasa Indonesia Yazid, Ahmad Subhan; Winarko, Edi
Jurnal Linguistik Komputasional Vol 6 No 2 (2023): Vol. 6, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v6i2.148

Abstract

Ambiguitas merupakan masalah yang kerap muncul pada tugas-tugas pemrosesan bahasa alami, termasuk pada POS tagging (pelabelan kelas kata). Penelitian ini bertujuan menangani ambiguitas pada POS tagging bahasa Indonesia dengan pendekatan pembelajaran mendalam BERT (bidirectional encoder representation from transformers). Pendekatan ini dipilih untuk melengkapi menambah fleskfibilitas dari penelitian sebelumnya yang menerapkan metode berbasis aturan dan probabilistik. Untuk mendapatkan model yang optimal dan dapat menyelesaikan ambiguitas, dilakukan beberapa eksperimen dengan skenario fine-tuning terhadap korpus POS tagging. Fine-tuning dilakukan dengan mengubah nilai parameter pembelajaran dan penambahan kalimat-kalimat ambigu pada data latih. Eksperimen yang dilakukan menghasilkan model terbaik dengan nilai loss 0,1113, presisi 0,9635, recall 0,9658, dan f1 0,9647. Hasil tersebut didapatkan pada eksperimen dengan parameter learning rate 0,00004, ukuran batch 16, dan epoch 2. Hasil pengujian terhadap data uji juga menunjukkan bahwa model memiliki performa yang baik dan mampu menangani ambiguitas. Model yang dihasilkan berhasil melabeli 96 dari 100 kata ambigu pada kalimat dengan benar.
Implementasi Active Learning Pada Klasifikasi Emosi Tweet Berbahasa Indonesia Asa, Ragajiwa; Hastuti, Rochana Prih
Jurnal Linguistik Komputasional Vol 6 No 2 (2023): Vol. 6, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v6i2.155

Abstract

Terbatasnya dataset klasifikasi emosi tweet berbahasa Indonesia membuat metode active learning menjadi pilihan untuk dapat meningkatkan akurasi model supaya dapat reliable ketika memprediksi data baru. Penelitian ini menjelaskan bagaimana dampak implementasi metode active learning ke dalam aplikasi dengan memanfaatkan data tak berlabel yang dihasilkan oleh aplikasi. Active learning pada penelitian ini menggunakan skenario stream-based selective sampling dan memilih data dengan least confidence uncertainty sampling. Pada penelitian ini dilakukan pengujian membandingkan performa active learning dengan pemilihan data secara acak pada penambahan data 20, 10, dan 50 di setiap iterasi. Menurut hasil yang didapat, model dengan active learning memiliki akurasi yang lebih baik dibandingkan dengan model acak. Model active learning dapat meningkatkan akurasi model 0,23% hingga 1,09% dari akurasi model dasar pada 66,85%.
Analisis Sentimen Ulasan Pengguna Aplikasi M-Banking Menggunakan Algoritma Support Vector Machine dan Decision Tree Zelina, Nur; Afiyati, Afiyati
Jurnal Linguistik Komputasional Vol 7 No 1 (2024): Vol. 7, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v7i1.169

Abstract

Advances in technology and information have a major influence on human life. The use of this technology has been widely used by humans, especially the use of internet technology. The internet that can be used at an affordable price and easily available supporting hardware has brought humans into a more modern era. In this study, sentiment analysis was carried out on the use of the Motion Banking application using the Support Vector Machine (SVM) algorithm and the Decision Tree algorithm. This study uses the Knowledge Discovery in Database (KDD) method. The purpose of this study is to classify review data from users of the Motion Banking application into positive and negative sentiments by studying user opinions about the Motion Banking application through the reviews provided, and to determine the performance of the classifier method used. In this study, data was obtained by collecting data from user reviews of the Motion Banking application on the Google Play Store using scraping techniques and managed to get 7000 review data. The best results were obtained in scenario 3 (70:30) using the Support Vector Machine algorithm with the Linear kernel which produced 93.7% accuracy, 93.6% precision, 91% recall, and 92.3% f1 score, while for The Decision Tree has an accuracy of 83%, a precision of 80.7%, a recall of 77%, and an f1 score of 79.1%.
Implementasi Aplikasi Peringkasan Teks Otomatis Untuk Atlas Penyakit Menular Pada Manusia Menggunakan Metode Ordered Abstractive Summarization Caesarardhi, Muhammad Rasyad; Vinarti, Retno Aulia; Kusumawardani, Renny Pradina
Jurnal Linguistik Komputasional Vol 6 No 2 (2023): Vol. 6, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v6i2.182

Abstract

The death rate for the second pandemic after the first pandemic The Justinian Plague (A.D. 541 to 544) had reached 15-40%. Human depopulation with a loss rate of 50-60% also has been estimated due to the pandemics. Atlas of Human Infectious Disease (AHID) has captured the distribution and determinants for most infectious diseases for humans. AHID is complemented with information about infectious agents, clinical, and epidemiological. Now, every single disease that AHID explains still does not have a visualization with key-point summary on it. It helps people with no medical backgrounds to understand the infectious diseases faster and properly. Interestingly, AHID is semi-structured in terms of data, so we need to automate the process of representing it to a knowledge model. Previous research has shown a rather good improvement in the model of text summarization. Seq2Seq model has reached a ROUGE-1 score of 28,42 and the latest model Bringing in Order to Abstractive Summarization (BRIO) has reached a ROUGE-1 score of 49,07 on the extreme summarization dataset (XSum). Therefore, in this research, we do text summarization for AHID data using the BRIO model and reached score of ROUGE-1 of 43,86. The resulting model therefore can be used to add another disease that is not included yet in AHID such as Covid-19 and output automated text summarization for each one of the attributes. The result of text summarization are delivered as a web-based dictionary.
Pengaruh Penggunaan Attention pada Kualitas Mesin Penerjemah Berbasis Neural Bahasa Indonesia ke Bahasa Madura Bangkalan Pertiwi, Anggi; Sujaini, Herry; Safriadi, Novi
Jurnal Linguistik Komputasional Vol 7 No 1 (2024): Vol. 7, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v7i1.197

Abstract

Mesin penerjemah jaringan saraf tiruan (NMT) telah banyak digunakan pada berbagai macam pasangan bahasa resmi di dunia. Sudah cukup banyak penelitian yang memperlihatkan kenaikan pada akurasi NMT dengan menggunakan attention dibandingkan tanpa attention. Namun, penerapannya terhadap bahasa daerah khususnya di Indonesia masih terbilang sedikit. Untuk itu, pada penelitian ini akan dibangun mesin penerjemah berbasis neural bahasa Indonesia ke bahasa Madura Bangkalan menggunakan mekanisme attention Bahdanau yang dapat mengukur pengaruh kualitas penggunaan attention terhadap mesin penerjemah dengan berdasarkan hasil evaluasi otomatis oleh BLEU (Bilingual Evaluation Understudy) dan TER (Translation Edit Rate). Jumlah korpus teks paralel yang digunakan sebanyak 5000 baris kalimat. Penelitian ini mengguanakan framework deep learning tensorflow sebagai code open source NMT. Pembagian data dilakukan dengan metode k-fold cross validation. Proses pengujian dilakukan dilakukan dengan penambahan epoch secara konsisten. Hasil pengujian k-fold cross validation dengan attention didapatkan nilai rata-rata akurasi tertinggi oleh BLEU sebesar 21,47% pada epoch 70 dan terendah sebesar 10,71% pada epoch 10. Pada attention didapat nilai akurasi tertinggi pada data Uji5 di epoch 70 oleh BLEU sebesar 37,15% dan TER sebesar 56% dengan jumlah kalimat hasil terjemahan sebanyak 334 kalimat. Sedangkan tanpa attention, pada data Uji6 dengan hasil oleh BLEU sebesar 14,56% di epoch 70 dan TER sebesar 88% di epoch 10. Dapat diketahui, bahwa dengan penggunaan mekanisme attention Bahdanau hasil yang didapat lebih tinggi dibandingkan tanpa mekanisme attention.
Analisis Sentimen Terhadap Rencana Penerapan E-Voting Pada Pemilu di Indonesia Adipratama, Muhammad Rizky; Safriadi, Novi
Jurnal Linguistik Komputasional Vol 7 No 1 (2024): Vol. 7, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v7i1.214

Abstract

Penelitian ini membahas tentang analisis sentimen masyarakat terhadap e-voting pada pemilihan umum. Pada sosial media, terutama Twitter, masyarakat menyerukan pendapat mereka mengenai penerapan e-voting di Indonesia. E-voting adalah teknologi yang memungkinkan pengguna bisa memberikan suara dan menghitung suara dimana saja. Melihat potensi ini, beberapa wilayah di Indonesia pelan pelan menerapkan E-voting, dan masyarakat mulai memberikan pendapat mereka. Tujuan dari penelitian ini adalah untuk melihat pendapat masyarakat mengenai E-Voting apakah cocok diterapkan secara penuh di Indonesia atau tidak. Metode yang digunakan dalam penelitian ini adalah algoritma klasifikasi, yaitu algoritma naive bayes dan neural network. Pengujian dilakukan terhadap data set yang telah dikumpulkan dan dilatih dengan algoritma naive bayes dan neural network. Berdasarkan pada hasil pengujian confusion matrix, sentimen masyarakat terhadap penerapan E-Voting di Indonesia dengan algoritma naive bayes memperoleh sentimen positif 87.1%, netral 49.1%, dan negatif 61.9%. Sedangkan dengan algoritma neural network memperoleh sentimen positif 67.8%, netral 64.9%, dan negatif 74.1%.