cover
Contact Name
-
Contact Email
-
Phone
-
Journal Mail Official
-
Editorial Address
-
Location
Unknown,
Unknown
INDONESIA
Jurnal Linguistik Komputasional
ISSN : -     EISSN : 26219336     DOI : -
Core Subject : Science,
Jurnal Linguistik Komputasional (JLK) menerbitkan makalah orisinil di bidang lingustik komputasional yang mencakup, namun tidak terbatas pada : Phonology, Morphology, Chunking/Shallow Parsing, Parsing/Grammatical Formalisms, Semantic Processing, Lexical Semantics, Ontology, Linguistic Resources, Statistical and Knowledge based methods, POS tagging, Discourse, Paraphrasing/Entailment/Generation, Machine Translation, Information Retrieval, Text Mining, Information Extraction, Summarization, Question Answering, Dialog Systems, Spoken Language Processing, Speech Recognition and Synthesis.
Arjuna Subject : -
Articles 67 Documents
Analisis Sentimen Multi-Class Pada Sosial Media Menggunakan Metode Long Short-Term Memory (LSTM) Yuli yuli Astari; Afiyati Afiyati; Saddam Wahib Rozaqi
Jurnal Linguistik Komputasional Vol 4 No 1 (2021): Vol. 4, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v4i1.43

Abstract

Technological developments, especially in the internet and social media, could be a very important research subject in obtaining information, because of the large amount of information in a text found on social media. In recent years, there has been an increase in research about sentiment analysis on text reviews and tweets in order to determine the polarity generated by social media. There are still few studies that apply the deep learning method with the Long Short-Term Memory (LSTM) algorithm to analyze multiclass sentiments in Indonesian-language texts. This study aims to analyze positive and negative emotions in social media texts using the information classification approach in the text and dividing them into 8 different classes using the LSTM method. The dataset is directly taken and collected from users' posts on social media. In testing the LSTM method, the calculation of the accuracy, exactness, review, f-measure values is generated. The results of the processing of the LSTM method show quite well with 5 trials with the highest accuracy value of 91.9% and the average value of multiclass getting 89.45% results.
Klasifikasi Kepribadian Myres-Briggs Type Indicator Berdasarkan Cuitan di Twitter Menggunakan Metode TF-IDF dan Naive Bayes Classifier Maya Cendana; Alfin Wijaya
Jurnal Linguistik Komputasional Vol 3 No 2 (2020): Vol. 3, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v3i2.37

Abstract

Tipe kerpibadian seseorang biasanya dapat diketahui dengan menggunakan psikotes. Salah satu jenis psikotes yang sering digunakan adalah Myres-Briggs Type Indicator (MBTI). Sebuah aplikasi berbasis web yang dapat melakukan klasifikasi tipe kepribadian seseorang berdasarkan cuitan di Twitter diharapkan dapat menjadi salah satu alternatif untuk mengetahui tipe kepribadian seseorang tanpa perlu mengikuti psikotes secara konvensional. Selain itu, hasil psikotes juga dapat diketahui secara langsung. Aplikasi ini dibuat dengan menggunakan teknik text mining, yaitu dengan menggunakan metode Term Frequency-Inverse Document Frequency (TF-IDF) dan metode klasifikasi Naive Bayes Classifier. Metode TF-IDF digunakan untuk memberikan pembobotan kata dari data training dan metode Naive Bayess Classifier digunakan untuk mengklasifikasikan data testing berdasarkan data yang telah dilatih sebelumnya. Data akan dibersihkan terlebih dahulu sebelum dilatih maupun diuji melalui proses preprocessing sehingga informasi yang dihasilkan dapat menjadi lebih akurat. Hasil dari penelitian ini adalah dari 100 data yang diuji, 71 data termasuk kategori klasifikasi benar sesuai dengan labelnya, sedangkan 29 data termasuk kategori klasifikasi salah karena hasil prediksi tidak sesuai dengan labelnya. Tingkat akurasi adalah sebesar 71% dengan rincian precision dan recall untuk kelas artisan sebesar 63% dan 68%, untuk kelas guardian sebesar 77% dan 68%, untuk kelas rational sebesar 64% dan 72%, dan untuk kelas idealist sebesar 83% dan 76%.
Named-Entity Recognition pada Teks Bebahasa Indonesia menggunakan Hidden Markov Model dan POS-Tagging Novi Yusliani; Ridho Putra Sufa; Ari Firdaus; Abdiansah Abdiansah; Yoppy Sazaki
Jurnal Linguistik Komputasional Vol 4 No 1 (2021): Vol. 4, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v4i1.39

Abstract

Named entity recognition adalah salah satu tool yang berfungsi untuk mengenali entitas bernama suatu kata dan banyak digunakan dalam aplikasi di bidang pemrosesan bahasa alami. Hidden markov model (HMM) adalah salah satu metode yang dapat digunakan untuk mengenali entitas bernama suatu kata. Metode ini terdiri dari tahap pelatihan dan tahap pengujian. Pada tahap pelatihan metode ini membutuhkan sekumpulan data berlabel untuk mendapatkan model pengetahuan berupa nilai probabilitas setiap kata yang ada di dalam data latih. Nilai probabilitas ini berfungsi untuk mengenali kata-kata yang belum diketahui labelnya. Apabila kata yang akan dikenali tidak ada di dalam data latih, maka kata tersebut akan memiliki nilai probabilitas nol (zero probability). Nilai probabilitas nol pada suatu kata menyebabkan kata tersebut tidak bisa diketahui label entitas bernamanya. Karena itu, penelitian ini menggunakan part-of-speech tagging agar tidak ada kata yang memiliki nilai probabilitas nol. Pengujian dilakukan pada teks berbahasa Indonesia dengan jumlah kalimat sebanyak 511 kalimat. Hasil pengujian menunjukkan nilai rata-rata recall sebesar 83.82%, nilai rata-rata precision sebesar 89.31%, dan nilai rata-rata f-measure sebesar 86.14%.
Short Answer Grading Using Contextual Word Embedding and Linear Regression Muh Habibi Haidir; Ayu Purwarianti
Jurnal Linguistik Komputasional Vol 3 No 2 (2020): Vol. 3, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v3i2.38

Abstract

Abstract—One of the obstacles in an efficient MOOC is the evaluation of student answers, including the short answer grading which requires large effort from instructors to conduct it manually. Thus, NLP research in short answer grading has been conducted in order to support the automation, using several techniques such as rule and machine learning based. Here, we’ve conducted experiments on deep learning based short answer grading to compare the answer representation and answer assessment method. In the answer representation, we compared word embedding and sentence embedding models such as BERT, and its modification. In the answer assessment method, we use linear regression. There are 2 datasets that we used, available English short answer grading dataset with 80 questions and 2442 to get the best configuration for model and Indonesian short answer grading dataset with 36 questions and 9165 short answers as testing data. Here, we’ve collected Indonesian short answers for Biology and Geography subjects from 534 respondents where the answer grading was done by 7 experts. The best root mean squared error for both dataset was achieved by using BERT pretrained, 0.880 for English dataset dan 1.893 for Indonesian dataset.
Sentiment Analysis of Stocktwits Data With Word Vector and Gated Recurrent Unit oscar .; Hilman Pardede
Jurnal Linguistik Komputasional Vol 4 No 2 (2021): Vol. 4, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v4i2.53

Abstract

Prediction of stock movements is important in the business world for knowing the movement of stock both for buying and selling goods. Stock is a financial product characterized by high risk, high return and flexible trading, which is favored by many investors. Investors can get abundant returns by accurately estimating stock price trend. Historical price is often used to predict the stockprice, it can only estimate the periodical trends of the stockprice. However, there could be a particular event that may affect the price. So it cannot capture sudden unexpected events. Social media texts like tweets can have huge impacts on the stock market. By analysing the sentiments of social media information, unexpected behaviour of the price trend could be detected. In this study, we propose to use Gated Recurrent Unit (GRU) for predicting the sentiment of tweets related to stockprice. We implement word vector, in particular word2vec, as features for GRU. Our experiments show that the proposed method is better than other deep learning based sentiment analysis such as BERT (Bidirectional Encoder Representations from Transformers) and BiLSTM (Bidirectional Long Short Term Memory).
Analisis Sentimen Ulasan Pelanggan Terhadap Layanan Grab Indonesia Menggunakan Multinominal Naïve Bayes Classifier Firman Noor Hasan
Jurnal Linguistik Komputasional Vol 4 No 2 (2021): Vol. 4, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v4i2.61

Abstract

Transportasi merupakan jenis moda kendaraan yang digunakan seseorang agar mencapai satu tempat ke tempat lainnya yang ingin dituju. Salah satu jenis transportasi yang sangat familiar bagi masyarakat adalah ojek online yaitu Grab Indonesia. Grab terus berinovasi untuk memenuhi kebutuhan pelanggan secara lebih efisien, dan cakupan layanannya juga semakin luas. Tujuan dari penelitian ini adalah untuk mengetahui berapa banyak hasil sentimen positif dan negatif dari dataset, dan mengetahui hasil dari proses pengujian algoritma dan nilai akurasi dari pengujian evaluasi, dan mengetahui apakah pelanggan puas dengan Layanan Grab Indonesia. Hasil output yang didapatkan dari 1000 dataset yang dianalisa mengenai kepuasan pelanggan terhadap layanan Grab Indonesia, bahwa sentimen positif yang didapatkan adalah sebanyak 911, sedangkan sentimen negatif dengan hasil sebanyak 89, untuk sentimen negatif mendapatkan nilai precision sebesar 57%, recall 67% dan f1-score 62%. Sedangkan untuk sentimen positif mendapatkan nilai precision sebesar 97%, recall 95% dan f1-score 96%.
Indonesian Question Answering System for Factoid Questions using Face Beauty Products Knowledge Graph Mahanti Indah Rahajeng; Ayu Purwarianti
Jurnal Linguistik Komputasional Vol 4 No 2 (2021): Vol. 4, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v4i2.62

Abstract

Question answering (QA) system is developed to find the right answers from natural language questions. QA systems can be used for building chatbots or even search engines. In this study, we’ve built an Indonesian QA system that uses Anindya Knowledge Graph as its data source. The idea behind this QA system is translating questions into SPARQL queries. The proposed solution consists of four modules, namely question classification, information extraction, token mapping, and query construction. The question classification and the information extraction modules were experimented using SVM, LSTM, and fine-tuning IndoBERT. The text representations were also tested to find the best result among tf-idf, FastText, and IndoBERT. In our experiment, we found that the fine-tuning IndoBERT model had obtained the best performance on both question classification and information extraction modules.
Studi Ekstraksi Fitur Data Teks Rencana Pelaksanaan Pembelajaran Memanfaatkan Model Word2Vec Daniel Eliazar Latumaerissa; Suryasatriya Trihandaru; Didit Budi Nugroho
Jurnal Linguistik Komputasional Vol 4 No 2 (2021): Vol. 4, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v4i2.54

Abstract

Abstrak— Natural Language Processing (NLP) adalah bidang dalam ilmu computer yang mencoba menjembatani mesin dan manusia melalui analisa bahasa manusia, misalnya dalam bentuk teks. Data berupa teks sebelum digunakan dalam pelatihan mesin perlu dirubah terlebih dahulu menjadi vektor (trasnformasi) bermakna sehingga dapat dihitung secara matematis. Pemilihan teknik transformasi atau dikenal juga dengan Vector Space Model (VSM) menjadi penting karena dapat berpengaruh terhadap proses pelatihan mesin. Telah dilakukan uji transformasi teks ke vektor menggunakan model Word2Vec pada dataset RPP dan didapatkan bahwa variasi Bag of Centroids Based Word2Vec adalah pilihan Teknik terbaik untuk melakukan transformasi teks dataset RPP berdasarkan analisa matriks hasil perhitungan cosine similarity.
Bagaimana Masyarakat Menyikapi Pembelajaran Tatap Muka: Analisis Komentar Masyarakat pada Media Sosial Youtube Menggunakan Algoritma Deep Learning Sekuensial dan LDA Fawwaz Zaini Ahmad; Muhammad Fauzi Satria Arifandy; Muhammad Rasyad Caesarardhi; Nur Aini Rakhmawati
Jurnal Linguistik Komputasional Vol 4 No 2 (2021): Vol. 4, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v4i2.57

Abstract

Saat Pandemi Covid-19 memasuki tahun ke-2, ada beberapa pertanyaan yang mengganjal di antara kita, apakah kita harus terus belajar online, atau berkompromi dengan Pandemi dan membuka kembali sekolah kita. Saat vaksinasi dimulai di seluruh dunia, pertanyaan 'apakah kita harus segera membuka kembali sekolah kita?' menjadi semakin keras. Tujuan dari penelitian ini adalah menganalisis sentiment sebagian masyarakat Indonesia, dalam hal ini pengguna Youtube, dalam hal pembelajaran tatap muka. Data yang digunakan dalam penelitian ini adalah komentar dari sembilan video youtube yang berkaitan dengan pembelajaran tatap muka. Persiapan data meliputi upsampling, casefolding, cleansing, labelling, dan tokenizing. Algoritma yang digunakan adalah pemodelan data LSTM dengan pengoptimasi ADAM Setelah pemodelan, setiap model dievaluasi dan berhasil memperoleh akurasi tertinggi sebesar 78%. Setelah dilakukan permodelan, model dengan akurasi tertinggi digunakan untuk memberi label secara otomatis pada komentar yang belum memiliki label. Langkah terakhir dari penelitian ini adalah melakukan permodelan topik terhadap setiap sentiment, guna mencari tau setiap sentiment berkaitan dengan topik apa.
Sistem Deteksi Kemiripan Teks Pada Berita Berbahasa Indonesia Menggunakan algoritma Ratcliff/Obershelp Nurul Izzah; Novi Yusliani; Desty Roodiah
Jurnal Linguistik Komputasional Vol 5 No 1 (2022): Vol. 5, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v5i1.65

Abstract

Plagiarism in writing is often found in various media, one of which is the internet. Prevention can be done by creating an intelligent system capable of detecting text. One of the algorithms used to create a text finding system is the Ratcliff/Obershelp algorithm. This algorithm combines a string of 2 pieces of text to get the total character length (sequence (string) matching). The results are used to search for similar words ( sub-sequence ) and calculate the character length. The calculation of the similarity value and the percentage is carried out to classify the types of plagiarism that exist in the text. The data used are 8 Indonesian news texts with different internet sources which are divided into 2 topics and the average error percentage is 0.26%.