cover
Contact Name
-
Contact Email
-
Phone
-
Journal Mail Official
-
Editorial Address
-
Location
Unknown,
Unknown
INDONESIA
Jurnal Linguistik Komputasional
ISSN : -     EISSN : 26219336     DOI : -
Core Subject : Science,
Jurnal Linguistik Komputasional (JLK) menerbitkan makalah orisinil di bidang lingustik komputasional yang mencakup, namun tidak terbatas pada : Phonology, Morphology, Chunking/Shallow Parsing, Parsing/Grammatical Formalisms, Semantic Processing, Lexical Semantics, Ontology, Linguistic Resources, Statistical and Knowledge based methods, POS tagging, Discourse, Paraphrasing/Entailment/Generation, Machine Translation, Information Retrieval, Text Mining, Information Extraction, Summarization, Question Answering, Dialog Systems, Spoken Language Processing, Speech Recognition and Synthesis.
Arjuna Subject : -
Articles 67 Documents
Pengaruh Synthetic Minority Oversampling Technique pada Analisis Sentimen Menggunakan Algoritma K-Nearest Neighbors Raisha Fatiya; Novi Yusliani; Mastura Diana Marieska; Danny Matthew Saputra
Jurnal Linguistik Komputasional Vol 5 No 1 (2022): Vol. 5, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v5i1.63

Abstract

Salah satu permasalahan yang kerap timbul dan mempengaruhi proses pengklasifikasian adalah data tidak seimbang (imbalanced data). Suatu data dikatakan tidak seimbang apabila data tersebut terbagi menjadi kelas minoritas dan mayoritas. Hal tersebut akan memberikan pengaruh berupa dampak buruk pada hasil klasifikasi karena hasil yang didapatkan akan bias terhadap kelas mayoritas. Penelitian ini bertujuan untuk mengetahui pengaruh Synthetic Minority Oversampling Technique untuk menangani permasalahan imbalance data pada analisis sentimen menggunakan algoritma K-Nearest Neighbors. Synthetic Minority Oversampling Technique (SMOTE) adalah salah satu metode yang dapat digunakan untuk melakukan pembentukan data synthetic untuk mengatasi imbalanced data. Metode klasifikasi yang digunakan adalah K-Nearest Neighbors (KNN) dengan nilai k=3. Penelitian ini menggunakan tiga dataset sentimen yang memiliki topik Covid, Pilkada 1, dan Pilkada 2. Hasil evaluasi dari ketiga dataset tersebut menghasilkan nilai rata-rata accuracy sebesar 70% pada KNN tanpa SMOTE dan menghasilkan 78% pada KNN+SMOTE. Hal ini menunjukkan bahwa SMOTE dapat mengatasi permasalahan imbalanced data dan dapat memberikan pengaruh berupa peningkatan akurasi pada penelitian ini.
Perbandingan Penggunaan Kamus Normalisasi dalam Analisis Sentimen Berbahasa Indonesia Firnanda Zuhad; Nori Wilantika
Jurnal Linguistik Komputasional Vol 5 No 1 (2022): Vol. 5, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v5i1.60

Abstract

Normalisasi merupakan salah satu tahapan text preprocessing dalam Natural Language Processing. Pengaruh normalisasi dengan kamus normalisasi dalam analisis sentimen berbahasa Indonesia belum diketahui. Dengan membandingkan data yang tidak dinormalisasi dan data yang dinormalisasi dari beberapa dataset, penelitian ini bertujuan untuk mengetahui bagaimana pengaruh normalisasi dan pengaruh kamus yang digunakan dalam analisis sentimen. Kamus yang digunakan pada penelitian ini antara lain Colloquial Indonesian Lexicon dan modul formalizer pada INANLP. Sebagai kontrol, dalam analisis sentimen, metode klasifikasi Multinomial Naïve Bayes diterapkan pada seluruh dataset. Performa dari delapan dataset kemudian dianalisis dan diuji secara statistik. Akurasi, presisi, dan recall diuji dengan menggunakan uji wilcoxon signed rank test untuk menentukan apakah normalisasi mampu meningkatkan performa dari analisis sentimen. Dari hasil uji hipotesis diperoleh bahwa hasil uji keseluruhan dari performa kamus menunjukkan nilai p-value kurang dari 0,05. Dengan begitu, normalisasi pada analisis sentimen berbahasa indonesia tidak menyebabkan kenaikan performa dari indikator akurasi, presisi, dan recall.
Pengembangan Perangkat Microservices untuk Analisis Media Sosial sebagai Pendukung Pelacakan Penyebaran Tuberculosis Ronaldo Cristover Octavianus; Dzikri Robbi; Laras Ervintyana; Hapnes Toba
Jurnal Linguistik Komputasional Vol 5 No 1 (2022): Vol. 5, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v5i1.70

Abstract

Tuberculosis (TBC) adalah suatu penyakit menular yang disebabkan oleh kuman Mycobacterium Tuberculosis. Penyakit ini sangat berbahaya dan perlu ditangani segera jika ada yang terindikasi tertular, namun sangatlah sulit untuk melakukan pelacakan bagi mereka yang memiliki gejala karena pada awalnya sangat mirip dengan gejala batuk biasa. Riset yang dipaparkan dalam makalah ini bertujuan untuk mengumpulkan data dari media sosial yang terkait dengan penyakit TBC tersebut. Data media sosial, khususnya Twitter, akan diproses nilai sentimennya. Di samping itu, dikembangkan pula perangkat berbasis microservices guna melakukan ekstraksi data Twitter dan pengolahan dashboard pemberi informasi untuk wilayah yang disinyalir terdapat penderita TBC. Hasil penelitian menunjukkan bahwa tingkat akurasi sentimen perlu untuk ditingkatkan dengan model yang dilengkapi dengan kata-kata non-formal (slang) dan nuansa bahasa daerah. Namun demikian, infrastruktur pengolah data dengan berbasis pada microservices telah berhasil dikembangkan dengan baik, dan dapat digunakan pada aplikasi lain yang sejenis.
Analisis Sentimen Terhadap Pembelajaran Daring Dengan Algoritma Naive Bayes Classifier Fajar Sidik; Ibnu Suhada; Azhar Haikal Anwar; Firman Noor Hasan
Jurnal Linguistik Komputasional Vol 5 No 1 (2022): Vol. 5, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v5i1.79

Abstract

Pandemi COVID-19 merupakan penyakit yang skala penyebarannya terjadi secara global di seluruh dunia, termasuk Indonesia. Banyak bidang yang terkena dampak pandemi ini termasuk pendidikan. Indonesia saat ini sedang menjalankan strategi pembelajaran daring yang menimbulkan banyak opini masyarakat. Analisis sentiment pada cabang Text Mining digunakan untuk mengklasifikasi suatu entitas pada dokumen teks yang terdiri dari dua kelas yaitu positif dan negatif, kelas tersebut diperoleh dengan mengklasifikasikan dataset headline dan substansi berita terkait pembelajaran daring. Tujuan dari artikel ini adalah untuk melakukan prediksi pendapat orangtua terhadap pembelajaran daring serta mengetahui nilai akurasi dari pendapat tersebut dengan algoritma Naïve Bayes Classifier. Artikel ini menggunakan metode TF-IDF untuk melakukan pembobotan teks. Hasil dari artikel ini terlihat bahwa algoritma Naïve Bayes Classifier mampu melakukan prediksi kalimat positif dan negatif dengan nilai 62,5% positif dan 37,5% negatif dari 40 data pendapat orangtua dan nilai akurasi sebesar 65% berdasarkan 100 berita positif dan 100 berita negative
Peringkasan Otomatis Multi Dokumen menggunakan Hirarki Kluster Lukman Hakim; Fadli Husein Wattiheluw; Agus Zainal Arifin; Aminul Wahib
Jurnal Linguistik Komputasional Vol 1 No 2 (2018): Vol. 1, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v1i2.86

Abstract

Multi-document summarization is a technique for getting information. The information consists of several lines of sentences that aim to describe the contents of the entire document relevantly. Several algorithms with various criteria have been carried out. In general, these criteria are the preprocessing, cluster, and representative sentence selection to produce summaries that have high relevance. In some conditions, the cluster stage is one of the important stages to produce summarization. Existing research cannot determine the number of clusters to be formed. Therefore, we propose clustering techniques using cluster hierarchy. This technique measures the similarity between sentences using cosine similarity. These sentences are clustered based on their similarity values. Clusters that have the highest level of similarity with other clusters will be merged into one cluster. This merger process will continue until one cluster remains. Experimental results on the 2004 Document Understanding Document (DUC) dataset and using two scenarios that use 132, 135, 137 and 140 clusters resulting in fluctuating values. The smaller the number of clusters does not guarantee an increase in the value of ROUGE-1. The method proposed using the same number of clusters has a lower ROUGE-1 value than the previous method. This is because in cluster 140 the similarity values ​​in each cluster experienced a decrease in similarity values.
Analysis Sentiment of Community Response on Cooking Oil Price Increase Policy With Naive Bayes Classifier Algorithm Hasan, Firman Noor; Sidik, Fajar; Afikah, Prista
Jurnal Linguistik Komputasional Vol 5 No 2 (2022): Vol. 5, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v5i2.99

Abstract

Cooking oil is a basic need for Indonesian people. Indonesia experienced a shortage of oil in March 2022. This has become a hot conversation on Twitter social media last March, many people think positively or negatively. But behind it all there are different assessments of the parties who feel the pros and cons, various parties have different points of view. In this article, we conduct a sentiment analysis on the public's response to the scarcity of cooking oil using a dataset obtained from the Twitter digital platform. This article aims to classify tweets related to the scarcity of cooking oil into positive and negative sentiments using a machine learning strategy using the Naive Bayes method. This algorithm was chosen to make it easier for the public to make choices and to know the level of accuracy of the method, where the level of accuracy obtained from the nave Bayes classifier method 72%.
Analisis Sentimen Pergerakan Harga Mata Uang Kripto (Cryptocurrency) Menggunakan TextBlob-NLTK (Natural Language Toolkit) Talahaturuson, Esther Yolanda; Junaedi, Lukman; Gumelar, Agustinus Bimo
Jurnal Linguistik Komputasional Vol 5 No 2 (2022): Vol. 5, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v5i2.83

Abstract

Mata uang kripto atau yang sering disebut cryptocurrency terus mengalami peningkatan pengguna hingga saat ini. Dengan cara kerjanya yang terdesentralisasi, kripto telah berkembang menjadi aset investasi yang diperdagangkan. Namun dalam waktu yang bersamaan, fluktuasi harga tidak dapat terlepas dari karakteristik cryptocurrency ini. Hal tersebut membuat setiap sentimen dalam pasarnya mempengaruhi pergerakan harga yang sedang terjadi. Pada penelitian ini dilakukan analisa sentimen pada Bitcoin, yang merupakan kripto dengan skala pasar terbesar saat ini, menggunakan data Twitter yang terjadi selama 7 hari. Pemilihan Twitter sebagai media utama yang dianalisa adalah tingginya tingkat pengguna dalam skala dunia yang mengemukakan pendapat mengenai cryptocurrency. Pengambilan data tweet dilakukan dengan menggunakan Twint, salah satu library python yang tersedia secara open-source. Serta digunakan data pergerakan harga harian yang diambil melalui investing.com, platform pasar keuangan yang menyajikan data secara real-time. Setiap data tweet akan diproses dan dianalisa secara otomatis berdasarkan nilai subjectivity dan polarity menggunakan TextBlob. Berdasarkan serangkaian tahap penelitian yang diterapkan, didapatkan sebanyak 89% sentimen positif pada tweet Bahasa Indonesia dan 42% sentimen positif pada tweet Bahasa Inggris. Hasil penelitian tersebut selaras dengan pergerakan harga harian yang sedang terjadi pada periode waktu yang sama.
Analisis Sentimen Opini Masyarakat Terkait Penyelenggaraan Sistem Elektronik Menggunakan Metode Logistic Regression Hanif, Isa Faqihuddin; Affandi, Irfan Ricky; Hasan, Firman Noor; Sinduningrum, Estu; Halim, Zuhri
Jurnal Linguistik Komputasional Vol 5 No 2 (2022): Vol. 5, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v5i2.103

Abstract

Keamanan data menerapkan salah satu hal terpenting dalam menggunakan internet. Kebocoran data pribadi pengguna di internet dapat dimanfaatkan oleh orang yang tidak berkepentingan untuk berbagai macam tindakan kriminal. Upaya melindungi data pribadi masyarakat Indonesia, pemerintah melalui Kemkominfo membuat serta menerapkan sebuah kebijakan Penyelenggaraan Sistem Elektronik (PSE). Dalam penerapan PSE mendapatkan berbagai macam opini dari masyarakat Indonesia salah satunya yaitu pada platform twitter. Opini yang dikeluarkan oleh masyarakat ada yang bersifat negatif, netral maupun bersifat positif. Adapun tujuan penelitian ini yaitu mengetahui jumlah sentimen negatif, netral serta positif terhadap opini masyarakat terhadap PSE dimana dataset tersebut diperoleh dari platform twitter serta mengetahui nilai akurasi dari hasil uji evaluasi dari penerapan algoritma Logistic Regression. Hasil luaran dari 1073 dataset tentang opini dari masyarakat terhadap PSE didapatkan sebanyak 126 sentimen bersifat negatif, sebanyak 657 sentimen bersifat netral serta sebanyak 291 sentimen yang bersifat positif dengan nilai akurasi penerapan algoritma Logistic Regression sebesar 79.07%. Hal tersebut memperlihatkan bagaimana opini masyarakat Indonesia yaitu sebagian besar setuju terhadap diberlakukannya PSE namun masih ada beberapa masyarakat yang belum bisa menerima kebijakan tersebut.
Sistem Rekomendasi Pembuatan Sampiran Pantun Menggunakan Tail Similarity Monika, Winda; Evizariza, Evizariza; Nasution, Arbi Haza
Jurnal Linguistik Komputasional Vol 5 No 2 (2022): Vol. 5, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v5i2.111

Abstract

Pantun adalah puisi lama bentuk tradisi lisan melayu yang termasuk dalam warisan budaya tak benda. Di samping maraknya kegiatan berpantun di masyarakat, ditemukan bahwa pantun modern saat ini banyak terdapat penyimpangan dimana sebagian tidak mencerminkan nilai-nilai leluhur, tidak sesuainya jumlah larik dalam bait, jumlah kata dalam larik yang tidak menentu, sampiran tidak mengantarkan sisi pantun, serta tidak memperhatikan susunan rima pantun. Oleh karena itu, pada penelitian ini dibangun sistem rekomendasi pembuatan sampiran pantun menggunakan tail similarity. Dengan input dua baris isi, sistem akan memberikan rekomendasi sampiran yang sesuai dengan skema rima ab-ab dengan melakukan perbandingan urutan antara kata terakhir dari isi A & isi B dengan kata terakhir dari sampiran A & sampiran B dari seluruh pantun di basis data. Algoritma ini mampu memberikan rekomendasi sampiran pantun dengan tepat sesuai dengan kemiripan kata akhir.
GAN-Based End to End Text-to-Speech System for Indonesian Language Dhiaulhaq, Moch Azhar; Ginanjar, Rizki Rivai; Lestari, Dessi Puji
Jurnal Linguistik Komputasional Vol 5 No 2 (2022): Vol. 5, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v5i2.115

Abstract

The developments of the modern text-to-speech (TTS) technology have matured in which the direction of the recent approaches has moved toward the optimization of the system and TTS modeling from the resource-scarce languages, rather than finding new model architectures. In this paper, a novel approach to modeling modern end-to-end (E2E) TTS for Indonesian language with the integration of three different generative adversarial networks (GAN)-based vocoders for comparison is proposed. Based on the evaluation, the proposed system shows promising results with the mean opinion score (MOS) value of 4.60 while still maintaining fast inference speed, proven by the real-time factor (RTF) value under one.