Jurnal Linguistik Komputasional
Jurnal Linguistik Komputasional (JLK) menerbitkan makalah orisinil di bidang lingustik komputasional yang mencakup, namun tidak terbatas pada : Phonology, Morphology, Chunking/Shallow Parsing, Parsing/Grammatical Formalisms, Semantic Processing, Lexical Semantics, Ontology, Linguistic Resources, Statistical and Knowledge based methods, POS tagging, Discourse, Paraphrasing/Entailment/Generation, Machine Translation, Information Retrieval, Text Mining, Information Extraction, Summarization, Question Answering, Dialog Systems, Spoken Language Processing, Speech Recognition and Synthesis.
Articles
67 Documents
Analisis Sentimen Opini Masyarakat Terkait Pelayanan Jasa Ekspedisi Anteraja Dengan Metode Naive Bayes
Affandi, Irfan Ricky;
Hasan, Firman Noor;
Pratiwi, Nunik;
Halim, Zuhri
Jurnal Linguistik Komputasional Vol 5 No 2 (2022): Vol. 5, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.26418/jlk.v5i2.107
Peningkatan jumlah transaksi pada berbagai platform e-commerce mempunyai implikasi terhadap peningkatan penggunaan jasa ekspedisi. Salah satu perusahaan jasa ekspedisi yang ada di Indonesia yaitu anteraja, dimana perusahaan tersebut harus bisa memiliki inovasi untuk mempunyai hubungan serta memberikan pelayanan yang terbaik bagi penggunanya. Saat ini banyak pengguna layanan anteraja mempunyai pendapat yang beragam terhadap layanan mereka pada media sosial twitter. Penelitian ini menerapkan teknik sentiment analysis untuk membantu mengevaluasi, menganalisis, menilai, serta mengetahui sikap masyarakat terhadap pelayanan Anteraja. Metode untuk mengkategorikan sentimen yang digunakan oleh peneliti yaitu menerapkan algoritma naive bayes yang mempunyai akurasi tinggi, serta prosesnya sederhana dan cepat. Peneliti juga menggunakan bantuan perangkat lunak python untuk proses pengambilan dataset pada twitter serta rapidminner studio untuk pengolahan data serta penerapan algoritma. Hasil dari proses pengolahan data yang dilakukan oleh peneliti didapatkan dari 1180 data, jumlah kategori yang paling banyak yaitu kategori sentimen positif sebesar 638 lalu kategori sentimen negatif sebesar 493 sedangkan paling sedikit yaitu kategori sentimen netral sebanyak 49. Hal ini menunjukkan dari 1180 data bahwa banyak masyarakat yang menyukai pelayanan yang diberikan oleh jasa ekspedisi Anteraja, namun tidak sedikit masyarakat yang masih kurang puas terhadap pelayan yang diberikan. Nilai akurasi penerapan algoritma naive bayes dalam penelitian ini diperoleh persentase sebesar 85.06% yang menunjukkan bahwa data tersebut dapat digunakan sebagai dasar bagi perusahaan untuk pertimbangan pengambilan keputusan.
Penggunaan Pemodelan Topik dalam Sistem Temu Kembali Dokumen Termirip
Krisnawati, Lucia Dwi;
Lim, Joseph F;
Virginia, Gloria
Jurnal Linguistik Komputasional Vol 6 No 1 (2023): Vol. 6, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.26418/jlk.v6i1.78
Sistem temu kembali didesain untuk menemukan informasi yang relevan dengan kueri pengguna, sedangkan pencarian dan penemuan dokumen termirip secara leksikal maupun sintaksi masuk ranah sistem deteksi plagiasi dan Daur Ulang teks (text reuse) yang membutuhkan sistem temu kembali sebagai salah satu modul di awalnya. Perbedaan keduanya terletak di bentuk kueri, dimana sistem temu kembali menerima kueri dengan jumlah token yang terbatas, sedangkan kueri dalam sistem deteksi plagiasi diolah dari sebuah dokumen input. Penelitian ini mencoba membangun sistem temu kembali untuk menemukan kandidat dokumen termirip yang diperlukan oleh kedua sistem tersebut. Untuk itu, pembentukan kueri dokumen input dihasilkan dengan memanfaatkan sistem Pemodelan Topik Lexikat. Elemen dari kumpulan topik ini kemudian diindek dalam Inverted Index maupun menjadi kueri dari dokumen uji. Metrik kemiripan Cosine digunakan untuk mengukur kemiripan antara kueri dokumen uji dengan dokumen sumber yang telah diindeks. Evaluasi sistem dilakukan dengan menggunakan metrik Macro-Averaged F1 (MAF) dan Break-Even Point (BEP). Eksperimen dilakukan dengan menggunakan 1-50 topik di tiap dokumen uji yang berjumlah 474. Hasil eksperimen dengan 11 skenario pengujian menunjukkan nilai MAF tertinggi mencapai 0.32 – 0.33 saat menggunakan 1 topik sebagai kueri. Nilai ini relatif kecil karena tidak diterapkan nilai ambang dari persamaan Cosine sebagai proses penyaringan (filtering) dokumen yang akan dievaluasi. Jumlah dokumen minimal yang diperlukan untuk mencapai nilai BEP tertinggi adalah 243. Jumlah dokumen ini bisa dijadikan rekomendasi sebagai nilai ambang dalam proses penyaringan dokumen.
Klasifikasi Topik Berita Deutsche Welle Indonesia dengan Kata Kunci Indonesia Menggunakan Metode Multinomial Naive Bayes
Ayuni, Amalia Qurrota;
Helen, Afrida;
Yuliawati, Susi
Jurnal Linguistik Komputasional Vol 6 No 1 (2023): Vol. 6, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.26418/jlk.v6i1.93
Penerapan klasifikasi berita berdasarkan topik dan sub-topik dapat membantu pengguna media berita dalam menemukan informasi yang dibutuhkan secara lebih spesifik sehingga meningkatkan efisiensi waktu. Deutsche Welle Indonesia merupakan salah satu media berita asing yang terkenal akan publikasinya mengenai perkembangan politik dan teknologi. Penelitian ini bertujuan untuk mengklasifikasi topik berita khususnya mengenai Indonesia yang dipublikasikan oleh media berita Deutsche Welle Indonesia untuk mengetahui fokus pemberitaan dari media tersebut. Sebanyak 682 data dikumpulkan dan topik berita dengan jumlah terbanyak adalah berita politik, sosial budaya, dan kesehatan. Dengan tahapan preprocessing, labelling, training, testing, pembobotan tf-idf, dan klasifikasi data dengan algoritma multinomial naïve bayes didapatkan hasil akurasi tertinggi sebesar 88,3%. Klasifikasi topik diprediksi dengan confusion matrix dengan hasil berupa sebagian besar label berhasil dideteksi dan terdapat beberapa data yang mengalami kesalahan prediksi karena mesin tidak dapat mengidentifikasi judul dengan kata yang sama namun memiliki konteks berbeda.
Prediksi Pergerakan Harga Saham Berdasarkan Berita Menggunakan Metode Long Short-Term Memory
Maharani, Fenny Feronika;
Wibisono, Yudi;
Siregar, Herbert
Jurnal Linguistik Komputasional Vol 6 No 1 (2023): Vol. 6, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.26418/jlk.v6i1.101
Bursa saham memiliki perilaku yang kompleks dan dinamis yang dapat mempersulit proses pengambilan keputusan investasi yang akurat. Penelitian ini membahas penggunaan dokumen berita untuk memprediksi pergerakan harga saham perusahaan yang sahamnya diperjual belikan di Bursa Efek Indonesia. Penelitian ini menggunakan model Word2vec untuk merepresentasikan berita ke dalam bentuk vektor dan Long Short-Term Memory untuk klasifikasi. Data berita yang digunakan adalah 11.854 dokumen berita yang membahas 750 emiten pada rentang tahun 2020-2021. Digunakan berbagai skenario eksperimen: (1) Durasi waktu; (2) arsitektur dan hyperparameter; dan (3) 100 emiten dengan kenaikkan tertinggi. Hasil eksperimen memperlihatkan bahwa berita paling besar pengaruhnya pada harga saham setelah 6 sampai 7 hari setelah terbit. Hasil F1-Score terbaik yang didapatkan adalah 0,32 untuk kelas harga saham naik dan 0,43 untuk kelas harga saham turun.
Ekstraksi Kata Kunci pada Bahasa Indonesia Menggunakan Metode Yake
Yusliani, Novi;
Plakasa, Gerald;
Abdiansah, Abdiansah;
Marieska, Mastura Diana;
Saputra, Danny Matthew
Jurnal Linguistik Komputasional Vol 6 No 1 (2023): Vol. 6, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.26418/jlk.v6i1.117
Peneliti, Mahasiswa, dan Juga Dosen biasanya melakukan penelitian untuk menghasilkan publikasi hasil penelitiannya. Saat ini pertumbuhan publikasi ilmiah terus meningkat. ketika publikasi akan di berikan ke reviewer maka publikasi yang kirimkan harus sesuai dengan bidang yang diampu oleh reviewer tersebut. Salah satu cara untuk mengetahui inti dari sebuah publikasi ilmiah yaitu dengan melakukan ekstraksi kata kuncinya. Metode yang digunakan untuk ekstraksi kata kunci salah satunya yaitu YAKE (Yet Another Keyword Extraction). Penelitian ini menggunakan dataset 100 publikasi ilmiah dari website jtiik, jatisi, dan jepin dengan topik Ilmu Komputer. Berdasarkan penelitian yang telah dilakukan, konfigurasi pada parameter Levenshtein Distance memiliki pengaruh terhadap hasil kata kuncinya. Evaluasi dari penelitian ini menghasilkan nilai f-measure sebesar 54,1% dan nilai akurasi sebesar 97,05% dengan parameter Levenshtein Distance < 2.
Named Entity Recognition on Tourist Destinations Reviews in the Indonesian Language
Hidayatullah, Ahmad Fathan;
Putra, Muhammad Fakhri Despawida Aulia;
Wibowo, Adityo Permana;
Nastiti, Kartika Rizqi
Jurnal Linguistik Komputasional Vol 6 No 1 (2023): Vol. 6, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.26418/jlk.v6i1.89
To find information about tourist destinations, tourists usually search the reviews about the destinations they want to visit. However, many studies made it hard for them to see the desired information. Named Entity Recognition (NER) is one of the techniques to detect entities in a text. The objective of this research was to make a NER model using BiLSTM to detect and evaluate entities on tourism destination reviews. This research used 2010 reviews of several tourism destinations in Indonesia and chunked them into 116.564 tokens of words. Those tokens were labeled according to their categories: the name of the tourism destination, locations, and facilities. If the tokens could not be classified according to the existing categories, the tokens would be labeled as O (outside). The model has been tested and gives 94,3% as the maximum average of F1-Score.
Analisis Komentar Cyberbullying Terhadap Kata Yang Mengandung Toksisitas Dan Agresi Menggunakan Bag of Words dan TF-IDF Dengan Klasifikasi SVM
Krisnandi, Dwi;
Ambarwati, Rini Novi;
Asih, Anggun Yuli;
Ardiansyah, Angga;
Pardede, Hilman Ferdinandus
Jurnal Linguistik Komputasional Vol 6 No 2 (2023): Vol. 6, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.26418/jlk.v6i2.85
Masyarakat menjadi orang yang anti sosial tidak banyak berkomunikasi dengan lingkungan dan mereka lebih menyukai komunikasi melalui internet atau social media. dengan internet atau social media orang bisa menyembunyikan identitas aslinya dan bisa mengakibatkan keburukan saat berkomunikasi atau memberi sebuah komentar di social media dengan menggunakan kata-kata yang buruk, menghina, tidak sopan mempermalukan, mengancam, mengganggu menghina, mengucilkan, merusak reputasi orang melalui internet atau teknologi digital. Hal seperti ini termasuk dalam tindak kejahatan yang dinamakan cyberbullying. Cyberbullying berdampak buruk bagi korbannya seperti mengakibatkan depresi, hingga yang terburuk hingga mengakibatkan seseorang melakukan bunuh diri. Cyberbullying sering menjadi masalah besar baik di tingkat nasional maupun global. Pada penilitian ini akan dibahas mengenai text mining alisis sentiment cyberbullying dengan menentukan kata yang mengandung toxicity dan aggression. Metode yang digunakan pada penelitian ini memakai model Bag of Word dan TF-IDF dengan klasifikasi SVM. Hasil dari penelitian ini didapat akurasi tertinggi dengan menggunakan model Bag of Word dengan akurasi sebesar 65,2% di banding dengan pemodelan menggunakan TF-IDF dengan akurasi sebesar 64,7% Hal ini menunjukkan bahwa penerapan Bag of Word mampu menghasilkan tingkat akurasi yang lebih baik dalam memprediksi kata yang mengandung cyberbullying dari penelitian ini dibandingkan dengan model TF-IDF.
Klasifikasi Berita Hoax Pembagian Kuota Internet Menggunakan Algoritma Modified K-Nearest Neighbor
Dalle, Asnir;
Rantung, Vivi Peggie;
Munaiseche, Cindy
Jurnal Linguistik Komputasional Vol 6 No 2 (2023): Vol. 6, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.26418/jlk.v6i2.105
Di zaman sekarang ini teknologi informasi sangat berkembang dengan pesat, sangat mudahnya masyarakat mengakses informasi lewat jejaring internet atau media sosial. Dengan mudahnya mengakses internet, dapat membuka peluang bagi masyarakat untuk menyebarkan informasi atau berita di media sosial. Namun disamping itu banyak bermunculan informasi atau berita palsu yang tidak dapat dipertanggung jawabkan oleh sumbernya, sehingga penelitian ini melakukan pengklasifikasian berita hoax pembagian kuota internet. Proses klasifikasi hoax akan menggunakan beberapa tahapan yaitu preprocessing. Pembobotan kata TF-IDF, sampai dengan proses klasifikasi dengan menggunakan algoritma Modified K-Nearest Neighbor, pada proses tersebut akan menggunakan Platform Google Collab (python). Hasil klasifikasi yang diperoleh yaitu ditunjukkan dengan default k-values dengan akurasi yang tertinggi terdapat pada k 25 dengan nilai precision 1%, recall 0,4444%, dan nilai akurasi 80,77%.
Implementasi Deep Feed-Forward Neural Network pada Perancangan Chatbot Berbasis Web Di UPPIK RSUD M. YUNUS
Faurina, Ruvita;
Gazali, M Jumli;
Herani, Icha Dwi Aprilia
Jurnal Linguistik Komputasional Vol 6 No 2 (2023): Vol. 6, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.26418/jlk.v6i2.123
UPPIK (Unit Pengaduan Pelanggan Informasi dan Konseling) pada RSUD M. Yunus memiliki peran penting dalam melayani pengunjung yang datang. Akan tetapi, tidak jarang dari pengunjung mengeluh dengan pelayanan dari UPPIK karena terbatasnya jam operasional kerja menyebabkan tidak ditemukannya staf/petugas yang berjaga sehingga membuat para pengunjung kebingungan dalam mencari informasi terkait RSUD M. Yunus. Selain itu, pandemi Covid-19 yang belum mereda mengharuskan masyarakat untuk menjaga jarak dan mengurangi interaksi antar individu. Sebagai tindaklanjut dari permasalahan ini dikembangkanlah sebuah automatic chatbot yang dapat melayani pengunjung seolah-olah berbicara langsung dengan staf/petugas tanpa adanya batasan waktu. Pada penelitian ini menggunakan algoritma Deep Feed-Forward Neural Network sebagai intent classifier untuk mengklasifikasi maksud dari pertanyaan yang diajukan oleh user. Deep Feed-Forward Neural Network adalah salah satu jenis Neural Network yang koneksi antar node tidak membentuk looping. Dataset yang digunakan adalah kumpulan data pasangan antara pertanyaan dan jawaban yang dikumpulkan melalui observasi langsung ke UPPIK RSUD M. Yunus dengan jumlah sebanyak 1464 pasangan data. Pengujian dilakukan memakai parameter pembagian dataset, jumlah epoch, dan batch size yang digunakan. Akurasi terbaik didapatkan dengan membagi dataset menjadi 80% data training sebanyak 1057 data, 10% data testing sebanyak 147 data, dan 10% validation sebanyak 132 data menggunakan epoch 300 dan mendapatkan hasil performa akurasi sebesar 91.98%. Sedangkan hasil evaluasi precision sebesar 0.99, recall sebesar 0.98 dan f1-score sebesar 0.99.
Analisis Sentimen dan Topik Perbincangan Netizen Indonesia Terkait Pengurangan Subsidi BBM
Mulia, Adi;
Dzikrillah, Akhmad Rizal
Jurnal Linguistik Komputasional Vol 7 No 1 (2024): Vol. 7, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.26418/jlk.v7i1.142
Abstract- This research was conducted with the aim that is based on problems that arise in society, namely the increase in fuel prices. The sentiment classification method applied by researchers is to use a lexicon corpus dictionary that takes into account positive and negative sentiment values. The researcher then compares the sentiment between before and after the fuel price increase policy. Furthermore, the researcher applied Latent Dirichlet Allocation or (LDA) topic modeling to find out whether the discussion of the fuel price increase became the main topic when the fuel rose. The results of this study show that after announcing the fuel price increase in September 2022, the percentage of negative tweets directed at President Jokowi has increased when compared to before announcing the fuel price increase. The percentage of positive tweets directed at President Jokowi decreased when compared to before raising fuel prices. In the month when President Jokowi announced the fuel price increase policy, namely in September 2022, the topic of conversation related to the fuel price increase policy was the most popular topic of conversation in tweets directed at President Jokowi. 33.8% of tweets that discussed the fuel price increase were negative tweets with the most popular topics of discussion for netizens with negative sentiments were topics related to criticism of the Jokowi administration.