Claim Missing Document
Check
Articles

Found 10 Documents
Search
Journal : Indonesian Journal on Computing (Indo-JC)

Named Entity Recognition for an Indonesian Based Language Tweet using Multinomial Naive Bayes Classifier Ramadhyni Rifani; Moch Arif Bijaksana; Ibnu Asror
Indonesia Journal on Computing (Indo-JC) Vol. 4 No. 2 (2019): September, 2019
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2019.4.2.330

Abstract

In Natural Languange Processing (NLP), Named Entity Recognition (NER) is a sub discussion that is widely used for research. the main task of Named Entity Recognition (NER) is to help identify and detect the entity names from a word in a sentence. The data sources we use are a real time Indonesian language tweets that often occur, which the number of letter each tweet is limited to 280 characters. The words contained in that Indonesian language tweets can refer to the name of the entity, location, or organization, so to determine the name of that entity, it must be considered first by looking at the word patterns around it. In Indonesia, an average tweet posted from an account at least is 1-3 tweets per day which contain a formal and non-formal contents that made this a difficult challenge to provide the right entity naming. In this research, we are naming the entities from the Indonesian language tweets by using the Multinomial Naive Bayes Classifier algorithm. The system uses precision, recall,and f-measure as evaluation metrics. Naming this entity is able to classify with a value of f-1 reaching 80%.
Pembangunan Pensejajaran Kata Monolingual (Monolingual Word Alignment) pada Terjemahan Al-Quran Bahasa Indonesia kurnia sari lingga; Moch Arif Bijaksana; Arie Ardiyanti
Indonesia Journal on Computing (Indo-JC) Vol. 4 No. 2 (2019): September, 2019
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2019.4.2.331

Abstract

Paper ini membahas tentang pembangunan pensejajaran kata monolingual pada terjemahan Al-Quran Bahasa Indonesia. Topik ini diambil karena alignment merupakan komponen utama dari beberapa pemrosesan bahasa alami yaitu textual entailment recognition, textual similarity identification, paraphrase detection, question answering dan text summarization. Selain itu terjemahan Al-Quran ini sangat banyak versinya sehingga membutuhkan penafsiran untuk mengartikan terjemahan yang berbeda namun memiliki makna yang sama. Dengan adanya teknik ini beberapa kata terjemahan Al-Quran yang berbeda dapat disejajarkan, sehingga kata-kata tersebut akan terkelompokkan berdasarkan kemiripan semantiknya. Teknik ini juga dapat digunakan lebih lanjut untuk pembangunan synonim set dan WordNet. Inputan dari sistem berupa pasangan terjemahan untuk sebuah ayat yang sama. Evaluasi pada penelitian ini menghasilkan skor korelasi 0.82 dengan nilai toleransi kesalahan pada sistem sebesar 0.18. Korelasi antar ayat yang memiliki kemiripan semantik sejauh penelitian ini sudah dapat dikatakan memadai namun jika ingin ditingkatkan kembali maka diperlukannya fitur dan basis pengetahuan yang lebih lengkap lagi.
Analysis of the Commutative Method Approach on English Thesaurus for Developing Synonym Sets Arini Rohmawati; Moch. Arif Bijaksana; Kemas Muslim Lhaksmana
Indonesia Journal on Computing (Indo-JC) Vol. 4 No. 2 (2019): September, 2019
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2019.4.2.332

Abstract

WordNet is a lexical database for languages, the difference between WordNet and dictionaries in general is that WordNet focuses on the synonyms. The main unit of WordNet is synonym set (synset), synset is a set of one or more words that have the same meaning and certainly can be replaced in certain contexts. Synset is a very important element in implementing WordNet. In this paper, an analysis of the synonym extraction process is carried out by using commutative approach, the data test obtained from the Oxford Paperback Thesaurus by taking 51 word entries. Commutative method has similar characters with synonym set, synonym set can replace each other in certain contexts. The data test extraction process is carried out until the performance measurement evaluation process using F1Score. The system generates synonym sets that matched with the manual extraction, the result of F1Score between the program and Princeton synonym sets are worth 10%.
Pembangunan Synonym Set untuk WordNet Bahasa Indonesia dengan Menggunakan Metode Komutatif dina juni restina; Moch. Arif Bijaksana; Kemas Muslim Lhaksamana
Indonesia Journal on Computing (Indo-JC) Vol. 4 No. 2 (2019): September, 2019
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2019.4.2.334

Abstract

Dalam NLP (Natural Language Processing) banyak keterkaitan semantik leksikal yang dapatdiaplikasikan, salah satunya adalah aplikasi WordNet. WordNet yang dibangun menggunakanmetode komutatif dalam proses pembangunan synonym set (synset)-nya. Synset yang akandibangun harus memiliki sifat komutatif baru dapat dikatakan synset yang bernilai valid, yangberarti jika sebuah kata w1 memiliki sinonim w2, maka w2 juga harus memiliki sinonimw1, seperti yang terjadi pada Princeton WordNet. WordNet pertama kali dibuat dalam bahasaInggris, sebelum para peneliti menerjemahkan kedalam berbagai bahasa seperti bahasa Jepang,bahasa Arab, bahasa Turki serta bahasa Indonesia dan bahasa lainnya. Untuk itu dibutuhkanpembangunan WordNet untuk turut serta membantu peneliti lain agar kedepanya WordNetBahasa Indonesia yang ada memiliki kosa kata yang lebih lengkap. WordNet yang akandibangun akan berfokus pada ekstraksi synset yaitu tahapan pertama pembangunan WordNetsebelum tahapan relasi antar synset dan gloss kata. Pembangunan synset ini menggunakankamus Tesaurus Bahasa Indonesia sebagai sumber kata. Nilai F-measure dari pembangunansynset dengan menggunakan metode komutatif adalah sebesar 66 persen.Kata Kunci: WordNet Bahasa Indonesia, Synset dan Metode komutatif
Sistem Pencarian Lintas Ayat Al-Qur'an Berdasarkan Kesamaan Fonetis Eki Rifaldi; Moch Arif Bijaksana; Kemas Muslim Lhaksamana
Indonesia Journal on Computing (Indo-JC) Vol. 4 No. 2 (2019): September, 2019
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2019.4.2.342

Abstract

Mencari teks Arab dalam Al-Qur'an tidak mudah bagi pengguna yang tidak memiliki cukup pengetahuan tentang bahasa dan tulisan Arab. Banyaknya ayat dan perbedaan bahasa dalam Al-Qur'an menimbulkan kesulitan tersendiri untuk pencarian ayat oleh masyarakat muslim Indonesia. Dibutuhkan sistem pencarian ayat Al-Qur'an berbasis fonetis yang dapat memudahkan pengguna dalam mencari ayat menggunakan tulisan latin berhuruf alfabet yang merepresentasikan bunyi pengucapan pengguna. Sebagai contoh, jika dilakukan pencarian kata الْحَمْدُ لِلَّـهِ maka sistem akan menampilkan seluruh ayat yang memiliki kemiripan bunyi dengan kata kunci. Untuk saat ini, sudah ada sistem pencarian ayat Al-Qur'an dengan menggunakan phonetic string matching, namun terbatas hanya dapat menemukan ayat berdasarkan query yang tidak lintas ayat. Kemudian jika dilakukan pencarian kata lintas ayat يَوْمِ الدِّينِ (4) إِيَّاكَdengan pencocokan string dalam database, maka sistem tidak dapat memberikan hasil pencarian dua ayat sekaligus. Oleh karena itu, dibangun suatu sistem pencarian ayat Al-Qur'an berdasarkan kemiripan bunyi (fonetis) yang dapat melintasi ayat. Algoritma N-gram berupa trigram digunakan untuk menemukan ayat-ayat yang memiliki kemiripan bunyi (fonetis) karena memiliki MAP yang tinggi untuk kata kunci panjang. Untuk mencari lintas ayat, lima buah trigram ayat selanjutnya ditambahkan ke ujung trigram ayat sebelumnya. Kemudian diperoleh nilai MAP 0,9 dan Recall 0,93.
Pembangunan Korpus dari Rangkaian Kata yang Berulang pada Al-Quran Miftahul Adnan Rasyid; Moch Arif Bijaksana; Ibnu Asror
Indonesia Journal on Computing (Indo-JC) Vol. 4 No. 3 (2019): December, 2019
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2019.4.3.351

Abstract

Salah satu cara untuk memahami al-Quran adalah dengan melakukan penafsiran yang benar dan tidak menyimpang, yaitu dengan memperhatikan redaksi kata yang digunakan dalam merangkai ayat-ayat al-Quran. Dengan cara tersebut, maka dapat ditemukan ayat lainnya yang memiliki rangkaian kata yang menyerupai. Salah satu cara untuk mencari ayat yang sama berdasarkan rangkaian kata tersebut adalah dengan menggunakan pendekatan Longest Common Subsequence (LCS) yang dapat mencari rangkaian kata terpanjang bersama dari suatu pasangan teks. Hasil dari pencarian ayat yang sama ini kemudian dikumpulkan hingga menjadi korpus yang diharapkan dapat membantu umat manusia dalam menafsirkan al-Quran. Penelitian ini menghasilkan suatu sistem yang dapat mencari ayat yang sama menggunakan pendekatan LCS, kemudian hasilnya akan dikumpulkan menjadi suatu korpus berdasarkan hasil LCS. Hasil rata-rata yang diperoleh dari beberapa pengujian yang telah dilakukan adalah Data Arab mendapatkan nilai precision adalah 46.84%, nilai recall adalah 96.13%, dan nilai f1-score adalah 62.96%. Sedangkan untuk Data Indonesia mendapatkan nilai precision adalah 40.57%, nilai recall adalah 97.56%, dan nilai f1-score adalah 57.04%
Entity Recognition for Quran English Version with Supervised Learning Approach Muhammad Aris Maulana; Moch. Arif Bijaksana; Arief Fatchul Huda
Indonesia Journal on Computing (Indo-JC) Vol. 4 No. 3 (2019): December, 2019
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2019.4.3.362

Abstract

The Quran is a Muslim holy book that consists of 6236 ayat or verses which divides into 144 surahs or chapters. In each chapter, there are many entities scattered in each verse. For a person, finding a particular entity will be difficult without a classification process, Resulting in difficulties in understanding the Quran. A system can be modeled to extract the information on entities in the Quran to solve this problem. Therefore, we want to offer a method to identify and classify entities using Entity recognition. The system will use the SVM techniques where the system will be given various entities from the Quran as an input to be able to identify correct entities. We are using the dataset obtained from website tanzil.net consists of 19.473 tokens and 720 entities. The classification scenario using a linear kernel with unigram produces the highest f-measure value of 0.75.Al-Quran merupakan kitab suci Muslim yang terdiri dari 6236 ayat atau bait yang dibagi menjadi 144 surah atau bab. Di setiap bab, ada banyak entitas yang tersebar di setiap ayat. Bagi seorang individu, menemukan entitas tertentu akan sulit tanpa proses klasifikasi yang membuat kesulitan dalam memahami Quran. Sebuah sistem dapat dimodelkan untuk mengekstrak informasi tentang entitas dalam Al-Quran untuk menyelesaikan masalah ini. Oleh karena itu, kami menawarkan sistem untuk mengidentifikasi dan mengklasifikasikan entitas menggunakan Entity Recognition. Sistem akan menggunakan teknik SVM di mana sistem akan diberikan berbagai entitas dari Quran sebagai input untuk dapat mengidentifikasi entitas yang benar. Kami menggunakan dataset yang diperoleh dari situs web tanzil.net terdiri dari 19.473 tokens dan 720 entitas. Skenario klasifikasi yang menggunakan linear kernel dengan unigram memperoleh nilai f-measure tertinggi sebesar 0,75.
Anaphora Resolution on Al-Quran with Indonesian Translation Arlinda Dwi Ardiyani; Moch Arif Bijaksana; Arief Fatchul Huda
Indonesia Journal on Computing (Indo-JC) Vol. 5 No. 2 (2020): September, 2020
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2020.5.2.496

Abstract

Al-Quran is the holy book of Islam, in Al-Quran we often find many cases of anaphora. Anaphora is a pronoun, for example “it” which refers to an object (antecedent) in the previous sentence. Antecedent of a pronoun is very important to understand the Al-Quran. Coreference Resolution with the classification model using the support vector machine method are needed to find out the antecedent. In this research, we use i feature and j feature for the extraction process. Based on the evaluation results, the system is able to find the antecedent of an anaphor with the best accuracy value of 86.36%.
Implementation of Dependency Parser Using Artificial Neural Network Methods Nurul Izzah; Moch Arif Bijaksana; Arief Fatchul Huda
Indonesia Journal on Computing (Indo-JC) Vol. 5 No. 3 (2020): December, 2020
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2020.5.3.504

Abstract

In recent years, parsing has become very popular within the scope of NLP (Natural Language Processing) with the presence of Dependency Parser. However, almost all existing Dependency Parser do classifications based on millions of sparse indicator features. This feature is not only bad in drawing conclusions, but also significantly limits the speed of parsing so that the resulting parsing is not optimal. To overcome these problems, changing the use of sparse features becomes dense features to reduce sparsity between words. The Artificial Neural Network classification method is used to produce fast and concise parsing in the Transition-Based Dependency Parser by using 2 hyperparameters. The dataset used in this study is Arabic, Chinese, English, and Indonesian. Based on the evaluation that has been done, it shows a higher result using the second hyperparameter. In testing with English test data, the accuracy value of LAS (Labeled Attachment Score) is 80.4% and UAS (Unlabelled Attachment Score) is 83%, Then with dev data obtained an accuracy value of LAS 81.1% and UAS 83.7%, and parsing speed of 98 sentences per second (sent/s).Keywords: Parsing, dependency parser, transition-based dependency parsing.
Implementation of Dependency Parser Using Artificial Neural Network Methods Izzah, Nurul; Bijaksana, Moch Arif; Huda, Arief Fatchul
Indonesian Journal on Computing (Indo-JC) Vol. 5 No. 3 (2020): December, 2020
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2020.5.3.504

Abstract

In recent years, parsing has become very popular within the scope of NLP (Natural Language Processing) with the presence of Dependency Parser. However, almost all existing Dependency Parser do classifications based on millions of sparse indicator features. This feature is not only bad in drawing conclusions, but also significantly limits the speed of parsing so that the resulting parsing is not optimal. To overcome these problems, changing the use of sparse features becomes dense features to reduce sparsity between words. The Artificial Neural Network classification method is used to produce fast and concise parsing in the Transition-Based Dependency Parser by using 2 hyperparameters. The dataset used in this study is Arabic, Chinese, English, and Indonesian. Based on the evaluation that has been done, it shows a higher result using the second hyperparameter. In testing with English test data, the accuracy value of LAS (Labeled Attachment Score) is 80.4% and UAS (Unlabelled Attachment Score) is 83%, Then with dev data obtained an accuracy value of LAS 81.1% and UAS 83.7%, and parsing speed of 98 sentences per second (sent/s).Keywords: Parsing, dependency parser, transition-based dependency parsing.
Co-Authors Abdul Raffi Malikul Mulki Abdurrahman, Azzam Ade Romadhony Adelya Astari Aditya Hanif Utama Ageng Prasetio Agni Octavia Agung Wardhana Z. Nasution Akip Maulana Al Faraby, Said Alfiya El Hafsa Alfredo Primadita Ali Ridho Fauzi Rahman Angelina Sagita Sastrawan Annisa Dian Muktiari annisa Imadi Puti Anugerah, Sri Mulyani Aqila, Neca Ardhi Akmaludin Jadhira Arie Ardiayanti Suryani Arie Ardiyanti Arie Ardiyanti Suryani Arief Fatchul Huda Arief Fatchul Huda Arief Fatchul Huda Arini Rohmawati Arlinda Dwi Ardiyani aulia khemas Heikhmakhtiar Bagus Ardisaputra Bambang Ari Wahyudi Bening Suryani Pratiwi Bhudi Jati Prio Utomo Darwiyanto , Eko Dea Delvia Arifin Dhafin Putra Aldi dina juni restina Djusnimar Zultilisna Donni Richasdy Dwi Marlina Sari Dzaky Ikram Dzidny, Dimitri Irfan Eki Rifaldi Eko Darwiyanto Fairuz Ahmad Hirzani Fakhruddin, Muhammad Rafi Falia Amalia Fauzan Ramadhan Fauziah, Salma Fernandy Marbun Floribertus Yericho Pramudya Galih Rizky Prabowo Gde Surya Pramartha Grace Duma Tambunan Hafsa, Alfiya El Huda, Arief Fatchul Huda, Arief Fatchul I Gusti Ayu Chandra Devi I Komang Resnawan Tri Putra I Made Darma Yoga I Nyoman Cahyadi Wiratama I Putu Prima Ananda Ibnu Asror Idzhari Syaeful Ma'mun - Ina Rofi’atun Nasihati Indra Lukmana Sardi Intan Khairunnisa Fitriani IZZAH, NURUL Jihan Ratnasari1 KD Krisna Dwipayana Kemas M Lhaksmana Kemas Muslim Lhaksmana Khalid kurnia sari lingga Kurniawan Adina Kusuma Luh Putri Ayu Ningsih Lukman Abdurrahman Meiditia Mustika Rani Miftahul Adnan Rasyid Mochamad Agung Permana Mohamad Syahrul Mubarok Mubaroq Iqbal Muhamad Jibril Muhammad Adib Imtiyazi Muhammad Althoof Nabalah Muhammad Aris Maulana Muhammad Budi Hartanto Muhammad Fakhri Ar-Razi Muhammad Faris Abdussalam Muhammad Haerunnur Syahnur Muhammad Rizki Chairulloh Muhammad Zidny Naf'an Munirsyah Munirsyah Muthia Virliani Mutia, Aufa Naufal Rasyad Neca Aqila Nisaa' 'Ainulfithri Nur Indrawati, Nur Nurul Izzah Patra , Gifaro Andyano Pramudita Oktaviani Prasetio, Ageng Puruhita Ananda Arsaningtyas Purwita, Naila Iffah Putri Cendikia Rahmad Geri Kurniawan Ramadhyni Rifani Ramanti Dwi Indrapurasih Rendy Andrian Saputra Retno Diah Ayu Ningtias Rifki Wijaya Riska Junia Wulandari Rizky Caesar Irjayana Ryan Fahreza Maliki Said Al Farab Sakinah Rahmi Salma Fauziah Sang Made Naufal Caesarya Mahardhika Saputro3,, Widyanto Adi Sarah Suryaningsih Sarja Asra Winata Sendika Panji Anom Shaufiah . Shervano Naodias Siagian Siti Sa'adah Siti Sa’adah Suryaningsih, Sarah Tegar Graha Adiwiguna Teuku Muhammad Ikhsan Totok Suhardijanto Triawati, Candra Valentino Rossi Fierdaus Wahyu Kurniawan Wahyu Purbaningrum Warih Maharani Widi Astuti Winda Eka Samodra Wiwin Aminah Yusuf Anugrah Putra Aditama ZK Abdurahman Baizal