Claim Missing Document
Check
Articles

People Entity Recognition for the English Quran Translation using BERT Retno Diah Ayu Ningtias; Moch. Arif Bijaksana
JURNAL MEDIA INFORMATIKA BUDIDARMA Vol 7, No 1 (2023): Januari 2023
Publisher : Universitas Budi Darma

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30865/mib.v7i1.5586

Abstract

The Quran is a holy book for Muslims all over the world. Therefore, the Quran is not only translated into Indonesian but also into many other languages, including English. The contents of the Quran are a collection of thousands of verses, each verse having different topics and entities. Sometimes, someone may find it difficult to understand and study the contents of the Quran. Therefore, to make it easier, it is done by extracting information and identifying various entities in the Quran, such as human entities. An important thing to do in order to extract information on human entities is to extract information related to the human entity itself first. Because it can help in the search process, particularly the search for names of people in the Quran. The extraction of human entities is commonly known as Named Entity Recognition (NER). With NER, it can automatically recognize important entities such as people's names, group names, and other entities in a sentence or verse in the Quran. Currently, research on the Quran's English translation is not widely done. Therefore, in this research, we are building an information extraction system model for human entities based on a pre-trained deep learning model called Bidirectional Encoder Representations from Transformer (BERT). The dataset used is made up of 19473 tokens and 720 entities taken from the website tanzil.net. The development of the model shows that BERT can be used to extract information for NER on the Quran translation in English by obtaining a F1-score value of 53 %.
Implementasi Word Sense Disambiguation Dengan Metode Maximal Marginal Relevance Pada Peringkasan Teks Bening Suryani Pratiwi; Shaufiah Shaufiah; Moch. Arif Bijaksana
eProceedings of Engineering Vol 4, No 1 (2017): April, 2017
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Dalam meringkas sebuah teks terdapat permasalahan yang muncul dan mempengaruhi hasil dari peringkasan teks tersebut. Permasalahan yang muncul seperti ambiguitas kata dan redundansi. Untuk meningkatkan kualitas dari peringkasan teks tersebut maka, permasalahan ambiguitas dan redundansi harus diatasi. Sehingga pada tugas akhir ini dilakukan peringkasan teks pada single dokumen yang mengimplementasi Word Sense Disambiguation dengan metode Maximal Marginal Relevance. Tahapan yang dilakukan terdiri dari Preprocessing, Word Sense Disambiguation, perhitungan Cosine Similarity, perhitungan Maximal Marginal Relevance, dan evaluasi. Pada tahapan preprocessing dilakukan cleaning pada data seperti stopwords removal, tokenization, remove tag, lemmatization dan stemming. Proses Word Sense Disambiguation dipilih untuk mengatasi masalah ambigu pada term dan diganti dengan synset term pada peringkasan teks tersebut. Pada peringkasan ini akan menggunakan cosine similarity untuk mengukur kemiripan setiap kalimat dengan kalimat pada keseluruhan isi dokumen. Sedangkan metode Maximal Marginal Relevance digunakan untuk merangking ulang hasil dari perhitungan cosine similarity dan memilih kalimat dengan nilai MMR paling tinggi yang akan dijadikan summary dengan nilai compresion rate yang ditentukan. Metode MMR termasuk metode yang sederhana namun efisien untuk mengurangi redundansi. Hasil peringkasan teks otomatis ini selanjutnya dievalusi dan dianalisis dengan pengukuran precision, recall, dan F-Measure dan dilihat dari hasil survey pembaca terhadap summary yang dihasilkan. Dengan nilai Recall 35%, Precision 21%, dan F-Measure 25%. Kata kunci : Word Sense Disambiguation, Maximal Marginal Relevance, Cosine Similarity.
Analisis Dan Implementasi Pencocokan String Berdasarkan Kemiripan Pengucapan (phonetic String Matching) Menggunakan Algoritma Metaphone Dalam Pencarian Ayat Al-qur’an Tegar Graha Adiwiguna; Moch. Arif Bijaksana; Shaufiah Shaufiah
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Telah ditemukan penelitian baru yang membuat Al-Qur’an dalam versi digital. Akan tetapi, pada umumnya perangkat lunak yang telah ada hanya menggunakan teknik Exact String Matching untuk melakukan pencarian informasi (ayat). Dan jika pengguna perangkat lunak ini salah dalam penulisan inputan maka perangkat lunak tidak akan memberikan solusi dari apa yang diinginkan oleh pengguna. Oleh karena itu, tujuan penelitian ini adalah membangun sistem pencarian dengan teknik fonetik atau pencocokan kata berdasarkan pengucapan (Phonetic String Matching) yang dapat digunakan untuk mengatasi permasalah tersebut. Dengan menggunakan Algoritma Metaphone dan Dice Similarity, sistem pencarian ayat Al-Qur’an ini akan melakukan pencocokan string berdasarkan pengucapan dengan nilai precision sebesar 54% dan nilai recall sebesar 100%. Juga korelasi yang didapatkan sebesar 82%.
Analisis Dan Implementasi Pencarian Ayat Al-quran Berbasis Fonetis Menggunakan Metode N-gram Muhammad Fakhri Ar-Razi; Moch. Arif Bijaksana; Shaufiah Shaufiah
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Mencari ayat di Al-Qur’an tidak mudah bagi pengguna yang tidak memiliki cukup pengetahuan dan kemampuan dalam bahasa Arab. Oleh karena itu, pencarian fonetis dapat digunakan untuk mempermudah pengguna untuk mencari ayat dalam Al-Qur’an sesuai dengan pengucapan dan penulisan pengguna. Tugas akhir ini bertujuan untuk membangun system pencarian tersebut, khusus untuk penutur Bahasa Indonesia. Sebuah metode n-gram yang digabungkan dengan pengodean fonetis mengenai aturan bacaan Quran diusulkan untuk mencocokkan antara teks Al-Qur’an transliterasi yang sudah diubah ke dalam aksara latin (sesuai penuturan Bahasa Indonesia) dan query pengguna dalam aksara latin. Dilakukan pengindeksan dari trigram yang digunakan untuk perkiraan pencocokan string. Sistem ini menggunakan 2 skema pencarian yaitu pencarian dengan huruf vokal dan tanpa vokal yang sudah dibandingkan keduanya dan pencarian dengan vokal yang lebih baik; 2 metode pemeringkatan yaitu jumlah trigram dan letak posisi trigram. Dari hasil yang sudah diuji didapatkan presisi yang cukup baik dengan skema pencarian menggunakan vokal sebesar 0.746, sedangkan dengan skema pencarian tanpa vokal sebesar 0.515. Setelah menggabungkan 2 metode pemeringkatan dan menggunakan skema pencarian dengan vokal didapatkan nilai recall sebesar 0.79, serta didapatkan nilai korelasi yang cukup besar yaitu 0.907 dan sistem juga dapat menerima berbagai macam variasi query dengan baik.
Perancangan Semantic Similarity Based On Word Thesaurus Menggunakan Pengukuran Omiotis Untuk Pencarian Aplikasi Pada I-gracias Akip Maulana; Moch. Arif Bijaksana; Mohamad Syahrul Mubarok
eProceedings of Engineering Vol 3, No 2 (2016): Agustus, 2016
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Proses pencarian dengan cara konvensional akan membuat pengguna I-GRACIAS bingung apabila keyword yang dimasukkan memiliki ejaan kata yang berbeda dengan nama aplikasi yang ada. Semantic similarity adalah suatu pen- dekatan untuk menangani pencarian dengan mengandalkan nilai keterhubungan antar-term yang dibentuk dari Word- net. Pendekatan semantic similarity yang digunakan adalah Path-based dengan Wu and Palmer (WUP) sebagai metode perhitungan semantic similarity. Omiotis merupakan metode yang ditujukan untuk mengukur derajat relevansi antar- dokumen. Terdapat dua komponen utama dari perhitungan Omiotis. Komponen tersebut adalah lexical relevance dan semantic similarity. Dengan demikian, proses pencarian yang awalnya menggunakan cara konvensional diubah den- gan pendekatan Semantic Textual Similarity (STS). Oleh karena itu, pada tugas akhir ini akan digunakan pengukuran Omiotis untuk menghitung kemiripan antar-dokumen dengan menggunakan pendekatan Path-based sebagai metode semantic similairty, yang mana masih memiliki ketergantungan dengan Wordnet. Sehingga mampu membantu menan- gani masalah pencarian aplikasi di I-GRACIAS. Kata Kunci: Semantic Similarity, Lexycal Relevance, Omiotis, PairingWord, Wordnet.
Sentiment Analysis Berbahasa Indonesia Menggunakan Improved Multinomial Naive Bayes Muhammad Adib Imtiyazi; Shaufiah Shaufiah; Moch. Arif Bijaksana
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

ABSTRAKSI Penggunaan Multinomial Naïve Bayes sebagai classifier dalam kasus sentiment analysis sudah jamak dilakukan, namun penggunaan TF-IDF sebagai feature weighting dalam kasus tersebut dirasa kurang sesuai karena pada kasus sentiment analysis, karena sifat dari TF-IDF itu sendiri yang lebih mementingkan frequency kemunculan kata. Oleh karena itu, digunakanlah algoritma Improved Multinomial Naïve Bayes yang menggunakan Improved Gini Index (TF- iGini) dalam pembobotan yang dianggap lebih tepat sehingga dapat menghasilkan performansi yang lebih baik. Pada tugas akhir ini dilakukan perbandingan performansi dari Multinomial Naïve Bayes + TF-IDF dan Multinomial Naïve Bayes + TF-iGini. Hasil percobaan menunjukkan bahwa iGini mampu memberikan hasil yang cukup baik jika dibandingankan dengan IDF pada Multinomial Naïve Bayes, namun tidak cukup baik untuk menggantikan fungsi IDF dalam kasus klasifikasi sentiment. Kata kunci: sentiment analysis, feature weighting, IDF, improved gini, Multinomial Naïve Bayes, Bahasa Indonesia.
Kategorisasi Topik Tweet Di Kota Jakarta, Bandung, Dan Makassar Dengan Metode Multinomial Naïve Bayes Classifier Muhammad Haerunnur Syahnur; Moch. Arif Bijaksana; Mohamad Syahrul Mubarok
eProceedings of Engineering Vol 3, No 2 (2016): Agustus, 2016
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Twitter merupakan mikroblog yang sedang diminati oleh banyak orang di berbagai negara. Para penggunanya dapat memposting segala hal mengenai apa yang sedang terjadi di sekitar mereka. Baik itu breaking news, berita gosip selebriti, dan lain sebagainya. Setiap harinya, tidak kurang dari 500 juta tweet dikirimkan oleh penggunanya dari seluruh penjuru dunia. Dari tweet-tweet tersebut, Twitter akan mendaftar topik mana saja yang sering dibicarakan secara real-time melalui fitur Trending Topic. Namun, pada kenyataannya tren topik tersebut mengacu pada banyak, dan seringnya suatu kata, atau frase dikicaukan oleh pengguna di berbagai lokasi mengenai suatu event besar yang sedang terjadi. Penelitian ini bertujuan untuk mengklasifikasikan tweet-tweet yang dikirimkan dari kota Jakarta, Bandung, dan Makassar ke dalam beberapa topik, kemudian melihat tingkat kepopuleran topik tersebut di berbagai paruh waktu. Penelitian ini diawali dengan pengumpulan data tweet dari twitter.com, kemudian dilakukan praproses. Dilanjutkan ke tahap pembentukan classifier memanfaatkan data latih. Tahap terakhir adalah klasifikasi tweet ke dalam parameter topik tertentu menggunakan metode Multinomial Naïve Bayes Classifier. Penelitian ini menghasilkan rata-rata f1-score yang cukup tinggi, yaitu 76,81% jika dibandingkan dengan classifier lain seperti Random Forest, SVM, dan Nearest Neighbor (75,18%, 68,82%, dan 50,22%). Kata kunci: Klasifikasi topik, Twitter, Jakarta, Bandung, Makassar, Multinomial Naïve Bayes Classifier
Klasifikasi Argumen Semantik Menggunakan Feature Argumen Semantik Tetangga Dwi Marlina Sari; Moch. Arif Bijaksana; Siti Sa’adah
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Argumen Semantik adalah salah satu bidang linguistik dalam mempelajari makna di dalam sebuah kalimat. Argumen sematik merupakan bagian dari teknik mengembangkan solusi text mining. Dengan melakukan klasifikasi argumen semantik, akan mengidentifikasikan argumen semantik ke dalam peran semantik yang lebih spesifik, sehingga dapat membantu dalam menggali informasi pada teks, seperti dapat menjawab pertanyaan Who, Whom, When, Where, Why, and How. Tugas akhir ini, berfokus dalam melakukan klasifikasi argumen semantik menggunakan feature baseline dan feature tambahan yaitu feature argumen semantik tetangga yang menggunakan database PropBank. Feature argumen semantik tetangga dapat dimanfaatkan sebagai feature tambahan dalam membantu klasifikasi argumen semantik, dikarenakan pada masing-masing argumen dalam predikat saling ketergantungan. Klasifikasi argumen semantik dilakukan dengan menggunakan classifier Support Vector Machine (SVM). Dari uji skenario, hasil rata-rata akurasi klasifikasi argumen semantik mengggunakan feature baseline sebesar 63.91%, sedangkan hasil rata-rata akurasi berdasarkan feature baseline dan feature ketergantungan argumen tetangga dari predikat di dalam sebuah kalimat sebesar 71.21%. Kata Kunci : klasifikasi argumen semantik, feature, ketergantungan argumen semantik
Ekstraksi Opini Dengan Menggunakan Pendekatan Association Rule Mining Kurniawan Adina Kusuma; Warih Maharani; Moch. Arif Bijaksana
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Transaksi secara online sudah berkembang secara pesat dewasa ini. Jumlah produk yang terjual secara online semakin bertambah banyak dan beranekaragam jenisnya. Sebuah review tentang produk acap kali diberikan oleh konsumen untuk mengomentari produk-produk yang sudah mereka beli. Pada jenis produk dengan brand yang sudah terkenal memiliki review yang sangat banyak. Seharusnya review dari konsumen bisa dimanfaatkan produsen sebagai feedback dan digunakan calon konsumen sebagai referensi saat akan membeli barang. Review produk yang jumlahnya semakin banyak akan menyulitkan pembaca jika harus membacanya satu persatu. Solusinya adalah dengan mengidentifikasi fitur produk secara spesifik dari review yang sudah ditulis konsumen. Tugas akhir ini dilakukan untuk mengidentifikasi masalah featured- based opinion summarization dari review konsumen. Proses identifikasi ini terdiri dari dua tahap utama, yaitu : (1) ekstraksi fitur produk yang sudah direview oleh konsumen (feature extraction); dan (2) identifikasi polaritas fitur untuk menentukan polaritas kalimat opini (sentiment analysis). Metode yang digunakan pada opinion extraction ini adalah dengan metode association rule mining dengan algoritma apriori. Berdasarkan hasil pengujian, penggunaan metode association rule mining terbukti dapat mengekstrak fitur produk. Fitur yang sudah diekstraksi tersebut kemudian dicek pada setiap kalimat untuk menemukan orientasi opini dengan bantuan SentiWordNet sehingga didapatkan polaritas opini fitur yang dibicarakan oleh konsumen pada review. Kata kunci : Association rule mining, Feature extraction, Opinion summarization, Sentiment analysis
Perankingan Jawaban Yang Terklasifikasi Pada Komunitas Tanya-jawab Dengan Term Frequency Dan Similarity Measure Features Ali Ridho Fauzi Rahman; Moch. Arif Bijaksana; Ade Romadhony
eProceedings of Engineering Vol 4, No 1 (2017): April, 2017
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Banyak sekali orang bertukar informasi melewati forum online.Salah satu forum yang menyediakan lahan untuk bertukar informasi seputar Negara Qatar yaitu Qatar Living Website Forum memiliki banyak sekali orang yang bertanya maupun menjawab mengenai hal-hal yang ada di sekitar Negara Qatar,namun banyak sekali jawaban dari responden yang tidak berkaitan dengan hal yang ditanyakan.Pada tugas akhir ini dilakukan penelitian perankingan jawaban menggunakan metode Term Frequency dan Similarity Measure Features.Metode Term Frequency ini memiliki keunggulan untuk menghitung score kalimat jawaban yang akan dirangkingkan berdasarkan banyaknya jumlah term yang ada pada setiap kalimat jawabannya,sedangkan Similarity Measure Features dibagi menjadi dua fitur yaitu Semantic Similarity dan Jaccard Similarity memiliki keunggulan untuk menghitung besarnya kesimilaritasan antar kalimat berdasarkan kemiripan makna dan konten kalimat tersebut.Perankingkan jawaban dilakukan berdasarkan score Term Frequency nya dan tingkat keakurasian Similarity Measure Features nya dengan tahapan Preprocessing,Feature Calculation,dan Ranking the Result with MAP evaluation.Dari pengujian yang dilakukan,fitur yang memiliki tingkat kelayakan untuk merankingkan jawaban dengan MAP sebesar 80% adalah fitur Semantic Similarity yang merupakan salah satu fitur dari Similarity Measure Features. Kata kunci : Semantic Similarity,Jaccard Similarity,Term Frequency,Questioning Answering
Co-Authors Abdul Raffi Malikul Mulki Abdurrahman, Azzam Ade Romadhony Adelya Astari Aditya Hanif Utama Ageng Prasetio Agni Octavia Agung Wardhana Z. Nasution Akip Maulana Al Faraby, Said Alfiya El Hafsa Alfredo Primadita Ali Ridho Fauzi Rahman Angelina Sagita Sastrawan Annisa Dian Muktiari annisa Imadi Puti Anugerah, Sri Mulyani Aqila, Neca Ardhi Akmaludin Jadhira Arie Ardiayanti Suryani Arie Ardiyanti Arie Ardiyanti Suryani Arief Fatchul Huda Arief Fatchul Huda Arief Fatchul Huda Arini Rohmawati Arlinda Dwi Ardiyani aulia khemas Heikhmakhtiar Bagus Ardisaputra Bambang Ari Wahyudi Bening Suryani Pratiwi Bhudi Jati Prio Utomo Darwiyanto , Eko Dea Delvia Arifin Dhafin Putra Aldi dina juni restina Djusnimar Zultilisna Donni Richasdy Dwi Marlina Sari Dzaky Ikram Dzidny, Dimitri Irfan Eki Rifaldi Eko Darwiyanto Fairuz Ahmad Hirzani Fakhruddin, Muhammad Rafi Falia Amalia Fauzan Ramadhan Fauziah, Salma Fernandy Marbun Floribertus Yericho Pramudya Galih Rizky Prabowo Gde Surya Pramartha Grace Duma Tambunan Hafsa, Alfiya El Huda, Arief Fatchul Huda, Arief Fatchul I Gusti Ayu Chandra Devi I Komang Resnawan Tri Putra I Made Darma Yoga I Nyoman Cahyadi Wiratama I Putu Prima Ananda Ibnu Asror Idzhari Syaeful Ma'mun - Ina Rofi’atun Nasihati Indra Lukmana Sardi Intan Khairunnisa Fitriani IZZAH, NURUL Jihan Ratnasari1 KD Krisna Dwipayana Kemas M Lhaksmana Kemas Muslim Lhaksmana Khalid kurnia sari lingga Kurniawan Adina Kusuma Luh Putri Ayu Ningsih Lukman Abdurrahman Meiditia Mustika Rani Miftahul Adnan Rasyid Mochamad Agung Permana Mohamad Syahrul Mubarok Mubaroq Iqbal Muhamad Jibril Muhammad Adib Imtiyazi Muhammad Althoof Nabalah Muhammad Aris Maulana Muhammad Budi Hartanto Muhammad Fakhri Ar-Razi Muhammad Faris Abdussalam Muhammad Haerunnur Syahnur Muhammad Rizki Chairulloh Muhammad Zidny Naf'an Munirsyah Munirsyah Muthia Virliani Mutia, Aufa Naufal Rasyad Neca Aqila Nisaa' 'Ainulfithri Nur Indrawati, Nur Nurul Izzah Patra , Gifaro Andyano Pramudita Oktaviani Prasetio, Ageng Puruhita Ananda Arsaningtyas Purwita, Naila Iffah Putri Cendikia Rahmad Geri Kurniawan Ramadhyni Rifani Ramanti Dwi Indrapurasih Rendy Andrian Saputra Retno Diah Ayu Ningtias Rifki Wijaya Riska Junia Wulandari Rizky Caesar Irjayana Ryan Fahreza Maliki Said Al Farab Sakinah Rahmi Sang Made Naufal Caesarya Mahardhika Saputro3,, Widyanto Adi Sarah Suryaningsih Sarja Asra Winata Sendika Panji Anom Shaufiah . Shervano Naodias Siagian Siti Sa'adah Siti Sa’adah Suryaningsih, Sarah Tegar Graha Adiwiguna Teuku Muhammad Ikhsan Totok Suhardijanto Triawati, Candra Valentino Rossi Fierdaus Wahyu Kurniawan Wahyu Purbaningrum Warih Maharani Widi Astuti Winda Eka Samodra Wiwin Aminah Yusuf Anugrah Putra Aditama ZK Abdurahman Baizal