Claim Missing Document
Check
Articles

Racing Bib Number Recognition Method using Deep Learning Rayhan, Muhammad Aditya; Lhaksmana, Kemas Muslim
JURNAL MEDIA INFORMATIKA BUDIDARMA Vol 4, No 3 (2020): Juli 2020
Publisher : STMIK Budi Darma

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30865/mib.v4i3.2270

Abstract

Mass running event has gained popularity ever since recreational running becomes more common as they often held annually by various organizers. As image documentation took a huge part to showcase the event, many thousands of images were generated during the event. Along with thousands of images that were generated, the participant is unlikely to found an image of themselves. To solve this problem, image annotation could be performed to address image with specific tags such as participant attribute like racing bib number (RBN). Manually annotate thousands of images would result in inefficiency of time and hard-labor. As a work to tackle this problem, this paper proposed an automatic image annotation system using the YOLOv3 algorithm based RBN recognition method. The experiment result shows 83.0% precision, 81.5% recall, and 82.2% F1 score as a result of our proposed method on running event dataset. Therefore, this implemented method will promote efficiency to solve the image annotation problem because it doesn't require manual annotation over thousand of running event images
Typo handling in searching of Quran verse based on phonetic similarities Purwita, Naila Iffah; Bijaksana, Moch Arif; Lhaksmana, Kemas Muslim; Naf’an, Muhammad Zidny
Register: Jurnal Ilmiah Teknologi Sistem Informasi Vol 6, No 2 (2020): July
Publisher : Information Systems - Universitas Pesantren Tinggi Darul Ulum

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26594/register.v6i2.2065

Abstract

The Quran search system is a search system that was built to make it easier for Indonesians to find a verse with text by Indonesian pronunciation, this is a solution for users who have difficulty writing or typing Arabic characters. Quran search system with phonetic similarity can make it easier for Indonesian Muslims to find a particular verse.  Lafzi was one of the systems that developed the search, then Lafzi was further developed under the name Lafzi+. The Lafzi+ system can handle searches with typo queries but there are still fewer variations regarding typing error types. In this research Lafzi++, an improvement from previous development to handle typographical error types was carried out by applying typo correction using the autocomplete method to correct incorrect queries and Damerau Levenshtein distance to calculate the edit distance, so that the system can provide query suggestions when a user mistypes a search, either in the form of substitution, insertion, deletion, or transposition. Users can also search easily because they use Latin characters according to pronunciation in Indonesian. Based on the evaluation results it is known that the system can be better developed, this can be seen from the accuracy value in each query that is tested can surpass the accuracy of the previous system, by getting the highest recall of 96.20% and the highest Mean Average Precision (MAP) reaching 90.69%. The Lafzi++ system can improve the previous system.
Implementation of TF-IDF Method and Support Vector Machine Algorithm for Job Applicants Text Classification Luthfi, Muhammad Faris; Lhaksamana, Kemas Muslim
JURNAL MEDIA INFORMATIKA BUDIDARMA Vol 4, No 4 (2020): Oktober 2020
Publisher : STMIK Budi Darma

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30865/mib.v4i4.2276

Abstract

Tens of thousands of people are applying for job in PT. Telkom each year. The goal of the recruitment process is to get new employees which can fit PT. Telkom's working culture. Due to the high number of applicants, the recruitment process takes a lot of time and affecting higher cost to spend. We're proposing a popular combination of Term Frequency-Inverse Document Frequency (TF-IDF) as the extraction method and Support Vector Machine (SVM) as the classifier to filter the applicants' interview text. SVM generally produces better accuracy in text classification compared to Random Forest or K-Nearest Neighbors (KNN) algorithm. However, TF-IDF has several developments to improve its flaws, one of them is Term Frequency-Relevance Frequency (TF-RF). As a comparison, in this study we use three extraction methods: TF only (without IDF), TF-IDF, and TF-RF. We use interview texts from PT. Telkom as the data source. The results of combination SVM with TF-IDF can produce 86.31\% of accuracy, with TF only can produce 85.06\%, and with TF-RF can produce 83.61\% of accuracy. The results show extracting method TF-IDF can still outperform TF-RF in term of accuracy.
Pencarian Potongan Ayat Al-Qur'an dengan Perbedaan Bunyi pada Tanda Berhenti Berdasarkan Kemiripan Fonetis Naufal Rasyad; Moch. Arif Bijaksana; Kemas Muslim Lhaksmana
Jurnal Linguistik Komputasional Vol 2 No 2 (2019): Vol. 2, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (1238.009 KB) | DOI: 10.26418/jlk.v2i2.25

Abstract

Al-Quran merupakan kitab suci utama bagi umat Islam yang ditulis menggunakan bahasa Arab. Seiring dengan perkembangan teknologi, telah dikembangkan sistem pencarian ayat Al-Qur’an berdasarkan kemiripan fonetis salah satunya adalah Lafzi. Namun untuk menangani perbedaan bunyi pada tanda berhenti di pertengahan ayat, sistem Lafzi belum bisa menanganinya dengan baik. Maka dari itu, dibutuhkan sistem yang dapat membantu pengguna dalam melakukan pencarian ayat Al-Quran, terutama untuk perbedaan bunyi pada tanda berhenti sehingga pencarian bisa menemukan kata yang berbeda pengucapan pada tanda berhenti. Berdasarkan permasalahan tersebut, dari sistem Lafzi, dilakukan pengembangan supaya dapat melakukan pencarian yang bisa menangani perbedaan bunyi pada tanda berhenti. Digunakan pengindeksan trigram untuk memperkirakan kecocokan string antara kueri dengan transliterasi ayat Al-Qur’an serta dibuat aturan pada input dengan huruf akhir ’T’ menjadi ’H’. Sistem yang sudah ada mendapatkan nilai recall sebesar 81% dan nilai MAP sebesar 65%. Sedangkanhasildaripenelitianinidiperolehnilairecallsebesar 100% dan nilai MAP sebesar 84%.
Peningkatan Akurasi pada Prediksi Kepribadian Mbti Pengguna Twitter Menggunakan Augmentasi Data Rizki Nurhaliza Harahap; Kemas Muslim
Jurnal Teknologi Informasi dan Ilmu Komputer Vol 7 No 4: Agustus 2020
Publisher : Fakultas Ilmu Komputer, Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.25126/jtiik.2020743622

Abstract

Kepribadian suatu individu perlu diketahui untuk membantu seseorang dalam mempertimbangkan beberapa hal, salah satunya perekrutan karier. Pada umumnya, kepribadian dapat diketahui melalui metode wawancara, observasi, maupun survei kuesioner. Akan tetapi, metode konvensional tersebut dinilai kurang praktis dari segi waktu dan materi karena dibutuhkan waktu yang lama dan biaya yang cukup besar untuk mengolah data. Selain itu, penggunaan metode konvensional juga dapat menimbulkan bias karena melibatkan orang ketiga dalam pengolahan data. Penelitian ini mencoba memberikan solusi dengan membangun model yang dapat melakukan prediksi terhadap kepribadian seseorang berdasarkan analisis data dan informasi dari media sosial Twitter. Data dan informasi tersebut akan diproses sehingga didapatkan prediksi kepribadian orang tersebut. Teori klasifikasi kepribadian yang digunakan adalah teori Myers-Briggs Type Indicator (MBTI). Penelitian ini juga mencoba menerapkan teknik augmentasi data untuk meningkatkan performa dari text mining task yang memiliki dataset sedikit. Hasil terbaik didapatkan dengan metode Random Forest menggunakan pembobotan Term Frequency-Inverse Document Frequency (TF-IDF) dan fitur yang tersedia pada Twitter. Penggunaan teknik augmentasi dapat meningkatkan akurasi hingga 30% dari akurasi awal sehingga hasil penelitian menunjukkan bahwa penggunaan teknik augmentasi data dapat meningkatkan performa pada model prediksi kepribadian MBTI.AbstractThe personality of an individual needs to be known to help people in considering things, one of them is career recruitment. In general, personality can be known through interviews, observations, and questionnaire surveys. However, the conventional method is judged to be impractical in terms of time and material because it takes a long time and has considerable costs to process data. After all, the use of conventional methods can also cause bias because it involves a third person in data processing. The research tries to provide a solution by building a system that can predict the personality of a person based on the analysis of data and information from social media Twitter. The data and information will be processed so that the personality prediction is obtained. The personality classification theory used is the Myers-Briggs Type Indicator (MBTI) theory. The research also tries to implement data augmentation techniques to improve the performance of text mining tasks that have a slight dataset. The best results are obtained by the Random Forest method using the Term Frequency-Inverse Document Frequency (TF-IDF) weighted and the features available on Twitter. The use of augmentation techniques can increase accuracy by up to 30% from initial accuracy. So, the use of data augmentation techniques can be used to improve the performance of MBTI personality prediction models.
Topic Classification of Islamic Question and Answer Using Naïve Bayes and TF-IDF Method Aura Sukma Andini; Danang Triantoro Murdiansyah; Kemas Muslim Lhaksmana
Computer Engineering and Applications Journal Vol 10 No 3 (2021)
Publisher : Universitas Sriwijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (362.608 KB) | DOI: 10.18495/comengapp.v10i3.385

Abstract

Information spread through the internet is widely used by people to find anything. One of the most searched information on the internet is information related to Islamic religious knowledge. However, the large amount of information available from various sources makes it difficult for people to find the correct information. Previous researchers have researched this topic, but the dataset used only comes from one source. Therefore, in this study, a classification system for Islamic question and answer topics was built using the Naïve Bayes and TF-IDF methods. This study using 1000 question and answer article data taken from Islamic consultation websites, namely rumahfiqih.com and islamqa.info. The multi-class classification uses five categories which are manually labeled using the category classes on the website. From several test scenarios in this study, the Naïve Bayes classification method using TF-IDF (n-gram level) with a maximum feature of 1000 at a data separation ratio of 70:30 produces the highest accuracy of 81%. The 81% accuracy value was also generated by the SVM classification method, but the difference was in the SVM the highest accuracy value using TF-IDF (word level). It is expected that in the subsequent research will be used more website sources and the use of other classification and feature extraction methods with more optimal value than previous research.
Kategorisasi Berita Menggunakan Metode Pembobotan TF.ABS dan TF.CHI Muhammad Arif Kurniawan; Yuliant Sibaroni; Kemas L Muslim
Indonesia Journal on Computing (Indo-JC) Vol. 3 No. 2 (2018): September, 2018
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.21108/INDOJC.2018.3.2.236

Abstract

Dengan kemajuan teknologi saat ini, berita dapat ditemukan dengan mudah dan berjumlah sangat banyak dalam bentuk digital yang menyebabkan diperlukannya suatu teknik untuk mengkategorikan berita-berita tersebut ke dalam topik tertentu agar mempermudah pembaca menemukan berita sesuai dengan topik yang diinginkan. Kategorisasi teks merupakan suatu teknik yang dapat mengkategorikan berita ke dalam topik yang telah ditentukan secara otomatis. Salah satu proses yang penting dalam kategorisasi adalah ekstraksi fitur yang mana unigram binary merupakan salah satu ekstraksi fitur yang dasar dibandingkan dengan term weighting yang dalam penelitian ini akan menggunakan metode pembobotan TF.ABS dan TF.CHI untuk memperoleh hasil kategorisasi berita yang optimal. Berdasarkan hasil pengujian, rata-rata akurasi yang didapatkan dari tiga sumber data pada ekstraksi fitur unigram binary sebesar 90.44%. Sedangkan pada metode pembobotan TF.ABS sebesar 95.74% dan TF.CHI sebesar 95.87%. Berdasarkan hasil akurasi tersebut, dapat disimpulkan bahwa term weighting lebih baik dibandingkan dengan unigram binary. Metode pembobotan TF.ABS dan TF.CHI sama-sama baik dalam kategorisasi karena tidak berbeda secara signifikan dalam performansinya. Pada hasil pengujian lainnya menunjukkan bahwa proses stemming tidak memberikan banyak pengaruh terhadap akurasi kategorisasi berita, namun proses ini dapat mengefisiensikan waktu hingga 45%.
Analysis of the Commutative Method Approach on English Thesaurus for Developing Synonym Sets Arini Rohmawati; Moch. Arif Bijaksana; Kemas Muslim Lhaksmana
Indonesia Journal on Computing (Indo-JC) Vol. 4 No. 2 (2019): September, 2019
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2019.4.2.332

Abstract

WordNet is a lexical database for languages, the difference between WordNet and dictionaries in general is that WordNet focuses on the synonyms. The main unit of WordNet is synonym set (synset), synset is a set of one or more words that have the same meaning and certainly can be replaced in certain contexts. Synset is a very important element in implementing WordNet. In this paper, an analysis of the synonym extraction process is carried out by using commutative approach, the data test obtained from the Oxford Paperback Thesaurus by taking 51 word entries. Commutative method has similar characters with synonym set, synonym set can replace each other in certain contexts. The data test extraction process is carried out until the performance measurement evaluation process using F1Score. The system generates synonym sets that matched with the manual extraction, the result of F1Score between the program and Princeton synonym sets are worth 10%.
Pembangunan Synonym Set untuk WordNet Bahasa Indonesia dengan Menggunakan Metode Komutatif dina juni restina; Moch. Arif Bijaksana; Kemas Muslim Lhaksamana
Indonesia Journal on Computing (Indo-JC) Vol. 4 No. 2 (2019): September, 2019
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2019.4.2.334

Abstract

Dalam NLP (Natural Language Processing) banyak keterkaitan semantik leksikal yang dapatdiaplikasikan, salah satunya adalah aplikasi WordNet. WordNet yang dibangun menggunakanmetode komutatif dalam proses pembangunan synonym set (synset)-nya. Synset yang akandibangun harus memiliki sifat komutatif baru dapat dikatakan synset yang bernilai valid, yangberarti jika sebuah kata w1 memiliki sinonim w2, maka w2 juga harus memiliki sinonimw1, seperti yang terjadi pada Princeton WordNet. WordNet pertama kali dibuat dalam bahasaInggris, sebelum para peneliti menerjemahkan kedalam berbagai bahasa seperti bahasa Jepang,bahasa Arab, bahasa Turki serta bahasa Indonesia dan bahasa lainnya. Untuk itu dibutuhkanpembangunan WordNet untuk turut serta membantu peneliti lain agar kedepanya WordNetBahasa Indonesia yang ada memiliki kosa kata yang lebih lengkap. WordNet yang akandibangun akan berfokus pada ekstraksi synset yaitu tahapan pertama pembangunan WordNetsebelum tahapan relasi antar synset dan gloss kata. Pembangunan synset ini menggunakankamus Tesaurus Bahasa Indonesia sebagai sumber kata. Nilai F-measure dari pembangunansynset dengan menggunakan metode komutatif adalah sebesar 66 persen.Kata Kunci: WordNet Bahasa Indonesia, Synset dan Metode komutatif
Sistem Pencarian Lintas Ayat Al-Qur'an Berdasarkan Kesamaan Fonetis Eki Rifaldi; Moch Arif Bijaksana; Kemas Muslim Lhaksamana
Indonesia Journal on Computing (Indo-JC) Vol. 4 No. 2 (2019): September, 2019
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2019.4.2.342

Abstract

Mencari teks Arab dalam Al-Qur'an tidak mudah bagi pengguna yang tidak memiliki cukup pengetahuan tentang bahasa dan tulisan Arab. Banyaknya ayat dan perbedaan bahasa dalam Al-Qur'an menimbulkan kesulitan tersendiri untuk pencarian ayat oleh masyarakat muslim Indonesia. Dibutuhkan sistem pencarian ayat Al-Qur'an berbasis fonetis yang dapat memudahkan pengguna dalam mencari ayat menggunakan tulisan latin berhuruf alfabet yang merepresentasikan bunyi pengucapan pengguna. Sebagai contoh, jika dilakukan pencarian kata الْحَمْدُ لِلَّـهِ maka sistem akan menampilkan seluruh ayat yang memiliki kemiripan bunyi dengan kata kunci. Untuk saat ini, sudah ada sistem pencarian ayat Al-Qur'an dengan menggunakan phonetic string matching, namun terbatas hanya dapat menemukan ayat berdasarkan query yang tidak lintas ayat. Kemudian jika dilakukan pencarian kata lintas ayat يَوْمِ الدِّينِ (4) إِيَّاكَdengan pencocokan string dalam database, maka sistem tidak dapat memberikan hasil pencarian dua ayat sekaligus. Oleh karena itu, dibangun suatu sistem pencarian ayat Al-Qur'an berdasarkan kemiripan bunyi (fonetis) yang dapat melintasi ayat. Algoritma N-gram berupa trigram digunakan untuk menemukan ayat-ayat yang memiliki kemiripan bunyi (fonetis) karena memiliki MAP yang tinggi untuk kata kunci panjang. Untuk mencari lintas ayat, lima buah trigram ayat selanjutnya ditambahkan ke ujung trigram ayat sebelumnya. Kemudian diperoleh nilai MAP 0,9 dan Recall 0,93.
Co-Authors Abdurrahman, Azzam Achmad Salim Aiman Adelia, Dila Adhyaksa Diffa Maulana Aditya Eka Wibowo Aditya Gifhari Soenarya Adiwijaya Aghi Wardani Agni Octavia Agus Kusnayat Ahmad Syafiq Abiyyu Ahmad, Alif Faidhil Al Faraby, Said Alberi Meidharma Fadli Hulu Amalia Elma Sari Andiani, Annisa Dwi Angraini, Nadya Arda Anisa Herdiani Annisa Miranda Arini Rohmawati Athallah, Muhammad Rafi Aura Sukma Andini Bayu Muhammad Iqbal Bonar Panjaitan Brata Mas Pintoko Chandra Jaya Riadi Chlaudiah Julinar Soplero Lelywiary Choirulfikri, Muhammad Rizqi Damayanti, Lisyana Dana Sulitstyo Kusumo Danang Triantoro Murdiansyah David Winalda Delva, Dwina Sarah Deni Saepudin Denny Darlis Dewantara, Muhammad Pascal Dida Diah Damayanti Didit Adytia dina juni restina Dino Caesaron Donni Richasdy Donny Rhomanzah Dzidny, Dimitri Irfan Edgarsa Bramandyo Widyarto Eki Rifaldi Eko Darwiyanto Ela Nadila Emrald Emrald Erwin Budi Setiawan Fakhrana Kurnia Sutrisno Farisi, Kamaludin Hanif Fathih Adawi Ahmad Ferdian Yulianto Fhira Nhita Ghina Annisa Shabrina Guido Tamara Haga Simada Ginting Harmandini, Keisha Priya Haura Athaya Salka Herodion Simorangkir Hutama, Nanda Yonda Ika Puspita Dewi Intan Khairunnisa Fitriani Iqmal Lendra Faisal Amien Irgi Aditya Rachman Isabella Vichita Kacaribu Isman Kurniawan Jofardho Adlinnas Jondri Jondri Jordan, Brilliant Kamaludin Hanif Farisi Kautsar Ramadhan Sugiharto Lukito Agung Waskito Luqman Bramantyo Rahmadi Luthfi, Muhammad Faris M. Mahfi Nurandi Karsana Mahendra Dwifebri Mahendra Dwifebri Purbolaksono Mahendra, Muhammad Hafizh Marendra Septianta Marozi, Ericho Mehdi Mursalat Ismail Meira Reynita Putri Mira Rahayu Moch Arif Bijaksana Mohamad Reza Syahziar Muhammad Abdurrohman Al Fatih Muhammad Adzhar Amrullah Muhammad Arif Kurniawan Muhammad Ilham Maulana Muhammad Rifqi Fauzi Ramdhani Muhammad Yuslan Abu Bakar Muhammad Zaid Dzulfikar muhammad zaky ramadhan Muhammad Zidny Naf'an Murman Dwi Praseti Musyafa’noer Sandi Pratama Nanda Yonda Hutama Naufal Furqan Hardifa Naufal Hilmiaji Naufal Rasyad Nibras Syihabil Haq Octaryo Sakti Yudha Prakasa Okky Zoellanda A. Tane Pamungkas, Danit Hafiz Praja, Yudhistira Imam Purwita, Naila Iffah Putri, Arla Sifhana Putrisia, Denada R. Fajrika hadnis Putra Rafi Hafizhni Anggia Rafisa Arif Irfan Rahadian, Muhammad Rafi Rastim Rastim Rayhan, Muhammad Aditya Resky Nadia Rizki Luthfan Azhari Rizki Nurhaliza Harahap Rizky Ahmad Saputra Rizky, Fariz Muhammad Salman Farisi Setya Hadi Seno Adi Putra Seto Sumargo Siddiq, Ikhsan Maulana Sindi Fatika Sari Sri Utami Sri Widowati Sukmawan Pradika Janusange Santoso Suwaldi Mardana Syadzily , Muhammad Hasan Tri Widarmanti Try Moloharto Try Moloharto Vitalis Emanuel Setiawan Wardhani, Fitri Herinda Widi Astuti Widi Astuti Youga Pratama Yuliant Sibaroni Yusuf Nugroho Doyo Yekti Zaena, Siffa Zaenal Abidin ZK Abdurahman Baizal Zulkarnaen, Imran