p-Index From 2021 - 2026
1.907
P-Index
Claim Missing Document
Check
Articles

Segmentasi Citra Ikan Tuna Menggunakan Gradient-Barrier Watershed Berbasis Analisis Hierarki Klaster dan Regional Credibility Merging Fadllullah, Arif; Arifin, Agus Zainal; Navastara, Dini Adni
Jurnal Buana Informatika Vol 7, No 3 (2016): Jurnal Buana Informatika Volume 7 Nomor 3 Juli 2016
Publisher : Universitas Atma Jaya Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (566.329 KB) | DOI: 10.24002/jbi.v7i3.661

Abstract

Abstract. The main issue of object identification in tuna image is the difficulty of extracting the entire contour of tuna physical features, because it is often influenced by uneven illumination and the ambiguity of object edges in tuna image. We propose a novel segmentation method to optimize the determination of tuna region using GBW-AHK and RCM. GBW-AHK is used to optimize the determination of adaptive threshold in order to reduce over-segmented watershed regions. Then, RCM merges the remaining regions based on two merging criteria, thus it produces two main areas of segmentation, the object extraction of tuna and the background. The experimental results on 25 tuna images demonstrate that the proposed method successfully produced an image segmentation with the average value of RAE by 4.77%, ME of 0.63%, MHD of 0.20, and the execution time was 11.61 seconds. Keywords: watershed, gradient-barrier, hierarchical cluster analysis, regional credibility merging, tuna segmentation Abstrak. Kendala utama identifikasi objek tuna pada citra ikan tuna adalah sulitnya mengekstraksi seluruh kontur tubuh ikan, karena seringkali dipengaruhi faktor iluminasi yang tidak merata dan ambiguitas tepi objek pada citra. Penelitian ini mengusulkan metode segmentasi baru yang mengoptimalkan penentuan region objek tuna menggunakan Gradient-Barrier Watershed berbasis Analisis Hierarki Klaster (GBW-AHK) dan Regional Credibility Merging (RCM). Metode GBW-AHK digunakan untuk mengoptimalkan penentuan adaptif threshold untuk mereduksi region watershed yang over-segmentasi. Kemudian RCM melakukan penggabungan region sisa hasil reduksi berdasarkan dua syarat penggabungan hingga dihasilkan dua wilayah utama segmentasi, yakni ekstraksi objek ikan tuna dan background. Hasil eksperimen pada 25 citra ikan tuna membuktikan bahwa metode usulan berhasil melakukan segmentasi dengan nilai rata-rata relative foreground area error (RAE) 4,77%, misclassification error (ME) 0,63%, modified Hausdorff distance (MHD) 0,20, dan waktu eksekusi 11,61 detik. Kata Kunci: watershed, gradient-barrier, analisis hierarki klaster, regional credibility merging, segmentasi tuna
Deteksi Bot Spammer pada Twitter Berbasis Sentiment Analysis dan Time Interval Entropy Aditya, Christian Sri Kusuma; Hani’ah, Mamluatul; Fitrawan, Alif Akbar; Arifin, Agus Zainal; Purwitasari, Diana
Jurnal Buana Informatika Vol 7, No 3 (2016): Jurnal Buana Informatika Volume 7 Nomor 3 Juli 2016
Publisher : Universitas Atma Jaya Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (456.068 KB) | DOI: 10.24002/jbi.v7i3.656

Abstract

Abstract. Spam is an abuse of messaging undesired by recipients. Those who send spam are called spammers.  Popularity of Twitter has attracted spammers to use it as a means to disseminate spam messages. The spams are characterized by a neutral emotional sentiment or no particular users’ preference perspective. In addition, the regularity of tweeting behavior periodically shows automation performed by bot. This study proposes a new method to differentiate between bot spammer and legitimate user accounts by integrating the sentiment analysis (SA) based on emotions and time interval entropy (TIE). The combination of knowledge-based and machine learning-based were used to classify tweets with positive, negative and neutral sentiments. Furthermore, the collection of timestamp is used to calculate the time interval entropy of each account. The results show that the precision and recall of the proposed method reach up to 83% and 91%. This proves that the merging SA and TIE can optimize overall system performance in detecting Bot Spammer.Keywords: bot spammer, twitter, sentiment analysis, polarity, entropy Abstrak. Spam merupakan penyalahgunaan pengiriman pesan tanpa dikehendaki oleh penerimanya, orang yang mengirimkan spam disebut spammer. Ketenaran Twitter mengundang spammer untuk menggunakannya sebagai sarana menyebarluaskan pesan spam. Karakteristik dari tweet yang dikategorikan spam memiliki sentimen emosi netral atau tidak ada preferensi tertentu terhadap suatu perspektif dari user yang memposting tweet. Selain itu keteraturan waktu perilaku saat memposting tweet secara periodik menunjukkan otomatisasi yang dilakukan bot. Pada penelitian ini diusulkan metode baru untuk mendeteksi antara bot spammer dan legitimate user dengan mengintegrasikan sentimen analysis berdasarkan emosi dan time interval entropy. Pendekatan gabungan knowledge-based dan machine learning-based digunakan untuk mengklasifikasi tweet yang memiliki sentimen positif, negatif dan tweet netral. Selanjutnya kumpulan timestamp digunakan untuk menghitung time interval entropy dari tiap akun. Hasil percobaan menunjukan bahwa precision dan recall dari metode yang diusulkan mencapai 83% dan 91%. Hal ini membuktikan penggabungan Sentiment Analysis (SA) dan Time Interval Entropy (TIE) dapat mengoptimalkan performa sistem secara keseluruhan dalam mendeteksi Bot Spammer.Kata Kunci:  bot spammer, twitter, sentiment analysis,  polarity, entropy
Peringkasan Dokumen Berbahasa Inggris Menggunakan Sebaran Local Sentence Wahib, Aminul; Arifin, Agus Zainal; Purwitasari, Diana
Jurnal Buana Informatika Vol 7, No 1 (2016): Jurnal Buana Informatika Volume 7 Nomor 1 Januari 2016
Publisher : Universitas Atma Jaya Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (353.749 KB) | DOI: 10.24002/jbi.v7i1.482

Abstract

Abstract. The number of digital documents grows very rapidly causing time waste in searching and reading the information. To overcome these problems, many document summary methods are developed to find important or key sentences from the source document. This study proposes a new strategy in summarizing English document by using local sentence distribution method to find and dig up hidden important sentence from the source document in an effort to improve quality of the summaries. Experiments are conducted on dataset DUC 2004 task 2. Measurement ROUGE-1 and ROUGE-2 are employed as a performance evaluation of the proposed method with sentence information density and sentence cluster keyword (SIDeKiCK). The experiment shows that the proposed method has better performance with an average achievement ROUGE-1 0.398, an increase of 1.5% compared to SIDeKiCK method and ROUGE-2 0.12, an increase 13% compared to SIDeKiCK method.Keywords: Summarize Document, Important Sentences, Distribution of Local Sentence, ROUGE. Abstrak. Jumlah dokumen digital yang berkembang sangat pesat menyebabkan banyaknya waktu terbuang dalam mencari dan membaca informasi. Untuk mengatasi permasalahan tersebut banyak dikembangkan metode peringkasan dokumen yang diharapkan mampu menemukan kalimat-kalimat penting dari dokumen sumber. Penelitian ini mengajukan strategi baru peringkasan dokumen berbahasa inggris menggunakan metode sebaran local sentence untuk mencari dan menggali kalimat penting yang tersembunyi dalam dokumen sumber sebagai upaya untuk meningkatkan kualitas hasil ringkasan. Uji coba dilakukan terhadap dataset task 2 DUC 2004. Pengukuran ROUGE-1 dan ROUGE-2 digunakan sebagai evaluasi performa metode yang diusulkan dengan metode lain yaitu metode sentence information density dan kata kunci cluster kalimat (SIDeKiCK). Hasil ujicoba didapatkan bahwa metode yang diusulkan memiliki performa lebih baik dengan capaian rata-rata ROUGE-1 0,398, meningkat 1,5% dibanding metode SIDeKiCK dan ROUGE-2 0,12 meningkat 13% dibanding metode SIDeKiCK.Kata Kunci: Peringkasan Dokumen, Kalimat Penting, Sebaran Local Sentence, ROUGE.
Segmentasi Citra Ikan Tuna dengan Mahalanobis Histogram Thresholding dan Mahalanobis Fuzzy C-Means Kaswar, Andi Baso; Arifin, Agus Zainal; Wijaya, Arya Yudhi
Jurnal Buana Informatika Vol 7, No 3 (2016): Jurnal Buana Informatika Volume 7 Nomor 3 Juli 2016
Publisher : Universitas Atma Jaya Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (490.754 KB) | DOI: 10.24002/jbi.v7i3.658

Abstract

Abstract. Fuzzy C-Means segmentation algorithm based on Mahalanobis distance can be utilized to segment tuna fish image. However, initialization of pixels membership value and clusters centroid randomly cause the segmentation process become inefficient in terms of iteration and time of computation. This paper proposes a new method for tuna fish image segmentation by Mahalanobis Histogram Thresholding (M-HT) and Mahalanobis Fuzzy C-Means (MFCM). The proposed method consists of three main phases, namely: centroid initialization, pixel clustering and accuracy improvement. The experiment carried out obtained average of iteration amount is as many as 66 iteration with average of segmentation time as many as 162.03 second. While the average of Accuracy is 98.54%, average of Missclassification Error is 1.46%. The result shows that the proposed method can improve the efficiency of segmentation method in terms of number of iterations and time of segmentation. Besides that, the proposed method can give more accurate segmentation result compared with the conventional method.Keywords: Tuna Fish Image, Segmentation, Fuzzy Clustering, Histogram Thresholding, Mahalanobis Distance. Abstrak. Algoritma segmentasi Fuzzy C-Means berbasis jarak Mahalanobis dapat digunakan untuk mensegmentasi ikan tuna. Namun, inisialisasi derajat keanggotaan piksel dan centroid klaster secara random mengakibatkan proses segmentasi menjadi tidak efisien dalam hal iterasi dan waktu komputasi. Penelitian ini mengusulkan metode baru untuk segmentasi citra ikan tuna dengan Mahalanobis Histogram Thresholding (M-HT) dan Mahalanobis Fuzzy C-Means (MFCM). Metode ini terdiri atas tiga tahap utama, yaitu: inisialisasi centroid, pengklasteran piksel dan peningkatan akurasi. Berdasarkan hasil ekseprimen, diperoleh rata-rata jumlah iterasi sebanyak 66 iterasi dengan rata-rata waktu segmentasi 162,03 detik. Rata-rata Akurasi 98,54% dengan rata-rata tingkat Missclassification Error 1,46%. Hasil yang diperoleh menunjukkan bahwa metode yang diusulkan dapat meningkatkan efisiensi metode segmentasi dalam hal jumlah iterasi dan waktu segmentasi. Selain itu, metode yang diusulkan dapat memberikan hasil segmentasi yang lebih akurat dibandingkan dengan metode konvensional.Kata Kunci: Citra Ikan Tuna, Segmentasi, Fuzzy Clustering, Histogram Thresholding, Jarak Mahalanobis.
EKSTRAKSI FITUR BERDASARKAN DESKRIPTOR BENTUK DAN TITIK SALIEN UNTUK KLASIFIKASI CITRA IKAN TUNA Pawening, Ratri Enggar; Arifin, Agus Zainal; Yuniarti, Anny
Jurnal Buana Informatika Vol 7, No 3 (2016): Jurnal Buana Informatika Volume 7 Nomor 3 Juli 2016
Publisher : Universitas Atma Jaya Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (283.26 KB) | DOI: 10.24002/jbi.v7i3.660

Abstract

Abstract. The manual classification of fish causes problems on accuracy and execution time. In the image of tuna, beside the shape feature, local features is also necessary to differentiate the types of fish especially which have a similar shape. The purpose of this study is to develop a new feature extraction system which integrates point of saline and the shape of descriptor to classify the image of tuna. The input image is then transformed into HSV format. Hue channel is selected for the segmentation process. Shape descriptors are extracted by using Fourier Descriptor (FD) and the saline points are extracted using Speeded Up Robust Features (SURF). The results of local features are performed by Bag of Feature (BOF). Feature integration combines shape descriptor and saline features with appropriate weight. Experimental results show that by integrating features, the classification problems of fish with similar shape can be resolved with an accuracy of classification acquired by 83.33%.Keywords: feature extraction, fourier descriptor, surf, classification, tuna fish imageAbstrak. Klasifikasi secara manual yang dilakukan berdasarkan bentuk, tekstur, dan bagian tubuh ikan dapat menimbulkan permasalahan pada akurasi dan waktu klasifikasi. Pada citra ikan tuna, selain diperlukan fitur bentuk juga diperlukan fitur lokal untuk membedakan jenis ikan terutama yang memiliki bentuk secara visual mirip. Tujuan penelitian ini adalah mengembangkan sistem ekstraksi fitur baru yang mengintegrasikan deskriptor bentuk dan titik salien untuk klasifikasi citra ikan tuna. Segmentasi diawali dengan mengambil kanal Hue pada citra HSV. Deskriptor bentuk diekstrak menggunakan Fourier Descriptor dan titik salien diekstrak menggunakan Speeded Up Robust Features. Untuk menyamakan dimensi dilakukan pemrosesan menggunakan Bag of Feature. Kedua jenis fitur yang sudah diperoleh dilakukan integrasi dengan mempertimbangkan bobot masing-masing fitur. Uji coba dilakukan pada dataset tiga jenis ikan tuna dengan 10-fold cross validation. Hasil uji coba menunjukkan dengan mengintegrasikan deskriptor bentuk dan titik salien permasalahan klasifikasi ikan tuna dengan bentuk yang mirip dapat diselesaikan dengan akurasi klasifikasi sebesar 83,33%.Kata Kunci: ekstraksi fitur, deskriptor fourier, surf, klasifikasi, citra ikan tuna
Perbandingan Metode Term Weighting terhadap Hasil Klasifikasi Teks pada Dataset Terjemahan Kitab Hadis Ni'mah, Ana Tsalitsatun; Arifin, Agus Zainal
Rekayasa Vol 13, No 2: August 2020
Publisher : Universitas Trunojoyo Madura

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (434.672 KB) | DOI: 10.21107/rekayasa.v13i2.6412

Abstract

Hadis adalah sumber rujukan agama Islam kedua setelah Al-Qur’an. Teks Hadis saat ini diteliti dalam bidang teknologi untuk dapat ditangkap nilai-nilai yang terkandung di dalamnya secara pegetahuan teknologi. Dengan adanya penelitian terhadap Kitab Hadis, pengambilan informasi dari Hadis tentunya membutuhkan representasi teks ke dalam vektor untuk mengoptimalkan klasifikasi otomatis. Klasifikasi Hadis diperlukan untuk dapat mengelompokkan isi Hadis menjadi beberapa kategori. Ada beberapa kategori dalam Kitab Hadis tertentu yang sama dengan Kitab Hadis lainnya. Ini menunjukkan bahwa ada beberapa dokumen Kitab Hadis tertentu yang memiliki topik yang sama dengan Kitab Hadis lain. Oleh karena itu, diperlukan metode term weighting yang dapat memilih kata mana yang harus memiliki bobot tinggi atau rendah dalam ruang Kitab Hadis untuk optimalisasi hasil klasifikasi dalam Kitab-kitab Hadis. Penelitian ini mengusulkan sebuah perbandingan beberapa metode term weighting, yaitu: Term Frequency Inverse Document Frequency (TF-IDF), Term Frequency Inverse Document Frequency Inverse Class Frequency (TF-IDF-ICF), Term Frequency Inverse Document Frequency Inverse Class Space Density Frequency (TF-IDF-ICSδF), dan Term Frequency Inverse Document Frequency Inverse Class Space Density Frequency Inverse Hadith Space Density Frequency (TF-IDF-ICSδF-IHSδF). Penelitian ini melakukan perbandingan hasil term weighting terhadap dataset Terjemahan 9 Kitab Hadis yang diterapkan pada mesin klasifikasi Naive Bayes dan SVM. 9 Kitab Hadis yang digunakan, yaitu: Sahih Bukhari, Sahih Muslim, Abu Dawud, at-Turmudzi, an-Nasa'i, Ibnu Majah, Ahmad, Malik, dan Darimi. Hasil uji coba menunjukkan bahwa hasil klasifikasi menggunakan metode term weighting TF-IDF-ICSδF-IHSδF mengungguli term weighting lainnya, yaitu mendapatkan Precission sebesar 90%, Recall sebesar 93%, F1-Score sebesar 92%, dan Accuracy sebesar 83%.Comparison of a term weighting method for the text classification in Indonesian hadithHadith is the second source of reference for Islam after the Qur’an. Currently, hadith text is researched in the field of technology for capturing the values of technology knowledge. With the research of the Book of Hadith, retrieval of information from the hadith certainly requires the representation of text into vectors to optimize automatic classification. The classification of the hadith is needed to be able to group the contents of the hadith into several categories. There are several categories in certain Hadiths that are the same as other Hadiths. Shows that there are certain documents of the hadith that have the same topic as other Hadiths. Therefore, a term weighting method is needed that can choose which words should have high or low weights in the Hadith Book space to optimize the classification results in the Hadith Books. This study proposes a comparison of several term weighting methods, namely: Term Frequency Inverse Document Frequency (TF-IDF), Term Frequency Inverse Document Frequency Inverse Class Frequency (TF-IDF-ICF), Term Frequency Inverse Document Frequency Inverse Class Space Density Frequency (TF-IDF-ICSδF) and Term Frequency Inverse Document Frequency Inverse Class Space Density Frequency Inverse Hadith Space Density Frequency (TF-IDF-ICSδF-IHSδF). This research compares the term weighting results to the 9 Hadith Book Translation dataset applied to the Naive Bayes classification engine and SVM. 9 Books of Hadith are used, namely: Sahih Bukhari, Sahih Muslim, Abu Dawud, at-Turmudzi, an-Nasa’i, Ibn Majah, Ahmad, Malik, and Darimi. The trial results show that the classification results using the TF-IDF-ICSδF-IHSδF term weighting method outperformed another term weighting, namely getting a Precession of 90%, Recall of 93%, F1-Score of 92%, and Accuracy of 83%.
Klasterisasi Jenis Musik Menggunakan Kombinasi Algoritma Neural Network, K-Means dan Particle Swarm Optimization Sankoh, Alhaji Sheku; Musthafa, Ahmad Reza; Rosadi, Muhammad Imron; Arifin, Agus Zainal
Jurnal Buana Informatika Vol 6, No 3 (2015): Jurnal Buana Informatika Volume 6 Nomor 3 Juli 2015
Publisher : Universitas Atma Jaya Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.24002/jbi.v6i3.431

Abstract

Abstract. Having a number of audio files in a directory could result to unstructured arrangement of files. This will cause some difficulties for users in sorting a collection of audio files based on a particular category of music. In some previous studies, researchers used a method conducting to group documents on a web page. However, those studies were not carried out on file containing documents such as audio files; relatively they were conducted on files that contain text documents. In this study, we develop a method of grouping files using a combination of pre-processing approach, neural networks, k-means, and particle swarm optimization to obtain a form of audio file collections that are group based on the types of music. The result of this study is a system with improved method of grouping audio files based on the type of music. The pre-processing stage has therefore produced the best results on this approach based on spectrum analysis melody and bass guitar, which offers a value precision 95%, 100% recall and an F-Measure 97.44%.Keywords: Cluster, Music, NN, K-Means, PSO Abstrak. Banyaknya file audio pada suatu direktori membuat sususan file tidak terstruktur. Hal ini akan menyulitkan pengguna untuk mengurutkan bahkan memilah kumpulan file audio berdasarkan kategori tertentu, khususnya kategori berdasarkan jenis musik. Pada penelitian sebelumnya, dilakukan pengelompokan dokumen pada suatu halaman website. Namun hal tersebut tidak dilakukan pada file selain dokumen, seperti file audio. Penelitian ini bertujuan untuk mengembangkan metode pengelompokan file berupa kombinasi pendekatan pre-processing, neural network, k-means, dan particle swarm optimization dengan masukan berupa file audio sehingga diperoleh keluaran berupa kumpulan file audio yang telah terkelompok berdasarkan jenis musik. Hasil dari penelitian ini yaitu berupa suatu sistem dengan pengembangan metode dalam pengelompokan file audio berdasarkan jenis musik. Metode pada tahap pre-processing memiliki hasil terbaik pada pendekatan berdasarkan analisa spectrum melodi gitar dan bass, di mana memiliki nilai precission 95%, recall 100% dan F-Measure 97,44%. Kata kunci: Klaster, Musik, NN, K-Means, PSO
Analisis Metode Representasi Teks Untuk Deteksi Interelasi Kitab Hadis: Systematic Literature Review Amelia Devi Putri Ariyanto; Chastine fatichah; Agus Zainal Arifin
Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi) Vol 5 No 5 (2021): Oktober2021
Publisher : Ikatan Ahli Informatika Indonesia (IAII)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (359.814 KB) | DOI: 10.29207/resti.v5i5.3499

Abstract

Hadith is the second source of reference for Islamic law after the Qur'an, which explains the sentences in the Qur'an which are still global by referring to the provisions of the Prophet Muhammad SAW. Classification of text documents can also be used to overcome the problem of interrelation between the Qur'an and hadith. The problem of interrelation between books of hadith needs to be done because some hadiths in certain hadith books have the same meaning as other hadith books. This study aims to analyze the development of text representation and classification methods suitable to overcome similarity meaning problems in detecting interrelationships between hadith books. The research method used is Systematic Literature Review (SLR) sourced from Google Scholar, Science Direct, and IEEE. There are 42 pieces of literature that have been studied successfully. The results showed that contextual embedding as the newest text representation method considered word context and sentence meaning better than static embedding. As a classification method, the ensemble method has better performance in classifying text documents than using only a single classifier model. Thus, future research can consider using a combination of contextual embedding and ensemble methods to detect interrelationships between books of hadith.
Sistem Informasi Absensi Haul Berbasis Web di Pondok Pesantren Muhyiddin Surabaya Jannah, Erliyah Nurul; Arifin, Agus Zainal
Register: Jurnal Ilmiah Teknologi Sistem Informasi Vol 1, No 1 (2015): January
Publisher : Information Systems - Universitas Pesantren Tinggi Darul Ulum

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26594/register.v1i1.405

Abstract

Teknologi informasi saat ini telah menjadi kebutuhan bagi hampir semua instansi, baik pemerintah maupun swasta. Tak terkecuali pondok pesantren, khususnya Pondok Pesantren Muhyiddin Surabaya. Berbagai permasalahan di pondok pesantren membutuhkan bantuan teknologi informasi dalam penyelesaiannya. Salah satunya adalah permasalahan pencatatan kehadiran peserta dalam suatu acara tertentu seperti acara Haul. Haul merupakan acara tahunan yang bertujuan untuk memperingati hari lahirnya Nabi Muhammad SAW. Acara Haul di PP. Muhyiddin mendatangkan lebih dari seribu peserta yang merupakan penghafal Quran. Panitia Haul harus mengabsen peserta satu persatu serta menempatkannya ke majelis-majelis berdasarkan urutan kedatangan dan kota asal. Sistem informasi absensi yang ada masih berbasis desktop dan hanya mampu digunakan untuk mengabsen peserta saja. Sistem tersebut belum mampu melakukan pembagian majelis peserta secara otomatis. Padahal proses pembagian majelis inilah yang menyebabkan proses absensi memakan waktu lama. Oleh sebab itu, dibuatlah sebuah Sistem Informasi Absensi Haul yang berbasis web. Sistem ini diharapkan mampu untuk membuat proses absensi pada acara Haul menjadi lebih efisien. Dari hasil pengujian sistem yang telah dilakukan, dalam satu menit sistem dapat digunakan untuk mengabsen sepuluh peserta, membagi peserta tersebut ke majelis-majelis, dan mencetak kartu peserta Haul.
Query Expansion menggunakan Word Embedding dan Pseudo Relevance Feedback Tanuwijaya, Evan; Adam, Safri; Anggris, Mohammad Fatoni; Arifin, Agus Zainal
Register: Jurnal Ilmiah Teknologi Sistem Informasi Vol 5, No 1 (2019): January
Publisher : Information Systems - Universitas Pesantren Tinggi Darul Ulum

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26594/register.v5i1.1385

Abstract

Kata kunci merupakan hal terpenting dalam mencari sebuah informasi. Penggunaan kata kunci yang tepat menghasilkan informasi yang relevan. Saat penggunaannya sebagai query, pengguna menggunakan bahasa yang alami, sehingga terdapat kata di luar dokumen jawaban yang telah disiapkan oleh sistem. Sistem tidak dapat memproses bahasa alami secara langsung yang dimasukkan oleh pengguna, sehingga diperlukan proses untuk mengolah kata-kata tersebut dengan mengekspansi setiap kata yang dimasukkan pengguna yang dikenal dengan Query Expansion (QE). Metode QE pada penelitian ini menggunakan Word Embedding karena hasil dari Word Embedding dapat memberikan kata-kata yang sering muncul bersama dengan kata-kata dalam query. Hasil dari word embedding dipakai sebagai masukan pada pseudo relevance feedback untuk diperkaya berdasarkan dokumen jawaban yang telah ada. Metode QE diterapkan dan diuji coba pada aplikasi chatbot. Hasil dari uji coba metode QE yang diterapkan pada chatbot didapatkan nilai recall, precision, dan F-measure masing-masing 100%; 70% dan 82,35 %. Hasil tersebut meningkat 1,49% daripada chatbot tanpa menggunakan QE yang pernah dilakukan sebelumnya yang hanya meraih akurasi sebesar 68,51%. Berdasarkan hasil pengukuran tersebut, QE menggunakan word embedding dan pseudo relevance feedback pada chatbot dapat mengatasi query masukan dari pengguna yang ambigu dan alami, sehingga dapat memberikan jawaban yang relevan kepada pengguna.  Keywords are the most important words and phrases used to obtain relevant information on content. Although users make use of natural languages, keywords are processed as queries by the system due to its inability to process. The language directly entered by the user is known as query expansion (QE). The proposed QE in this research uses word embedding owing to its ability to provide words that often appear along with those in the query. The results are used as inputs to the pseudo relevance feedback to be enriched based on the existing documents. This method is also applied to the chatbot application and precision, and F-measure values of the results obtained were 100%, 70%, 82.35% respectively. The results are 1.49% better than chatbot without using QE with 68.51% accuracy. Based on the results of these measurements, QE using word embedding and pseudo which gave relevance feedback in chatbots can resolve ambiguous and natural user’s input queries thereby enabling the system retrieve relevant answers.
Co-Authors - Azhari AA Sudharmawan, AA Adenuar Purnomo Adhi Nurilham Adi Guna, I Gusti Agung Socrates Afrizal Laksita Akbar Ahmad Afiif Naufal Ahmad Reza Musthafa, Ahmad Reza Ahmad Syauqi Aida Muflichah Aidila Fitri Fitri Heddyanna Akira Asano Akira Taguchi Akwila Feliciano Alhaji Sheku Sankoh, Alhaji Sheku Alif Akbar Fitrawan, Alif Akbar Alifia Puspaningrum Alqis Rausanfita Amelia Devi Putri Ariyanto Aminul Wahib Aminul Wahib Aminul Wahib Ana Tsalitsatun Ni'mah Andi Baso Kaswar Andi Baso Kaswar Anindhita Sigit Nugroho Anindita Sigit Nugroho Anny Yunairti Anny Yuniarti Anto Satriyo Nugroho Arif Fadllullah Arif Mudi Priyatno Arifin, M. Jainal Arifin, M. Jainal Arifzan Razak Arini Rosyadi Arrie Kurniawardhani Arya Widyadhana Arya Yudhi Wijaya Bagus Satria Wiguna Bagus Setya Rintyarna Baskoro Nugroho Bilqis Amaliah Chandranegara, Didih Rizki Chastine Fatichah Christian Sri kusuma Aditya, Christian Sri kusuma Cinthia Vairra Hudiyanti Cornelius Bagus Purnama Putra Daniel Sugianto Daniel Swanjaya Darlis Herumurti Dasrit Debora Kamudi Desepta Isna Ulumi Desmin Tuwohingide Dhian Kartika Diana Purwitasari Didih Rizki Chandranegara Dika Rizky Yunianto Dimas Fanny Hebrasianto Permadi Dini Adni Navastara, Dini Adni Dinial Utami Nurul Qomariah Dwi Ari Suryaningrum Dyah S. Rahayu Eha Renwi Astuti Endang Juliastuti Erliyah Nurul Jannah, Erliyah Nurul Ery Permana Yudha Eva Firdayanti Bisono Evan Tanuwijaya Evelyn Sierra Fahmi Syuhada Fahmi Syuhada Fandy Kuncoro Adianto Fathoni, Kholid Fathoni, Kholid Fiqey Indriati Eka Sari Gosario, Sony Gulpi Qorik Oktagalu Pratamasunu Gus Nanang Syaifuddiin Handayani Tjandrasa Hanif Affandi Hartanto Hudan Studiawan Humaira, Fitrah Maharani Humaira, Fitrah Maharani I Guna Adi Socrates I Gusti Agung Socrates Adi Guna I Made Widiartha I Putu Gede Hendra Suputra Indra Lukmana Irna Dwi Anggraeni Ismail Eko Prayitno Rozi Januar Adi Putra Kevin Christian Hadinata Khadijah F. Hayati Khairiyyah Nur Aisyah Khairiyyah Nur Aisyah, Khairiyyah Nur Khalid Khalid Khoirul Umam Lafnidita Farosanti Laili Cahyani Lutfiani Ratna Dewi Luthfi Atikah M. Ali Fauzi Mamluatul Hani’ah Maulana, Hendra Maulana, Hendra Mika Parwita Moch Zawaruddin Abdullah Moh. Zikky, Moh. Mohammad Fatoni Anggris, Mohammad Fatoni Mohammad Sonhaji Akbar Muhamad Nasir Muhammad Bahrul Subkhi Muhammad Fikri Sunandar Muhammad Imron Rosadi Muhammad Imron Rosadi Muhammad Machmud Muhammad Mirza Muttaqi Muhammad Muharrom Al Haromainy Munjiah Nur Saadah Muttaqi, Muhammad Mirza Nahya Nur Nanang Fakhrur Rozi Nanik Suciati Nina Kadaritna Novi Nur Putriwijaya Novrindah Alvi Hasanah Nur, Nahya Nuraisa Novia Hidayati Nursanti Novi Arisa Nursuci Putri Husain Ozzy Secio Riza Pangestu Widodo, Pangestu Pasnur Pasnur Pasnur Pasnur Puji Budi Setia Asih Putri Damayanti Putri Nur Rahayu Putu Praba Santika Rangga Kusuma Dinata Rarasmaya Indraswari Ratri Enggar Pawening Renest Danardono Resti Ludviani Rigga Widar Atmagi Riyanarto Sarno Riza, Ozzy Secio Rizka Sholikah Rizka Wakhidatus Sholikah Rizqa Raaiqa Bintana Rizqi Okta Ekoputris Rosyadi, Ahmad Wahyu Ryfial Azhar, Ryfial Safhira Maharani Safri Adam Saiful Bahri Musa Salim Bin Usman Saputra, Wahyu Syaifullah Jauharis Satrio Verdianto Satrio Verdianto Setyawan, Dimas Ari Sherly Rosa Anggraeni Siprianus Septian Manek Sonny Christiano Gosaria Sugiyanto, Sugiyanto Suprijanto Suprijanto Suwanto Afiadi Syadza Anggraini Syuhada, Fahmi Takashi Nakamoto Tegar Palyus Fiqar Tesa Eranti Putri Tio Darmawan Umi Salamah Undang Rosidin Verdianto, Satrio Waluya, Onny Kartika Wanvy Arifha Saputra Wardhana, Septiyawan R. Wawan Gunawan Wawan Gunawan Wawan Gunawan Wawan Gunawan Wijayanti Nurul Khotimah Yudhi Diputra Yufis Azhar Yulia Niza Yunianto, Dika R. Zainal Abidin Zakiya Azizah Cahyaningtyas