Claim Missing Document
Check
Articles

Found 7 Documents
Search
Journal : eProceedings of Engineering

Sistem Pendeteksi Plagiarisme Pada Dokumen Berbasis Fuzzy Ir Fery Kun Widi Yudantyo; Jondri Jondri; Bambang Ari Wahyudi
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Berbagai metode telah dikembangkan dalam bidang pendeteksian plagiarisme. Salah satu metode yang dapat digunakan Fuzzy Information Retrieval (IR). Kelebihan yang dimiliki metode ini adalah mampu mendeteksi bentuk plagiarisme baik copy-paste maupun paraphrase. Masalah yang muncul pada penggunaan fuzzy IR adalah bagaimana menentukan nilai threshold optimal yang ada pada rule, sehingga fuzzy IR dapat dengan baik mengidentifikasi kalimat yang melakukan plagiarisme. Oleh karena itu pada penelitian ini digunakan metode Fuzzy IR dengan beberapa kombinasi nilai threshold untuk mendeteksi tindakan plagiarisme dalam sebuah kalimat pada sebuah dokumen berbahasa indonesia. Dari pengujian dan analisis yang telah dilakukan didapatkan kombinasi threshold terbaik adalah 0.725 untuk permission threshold dan 0.275 untuk variance threshold. Dari hasil pengujian dan analisis juga diketahui bahwa semakin besar nilai yang diberikan untuk permission threshold dan semakin kecil untuk nilai variance threshold maka toleransi fuzzy IR terhadap perubahan struktur kalimat juga semakin rendah, hal ini menyebabkan semakin sulit untuk mendeteksi plagiarisme dengan banyak perubahan pada struktur kalimat. Kata kunci : Plagiarisme , Pendeteksian Plagiarisme, Fuzzy Information Retrieval, Permission Threshold, Variance Threshold
Klasifikasi Jenis Kendaran Secara Bertahap Dengan Eigenvehicle Dan Fuzzy C-means Clustering – Hough Transform Gunawan Gunawan; Tjokorda Agung Budi Wirayuda; Bambang Ari Wahyudi
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Dalam penelitian ini dilakukan analisis secara bertahap metoda Eigenvehicle sebagai metoda untuk mengekstraksi ciri kendaraan, Fuzzy C-means Clusterring (FCMC) digunakan untuk memisahkan ban dengan badan kendaraan dan Hough Tranform sebagai metoda untuk deteksi lingkaran ban. Jenis kendaraan yang akan diklasifikasi adalah kendaraan golongan I hingga V sesuai aturan yang ada pada tol. Metoda Hough Transform dapat digunakan untuk mengisolasi feature lingkaran ban dalam sebuah citra kendaraan, jumlah ban yang terdeteksi dapat digunakan untuk klasifikasi golongan III, IV dan V. Sedangkan golongan I dan II menggunakan metoda Eigenvehicle yang merupakan gabungan Principal Component Analysis (PCA) untuk ekstraksi ciri data latih dan Diferent From Vehicle space (DFVs) untuk mengklasifikasikan kendaraan dengan melihat jarak perbedaan dari data latih PCA. Data training dan testing sistem didapat dari rekaman kedatangan mobil di Rest Area Tol Purbaleunyi KM 97, dengan data testing sebanyak 464, data training 10. Sedangkan akurasi yang didapat sebesar 93,9% dengan parameter jumlah kelas FCM sebanyak 6, rasio ban dengan panjang kendaraan pada Hough Transform sebesar 17 dan threshold pada Eigenvehicle sebesar 1300. Kata Kunci: image processing, klasifikasi kendaraan, Eigenvehicle, Hough Transform, Fuzzy C-Means Clustering
Analisis Pencocokan Nama dengan Nama Arab Terjemahan Bahasa Indonesia Menggunakan metode Levenshtein Distance Wahyu Kurniawan; Moch. Arif Bijaksana; Bambang Ari Wahyudi
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Dalam pencarian nama masih ada yang menuliskannya tidak sesuai dengan nama aslinya yang dicari sehingga nama yang ingin didapatkan itu tidak akan ketemu. Terkadang beberapa nama mempunyai kesamaan dalam pengucapannya, namun tulisannya berbeda-beda atau ejaannya pun bisa berbeda dari setiap orang yang menuliskannya. Karena nama yang ejaan atau tulisannya yang berbeda tersebut mungkin merupakan nama yang sama, sehingga perlu adanya penelitian nama yang berbeda tersebut memiliki kemiripan yang sama. Untuk mengetahui itu adalah nama yang sama, maka nama tersebut dicocokkan dengan metode name matching yang merupakan metode yang didalamnya terdapat algoritma untuk mencocokkan nama. Algoritma levenshtein distance merupakan salah satu metode yang digunakan dalam pencocokan nama yang dapat menkonversi dua nama dengan tulisan atau ejaannya yang berbeda memiliki kemiripan yang sama. Hasil analisis yang didapat dari varian nama yang digunakan untuk pencocokkan nama menggunakan metode levenshtein distance mendapatkan nilai precision, recall, f-measure dan Akurasi yang berubah-ubah tergantung dari nilai kemiripannya dan pengaruh kesesuaian query dengan gold standard nya, sehingga nilai precision, recall, f-measure dan akurasi dapat mencapai 100%.Kata kunci : levenshtein distance, precision, recall, name matching,akurasi, f-measure. Abstract In the search for names there are still those who write it not according to the original name they are looking for so that the name you want to get will not be found. Sometimes some names have similarities in pronunciation, but the writing is different or the spelling can be different from everyone who wrote it. Because the name whose spelling or writing is different may be the same name, so the need for research of different names has the same similarity. To find out that is the same name, the name is matched with the name matching method which is a method in which there is an algorithm to match names. The levenshtein distance algorithm is one of the methods used in matching names that can convert two names with different writing or spelling having the same similarity. The results of the analysis obtained from the name variants used for name matching using the levenshtein distance method get precision, recall, f-measure and accuracy that vary depending on the similarity value and the influence of the gold standard query compatibility, so the precision, recall, f-measure and accuracy can reach 100%. Keywords: levenshtein distance, precision, recall, name matching, accuracy, f-measure.
Analisis Name Matching Untuk Nama Arab Menggunakan Metode N-gram Dan Jaccard Similarity Muhammad Rizki Chairulloh; Moch. Arif Bijaksana; Bambang Ari Wahyudi
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Dalam ilmu Rijalul Hadis dijelaskan tentang sejarah ringkas para rawi hadis dan riwayat hidupnya, baik dari generasi sahabat, tabi’in maupun tabi’it tabi’in. Dari pengertian tersebut, kedudukan ilmu ini sangat penting, sebab nilai suatu hadis sangat dipengaruhi oleh karakter dan perilaku serta biografi perawi itu sendiri. sebagai contoh nama Muhammad dengan Muhamad, itu adalah nama yang sama meskipun dengan ejaan yang berbeda. Sehingga perlu adanya penelitian untuk menentukan kecocokan nama meskipun dengan ejaan yang berbeda. Pencocokan nama pada penelitian ini menggunakan metode n-gram untuk memecah nama menjadi bagian substring kemudian dihitung nilai kecocokannya dengan metode jaccard similarity dengan nilai treshold yang diberikan sebesar >= 0.7 Selain itu, dilakukan perhitungan untuk menilai kinerja dari metode yang digunakan yaitu n-gram dan jaccard similarity dengan menghitung nilai precision, recall, f-measure dan akurasi. Penilaian kinerja ini didapatkan dengan membandingkan hasil yang diberikan oleh sistem dengan gold standart yang telah dibuat dan diverifikasi oleh ahlinya. Dari pengujian yang telah dilakukan rata-rata akurasi yang didapatkan sebesar 0.85714286. ini berarti menunjukan sistem yang dibuat sudah baik. Kata kunci : n-gram, jaccard similarity, precision, recall, f-measure Abstract In the science of Rijalul Hadith it is explained about the concise history of the hadith narrators and their biographies, both from the generation of friends, tabi’in and tabi’it tabi’in. From this understanding, the position of science is very important, because the value of a hadith is strongly influenced by the character and behavior and the biography of the narrator itself. as an example of Muhammad’s name with Muhammad, that is the same name even though with a different spelling. So there needs to be research to determine the name match even with different spellings. Name matching in this study uses the n-gram method to break the name into a substring, then the suitability value is calculated with the jaccard similarity method with the given threshold value of >= 0.7. In addition, a calculation is performed to assess the performance of the method used is n-gram and jaccard similarity by calculating the values of precision, recall, f-measure and accuracy. This performance assessment is obtained by comparing the results provided by the system with gold standards that have been created and verified by experts. From the tests that have been done, the average accuracy obtained is 0.85714286. this means showing the system is already good. Keywords: n-gram, jaccard similarity, precision, recall, f-measure
Pembangunan Ensiklopedia Kosa Kata Al Qur’an Menggunakan Generalized Vector Space Model dan Semantics Relatedness Annisa Dian Muktiari; Moch. Arif Bijaksana; Bambang Ari Wahyudi
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Al Qur’an merupakan kitab suci bagi umat Islam dan menjadi pedoman dan sumber hukum paling utama. Al Qur’an memiliki 30 Juz, 114 Surat dan 6236 ayat. Dalam Al Qur’an terdapat ayat disetiap juz-nya yang masih kurang dipahami bagi kebanyakan orang. Dibutuhkan kamus atau ensiklopedia yang dikhususkan untuk membahas arti kata dalam Al Qur’an untuk memperoleh informasi yang lebih lengkap dengan menggunakan pedoman buku tafsir. Salah satu cara untuk mengukur keterkaitan kata dari setiap potongan kata dalam Al Qur’an adalah dengan menggunakan Generalized Vector Space Model (GVSM). GVSM merupakan metode pengembangan dari Vector Space Model (VSM) yang menambahkan fungsi sense dan penilaian pada makna antar kata dalam dokumen. Nilai yang didapat merupakan nilai similarity yang akan menentukan relevannya suatu dokumen dengan query yang dimasukkan user. Dalam penelitian ini, dokumen yang dimaksud adalah paragraf. Dari hasil pengujian yang dilakukan, metode GVSM mendapatkan nilai similarity yang lebih tinggi dari metode Vector Space Model (VSM) dan Latent Semantics Analysist (LSA) . Dokumen yang relevan dengan query user akan menghasilkan nilai similarity diatas 0.50. Kata kunci : al qur’an, tafsir, generalized vector space model, similarity. Abstract The Qur'an is a holy book for Muslims and the most important guideline and source of law. The Qur'an has 30 Juz, 114 Letters and 6236 verses. In the Qur'an there is a verse in every juz it is still not understood for most people. It takes a dictionary or encyclopedia devoted to discussing the meaning of the word in the Qur'an for obtaining more complete information using the guidebook of the commentary. One of measure the interconnectedness of every word in the Qur'an is to use the Generalized Vector Space Model (GVSM). GVSM is a method of development of the Vector Space Model (VSM) that adds sense function and judgment to the meaning of inter-word in documents. The value obtained is a value of similarity that will be relevant to the document that the user requested. From the results of the tests, the GVSM method gets a higher similarity value than the Vector Space Model (VSM) and Latent Semantics Analyzer (LSA) methods. Relevant documents with the user query will produce a similarity value above 0.50. Keywords: al qur'an, tafseer, generalized vector space model, similarity.
Deteksi Kemiripan Bagian-bagian Terjemah Al-Qur’an dengan Menggunakan Metode Latent Semantic Analysis Ardhi Akmaludin Jadhira; Moch Arif Bijaksana; Bambang Ari Wahyudi
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Dalam kitab suci umat muslim, yaitu Al-Qur’an terdapat bagian-bagian terjemah yang memiliki kemiripan semantik antar halaman berbeda. Dalam memahami kemiripan semantik dan mengetahui keterkaitan bagian-bagian terjemah Al-Qur’an bukan sesuatu yang mudah dan cepat, kemiripan semantik dalam Al-Qur’an cukup sulit dimengerti karena maknanya yang sangat kompleks. Permasalahan yang akan diangkat dalam tugas akhir ini adalah bagaimana mengetahui nilai kemiripan semantik dari halaman terjemah Al-Qur’an dengan halaman-halaman yang lain. Dengan menerapkan metode latent semantic analysis yang dibantu dengan teknik singular value decomposition dan low rank approximation diharapkan dapat membantu dalam mencari pasangan-pasangan yang memiliki kemiripan semantik. Dalam mencari nilai kemiripan semantik latent semantic analysis menggunakan perhitungan cosine similarity. Dataset yang digunakan dalam penelitian ini adalah teks terjemah Al-Qur’an berbahasa Inggris, dengan keluaran sistem yaitu tingkat kemiripan dari dua buah atau lebih halaman yang dipasangkan. Dari hasil pengujian bahwa dengan menggunakan dimensi atau parameter Rank K yang maksimum didapatkan akurasi dan Fmeasure yaitu 100%. Jika semakin kecil dimensi atau parameter Rank K yang digunakan adalah minimum maka nilai kemiripan semantik akan semakin besar dan beragam serta semakin tidak relevan dengan dataset pasangan-pasangan halaman yang telah ditentukan. Kata kunci : Terjemahan Al-Qur’an, Latent Semantic Analysis. Cosine Similarity Abstract In the Muslim holy book, Al-Qur’an contains translation parts that have semantic similarities between different pages. In understanding the semantic similarities and knowing the relevance of the parts of the translation of Al-Qur’an is not something that is easy and fast, the semantic similarity in Al-Qur’an is quite difficult to understand because of its very complex meaning. The problem that will be raised in this final project is how to find out the semantic similarity value of the translation pages of Al-Qur’an with other pages. By applying the latent semantic analysis method, which is assisted by singular value decomposition techniques and low rank approximation, it is expected to help in finding pairs that have semantic similarities. In looking for semantic similarity values, latent semantic analysis uses cosine similarity calculations. The dataset used in this research is the translation of Al-Qur’an in English, with the output of the system that is the level of similarity of two or more pages that are paired. From the results of testing that by using the maximum dimension or parameter of Rank K, accuracy and F-measure are 100%. If the smaller dimensions or the Rank K parameters used are the minimum, the semantic similarity value will be even greater and more diverse and increasingly irrelevant to dataset of predefined page pairs. Keywords: Al-Qur’an Translation, Latent Semantic Analysis, Cosine Similarity
Analisis Pencocokan Nama Arab Terjemahan Bahasa Indonesia Menggunakan Soundex dan Levenshtein Distance Fauzan Ramadhan; Moch. Arif Bijaksana; Bambang Ari Wahyudi
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Cara seseorang dalam mengeja nama orang lain seringkali berbeda dengan orang yang lain. Padahal nama yang akan dieja adalah nama dari seseorang yang sama. Seperti nama ‘Aisyah’, kadang ada yang mengejanya dengan kata ‘Aisyah’, ‘Aisha’, ‘Aisah’, dan lain-lain. Pencarian nama periwayat pada saat ini baru sampai tahap ‘string matching’, sehingga ketika seseorang menggunakan ejaan nama yang berbeda, sistem tersebut tidak akan menampilkan hadits yang diriwayatkan oleh nama-nama yang dianggap mirip. Harapannya dengan sistem yang dibangun ini akan memperbaiki pengalaman pencarian nama dari periwayat hadits, sehingga sistem yang ada akan menampilkan hadits yang diriwayatkan oleh seseorang dimulai dari yang mempunyai kemiripan nama tertinggi sampai terendah dengan nama yang dicari. Penelitian ini menggunakan metode Soundex, lalu dilanjutkan dengan metode Levenshtein. Setelah itu, akan dilakukan penghitungan untuk menilai kinerja dari sistem ini menggunakan nilai precision, recall, f-measure dan akurasi. Soundex akan menentukan nama yang mempunyai kesamaan pengucapan suatu nama terhadap nama lain. Sedangkan Levenshtein akan memberikan nilai kemiripan dari nama yang sudah dipilih sebelumnya dengan nama yang dicari oleh pengguna. Nilai kinerja sistem didapat dari hasil yang diberikan dibandingkan dengan nilai yang ada pada gold standard. Dengan beberapa pengujian, sistem yang dibangun menggunakan Soundex dan Levenshtein ini mendapatkan nilai akurasi sebesar 99.95 persen. Kata kunci : Soundex, Levenshtein, precision, recall, f-measure, akurasiAbstract The way someone spells someone else’s name is often different from other people. Even though the name that will be spelled is the name of the same person. Like the name ’Aisha’, sometimes there are who spell it with the words ’Aisyah’, ’Aisha’, ’Aisah’, and others. The search for the name of the narrator at this time is only until the string matching stage, so when someone uses a different spelling of the name, the system will not display the hadith narrated by names that are considered similar. The hope with this system will improve the experience of searching the names of the hadith narrators, so that the existing system will display the hadith narrated by someone starting from the one having the highest to the lowest name with the name sought. This study used the Soundex method, then continued with the Levenshtein method. After that, it will be calculated to assess the performance of this system using precision, recall, f-measure and accuracy. Soundex will determine the name that has the same pronunciation as a name for another name. Whereas Levenshtein will give a similar value of the name that has been previously selected with the name that is searched by the user. The value of system performance is obtained from the results given compared to the values that are at the gold standard. From several tests, the system built using Soundex and Levenshtein has an accuracy value of 99.95 percent. Keywords: Soundex, Levenshtein, precision, recall, f-measure, accuracy