Taufiq, Umar
Unknown Affiliation

Published : 2 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 2 Documents
Search

Analisis Tingkat Akurasi Metode Pendeteksian Plagiarisme Ide dengan menggunakan Yake dan Sentence Transformer Rahma, Salsabila Laily; Taufiq, Umar
Journal of Internet and Software Engineering Vol 5 No 1 (2024): Journal of Internet and Software Engineering
Publisher : Department of Electrical Engineering and Informatics, Vocational College, Universitas Gadjah Mada

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22146/jise.v5i1.9073

Abstract

Penggunaan Artificial Intelligence dengan teknik unsupervised learning dapat berguna dalam pendeteksian plagiarisme ide karena dapat mengidentifikasi kemiripan dan perbedaan antara dokumen teks tanpa memerlukan data berlabel atau pelatihan khusus. Plagiarisme ide melibatkan penyisipan ringkasan dari satu dokumen teks ke dalam dokumen teks lainnya, sehingga membuatnya sulit terdeteksi menggunakan metode pendeteksian plagiarisme standar. Metode yang dikembangkan dalam penelitian ini bertujuan untuk mengatasi permasalahan masalah dalam deteksi plagiarisme ide. Penelitian ini mengembangkan metode untuk deteksi plagiarisme ide dan menguji tingkat akurasi level dokumen dari metode yang dikembangkan. Metode yang dikembangkan ini menggunakan pendekatan baru dengan memanfaatkan library Python yang mengimplementasikan AI pada teknik unsupervised learning yaitu metode Yake sebagai algoritma pengekstrak kata kunci dan Sentence Transformer sebagai algoritma untuk menghitung kemiripan teks pada dataset PAN. Plagiarism Analysis, Authorship Identification, and Near-Duplicate Detection (PAN) adalah kumpulan data yang bersifat public dan secara khusus dikembangkan untuk penelitian dalam bidang pendeteksian plagiarisme. Dataset PAN yang digunakan dalam penelitian ini adalah dataset PAN13-14 summary obfuscation dengan sebuah ground truth yang menjadi acuan dalam pengukuran akurasi dari metode yang dikembangkan. Hasil penelitian menunjukkan bahwa metode Sentence Transformer dengan Yake pada threshold 0.1 memiliki akurasi tertinggi untuk kategori Plagiarized dengan nilai F-score pada dataset testing dan dataset training secara berturut-turut adalah 0.3175 dan 0.3217, sementara metode Sentence Transformer dengan threshold 0.6 memiliki akurasi tertinggi untuk kategori Non Plagiarized dengan nilai F-score pada dataset testing dan dataset training secara berturut-turut adalah 0.8905 dan 0.8907.
Utilizing association rule mining for enhancing sales performance in web-based dashboard application Teja Nursasongka, Raden Mas; Fahrurrozi, Imam; Oktiawati, Unan Yusmaniar; Taufiq, Umar; Farooq, Umar; Alfian, Ganjar
Indonesian Journal of Electrical Engineering and Computer Science Vol 36, No 2: November 2024
Publisher : Institute of Advanced Engineering and Science

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.11591/ijeecs.v36.i2.pp1105-1113

Abstract

Data is increasingly recognized as a valuable asset for generating new insights and information. Given the importance of data, businesses must always look for ways to get more value from data generated from sales transactions. In data mining, association rule mining is a good standard technique and is widely used to find interesting relationships in databases. Association rule is closely related to market basket analysis to find items that often appear together in one transaction. This study proposes the frequent pattern growth (FP-Growth) algorithm in finding association rules on sales transaction data. Our methodology includes dataset preparation for modeling, evaluation of model performance, and subsequent integration into a web-based platform. We conducted a comparative analysis of the FP-Growth algorithm against the Apriori algorithm, finding that FP-Growth outperformed Apriori in efficiency. Using the same dataset and constraint level, both algorithms produce the same number of frequent itemsets. However, in terms of computation time, FP-Growth excels by taking 2.89 seconds while Apriori takes 5.29 seconds. We integrated trained FP-Growth algorithm into a web-based dashboard application using the streamlit framework. This system is anticipated to simplify the process for businesses to identify customer purchasing patterns and improve sales.