Sistem pendeteksi plagiarisme konvensional perlu modifikasi agar mendapatkan hasil yang maksimal. Penelitian ini mengeksplorasi berbagai algoritma machine learning untuk memodelkan teks yang di parafrase dengan teks yang lain. Tujuan penelitian ini adalah untuk menganalisa kompleksitas masalah plagiarisme berdasarkan parafrase pada teks bahasa Indonesia dan membandingkan keunggulan metode-metode klasifikasi dalam mendeteksi plagiarisme berdasarkan parafrase pada teks bahasa Indonesia. Pada penelitian ini ada beberapa tahapan, yaitu : pengumpulan data, kemudian desain sistem, pada tahap desain sistem ini meliputi data extraction, text pre processing, dan term weighting. Berdasarkan hasil pengujian yang telah diuraikan maka dapat disimpulkan bahwa algoritma KNN dan SVM cukup optimal untuk mengklasifikasi dataset dalam penelitian ini karena menhasilkan akurasi yang memuaskan pada penelitian ini.
Copyrights © 2022