This Author published in this journals
All Journal Jurnal Algoritma
Dennis Imanuel Daeli
Universitas Prima Indonesia

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Deteksi Plagiarisme Tugas Mahasiswa Menggunakan Sentence Embedding Berbasis Transformer dan Metode Cosine Similarity Nawfal Tamim Syuja'i; Dennis Imanuel Daeli; Ichsan Alfarizi Darnela; Eveline Ardhelie Thio Candra; Juliansyah Putra Tanjung
Jurnal Algoritma Vol 23 No 1 (2026): Jurnal Algoritma
Publisher : Institut Teknologi Garut

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33364/algoritma/v.23-1.3523

Abstract

Plagiarisme akademik semakin sulit dideteksi karena tidak hanya dilakukan melalui penyalinan langsung, tetapi juga melalui parafrase yang mengubah struktur kalimat tanpa mengubah makna. Penelitian ini mengembangkan sistem deteksi Plagiarisme tugas mahasiswa menggunakan Sentence Embedding berbasis Transformer dan Cosine Similarity. Dataset yang digunakan terdiri dari 600 pasangan teks berbahasa Indonesia yang dianotasi manual sebagai ground truth dengan label plagiat dan tidak plagiat. Tahapan penelitian meliputi pengumpulan data, preprocessing selektif, tokenisasi subword pada model Transformer, pembentukan vektor embedding, perhitungan Cosine Similarity, penentuan Threshold, dan evaluasi performa menggunakan accuracy, precision, recall, serta F1-score. Penelitian membandingkan metode baseline TF-IDF dengan dua model Transformer, yaitu all-MiniLM-L6-v2 dan paraphrase-multilingual-MiniLM-L12-v2. Hasil pengujian menunjukkan bahwa model paraphrase-multilingual-MiniLM-L12-v2 memperoleh performa terbaik dengan akurasi 86,67%, precision 0,83, recall 0,95, dan F1-score 0,89, sedangkan all-MiniLM-L6-v2 memperoleh akurasi 74,67% dan TF-IDF memperoleh akurasi 62,00%. Nilai Threshold 0,70 ditetapkan berdasarkan analisis perubahan precision, recall, dan F1-score sehingga keputusan plagiat tidak hanya didasarkan pada asumsi, tetapi pada hasil evaluasi kuantitatif. Dengan demikian, pendekatan Sentence Embedding berbasis Transformer terbukti lebih efektif dibandingkan metode leksikal dalam mendeteksi Plagiarisme berbasis parafrase pada tugas mahasiswa Teknik Informatika.