Jurnal Algoritma
Vol 23 No 1 (2026): Jurnal Algoritma

Deteksi Plagiarisme Tugas Mahasiswa Menggunakan Sentence Embedding Berbasis Transformer dan Metode Cosine Similarity

Nawfal Tamim Syuja'i (Universitas Prima Indonesia)
Dennis Imanuel Daeli (Universitas Prima Indonesia)
Ichsan Alfarizi Darnela (Universitas Prima Indonesia)
Eveline Ardhelie Thio Candra (Universitas Prima Indonesia)
Juliansyah Putra Tanjung (Universitas Prima Indonesia)



Article Info

Publish Date
31 May 2026

Abstract

Plagiarisme akademik semakin sulit dideteksi karena tidak hanya dilakukan melalui penyalinan langsung, tetapi juga melalui parafrase yang mengubah struktur kalimat tanpa mengubah makna. Penelitian ini mengembangkan sistem deteksi Plagiarisme tugas mahasiswa menggunakan Sentence Embedding berbasis Transformer dan Cosine Similarity. Dataset yang digunakan terdiri dari 600 pasangan teks berbahasa Indonesia yang dianotasi manual sebagai ground truth dengan label plagiat dan tidak plagiat. Tahapan penelitian meliputi pengumpulan data, preprocessing selektif, tokenisasi subword pada model Transformer, pembentukan vektor embedding, perhitungan Cosine Similarity, penentuan Threshold, dan evaluasi performa menggunakan accuracy, precision, recall, serta F1-score. Penelitian membandingkan metode baseline TF-IDF dengan dua model Transformer, yaitu all-MiniLM-L6-v2 dan paraphrase-multilingual-MiniLM-L12-v2. Hasil pengujian menunjukkan bahwa model paraphrase-multilingual-MiniLM-L12-v2 memperoleh performa terbaik dengan akurasi 86,67%, precision 0,83, recall 0,95, dan F1-score 0,89, sedangkan all-MiniLM-L6-v2 memperoleh akurasi 74,67% dan TF-IDF memperoleh akurasi 62,00%. Nilai Threshold 0,70 ditetapkan berdasarkan analisis perubahan precision, recall, dan F1-score sehingga keputusan plagiat tidak hanya didasarkan pada asumsi, tetapi pada hasil evaluasi kuantitatif. Dengan demikian, pendekatan Sentence Embedding berbasis Transformer terbukti lebih efektif dibandingkan metode leksikal dalam mendeteksi Plagiarisme berbasis parafrase pada tugas mahasiswa Teknik Informatika.

Copyrights © 2026






Journal Info

Abbrev

algoritma

Publisher

Subject

Computer Science & IT

Description

Jurnal Algoritma merupakan jurnal yang digunakan untuk mempublikasikan hasil penelitian dalam bidang Teknologi Informasi (TI), Sistem Informasi (SI), dan Rekayasa Perangkat Lunak (RPL), Multimedia (MM), dan Ilmu Komputer (Computer ...