Jurnal Sarjana Teknik Informatika
Vol. 13 No. 3 (2025): Oktober

Pengelompokan Dokumen Menggunakan Algoritma Doc2Vec dan HDBSCAN untuk Deteksi Plagiarisme

Mahendra, Bondan Tiur (Unknown)
Santoso, Budi (Unknown)
Shanty , Ratna Nur Tiara (Unknown)



Article Info

Publish Date
15 Oct 2025

Abstract

Plagiarisme menjadi tantangan serius dalam lingkungan akademik karena ketersediaan konten digital yang mudah diakses. Cara deteksi plagiarisme yang biasa digunakan, yaitu dengan membandingkan kalimat secara langsung, sering kali bisa dihindari dengan cara mengubah kalimat atau melakukan perubahan kecil pada teks. Penelitian ini bertujuan membuat sistem deteksi plagiarisme yang lebih baik dengan menggunakan algoritma Doc2Vec dan HDBSCAN untuk mengelompokkan dokumen. Metode ini bekerja dengan mengubah dokumen menjadi bentuk vektor yang memiliki makna yang dalam menggunakan Doc2Vec, kemudian mengelompokkan dokumen yang memiliki konten serupa dengan HDBSCAN. Kelebihan HDBSCAN adalah mampu mengklasifikasikan dokumen asli sebagai data yang tidak relevan, sehingga meningkatkan ketepatan hasil deteksi. Uji coba dilakukan pada data esai siswa dan menunjukkan bahwa pendekatan ini mampu mengelompokkan dokumen dengan isi yang mirip, dengan skor Silhouette sebesar 0,6653 yang menunjukkan pemisahan kelompok yang baik. Penelitian ini berkontribusi dalam menyediakan alat deteksi plagiarisme yang lebih andal dan bernuansa, mampu mendeteksi kesamaan ide, bukan hanya kata.

Copyrights © 2025






Journal Info

Abbrev

JSTIF

Publisher

Subject

Computer Science & IT

Description

JSTIE (Jurnal Sarjana Teknik Informatika) (E-Journal) adalah jurnal online ditujukan sebagai sarana publikasi dari makalah yang disarikan dari hasil penelitian mahasiswa Teknik Informatika. Focus and Scope: Rekayasa Perangkat Lunak (Software Engineering) Pengetahuan dan Data Mining (Data Mining) ...