Computing and Education Technology Journal
Vol 6, No 1 (2026): APRIL

Optimizing Scientific Document Similarity Detection Using Jaro–Winkler and Machine Learning

Firman Santosa (Universitas Rokania)
Detri Amelia Chandra (Universitas Rokania)
Sri Wahyudi (Universitas Rokania)
Ridwan Ridwan (Universitas Rokania)
Rahmat Rahmat (Universitas Rokania)



Article Info

Publish Date
15 May 2026

Abstract

Penelitian ini bertujuan mengembangkan sistem deteksi kesamaan dokumen ilmiah berbasis integrasi algoritma Jaro–Winkler dan teknik machine learning sebagai dukungan awal menjaga integritas akademik. Metode yang digunakan adalah penelitian terapan dengan pendekatan pengembangan sistem (analisis kebutuhan, perancangan arsitektur, implementasi aplikasi, dan pengujian fungsional). Objek penelitian berupa dokumen ilmiah yang difokuskan pada judul dan abstrak artikel jurnal; data pembanding diperoleh melalui integrasi Open Journal Systems (OJS) menggunakan REST API. Hasil penelitian menunjukkan bahwa aplikasi JARWIN mampu melakukan pra-pemrosesan teks, menghitung kemiripan berbasis Jaro–Winkler per kata dan rekap per jurnal, menyimpan jejak hasil pemeriksaan, serta menyediakan dashboard administrasi untuk pengelolaan data pembanding dan riwayat pemeriksaan. Kebaruan penelitian terletak pada implementasi similarity engine Jaro–Winkler yang terintegrasi dengan arsitektur aplikasi modular (siap diperluas menjadi model hybrid berbasis machine learning) dan mekanisme sinkronisasi dataset jurnal dari OJS, sehingga sistem dapat digunakan sebagai fondasi operasional pemeriksaan awal kemiripan dokumen ilmiah di lingkungan perguruan tinggi.

Copyrights © 2026






Journal Info

Abbrev

cetj

Publisher

Subject

Computer Science & IT Other

Description

The Computing and Education Technology Journal (CETJ) is managed by the Computer Education Study Program, Faculty of Teacher Training and Education (FKIP), Universitas Lambung Mangkurat. Established in February 2021, the journal provides a platform for researchers and educators to publish original ...