Indonesian Journal of Multidisciplinary on Social and Technology
Vol. 4 No. 2 (2026): Maret - Juni

Implementasi Algoritma Symspell, TF-IDF Dan Cosine Similarity Untuk Pengecekan Ejaan Dan Deteksi Plagiarisme Pada Sistem Analisis Teks Berbasis Web

Muh. Ikbal Ikbal (Universitas Haluoleo)
Sutardi Sutardi (Universitas Halu Oleo)
Jumadil Nangi (Universitas Halu Oleo)



Article Info

Publish Date
29 May 2026

Abstract

Perkembangan teknologi digital telah memicu lonjakan signifikan dalam produksi karya tulis ilmiah, yang sekaligus memunculkan tantangan kompleks terkait pemeliharaan kualitas kebahasaan dan pencegahan pelanggaran integritas akademik. Selama ini, proses validasi naskah sering kali mengharuskan penulis menggunakan aplikasi yang terpisah untuk memperbaiki ejaan dan mengecek plagiarisme, sehingga alur kerja menjadi kurang efisien dan memakan banyak waktu. Oleh karena itu, penelitian ini bertujuan merancang dan mengembangkan sebuah sistem analisis teks terpadu berbasis web yang difungsikan untuk melakukan pengecekan ejaan bahasa Indonesia serta mendeteksi plagiarisme naskah secara bersamaan dalam satu platform tunggal. Pengembangan sistem ini menerapkan metode rekayasa perangkat lunak Rational Unified Process (RUP). Pada sistem terpadu ini, algoritma Symmetric Delete Spelling Correction (SymSpell) diimplementasikan untuk melakukan koreksi ejaan dengan kecepatan tinggi memanfaatkan kamus frekuensi yang berisi kurang lebih 59.000 kata baku bahasa Indonesia. Selanjutnya, fitur deteksi plagiarisme dikembangkan menggunakan metode pembobotan Term Frequency-Inverse Document Frequency (TF-IDF) yang dipadukan dengan algoritma Cosine similarity untuk mengkalkulasi tingkat kemiripan teks antar dokumen. Evaluasi performa sistem dilakukan menggunakan dataset dokumen jurnal ilmiah berbahasa Indonesia. Hasil pengujian menunjukkan bahwa pengintegrasian kedua fitur tersebut berjalan sangat efektif. Algoritma SymSpell menunjukkan performa yang sangat baik dengan tingkat akurasi koreksi ejaan mencapai 98%. Sementara itu, metode TF-IDF dan Cosine similarity mencetak hasil klasifikasi dokumen yang optimal dengan akurasi sebesar 98,3% pada pengujian dengan ambang batas kemiripan (threshold) 40%. Kehadiran sistem analisis teks terpadu ini diharapkan mampu memberikan kemudahan bagi akademisi dalam memvalidasi naskah secara mandiri dan mendukung peningkatan kualitas publikasi ilmiah.

Copyrights © 2026






Journal Info

Abbrev

ijmst

Publisher

Subject

Computer Science & IT Economics, Econometrics & Finance Engineering Social Sciences

Description

Indonesian Journal of Multidisciplinary on Social and Technology dimaksudkan sebagai media kajian ilmiah hasil penelitian, pemikiran, dan kajian kritis-analitik mengenai penelitian di bidang Multidisiplin Sosial dan Teknologi. Hal ini merupakan bagian dari semangat menyebarluaskan ilmu yang ...