Claim Missing Document
Check
Articles

Found 1 Documents
Search

Implementasi Algoritma Symspell, TF-IDF Dan Cosine Similarity Untuk Pengecekan Ejaan Dan Deteksi Plagiarisme Pada Sistem Analisis Teks Berbasis Web Muh. Ikbal Ikbal; Sutardi Sutardi; Jumadil Nangi
Indonesian Journal of Multidisciplinary on Social and Technology Vol. 4 No. 2 (2026): Maret - Juni
Publisher : PT Ilmu Data Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.69693/ijmst.v4i2.9434

Abstract

Perkembangan teknologi digital telah memicu lonjakan signifikan dalam produksi karya tulis ilmiah, yang sekaligus memunculkan tantangan kompleks terkait pemeliharaan kualitas kebahasaan dan pencegahan pelanggaran integritas akademik. Selama ini, proses validasi naskah sering kali mengharuskan penulis menggunakan aplikasi yang terpisah untuk memperbaiki ejaan dan mengecek plagiarisme, sehingga alur kerja menjadi kurang efisien dan memakan banyak waktu. Oleh karena itu, penelitian ini bertujuan merancang dan mengembangkan sebuah sistem analisis teks terpadu berbasis web yang difungsikan untuk melakukan pengecekan ejaan bahasa Indonesia serta mendeteksi plagiarisme naskah secara bersamaan dalam satu platform tunggal. Pengembangan sistem ini menerapkan metode rekayasa perangkat lunak Rational Unified Process (RUP). Pada sistem terpadu ini, algoritma Symmetric Delete Spelling Correction (SymSpell) diimplementasikan untuk melakukan koreksi ejaan dengan kecepatan tinggi memanfaatkan kamus frekuensi yang berisi kurang lebih 59.000 kata baku bahasa Indonesia. Selanjutnya, fitur deteksi plagiarisme dikembangkan menggunakan metode pembobotan Term Frequency-Inverse Document Frequency (TF-IDF) yang dipadukan dengan algoritma Cosine similarity untuk mengkalkulasi tingkat kemiripan teks antar dokumen. Evaluasi performa sistem dilakukan menggunakan dataset dokumen jurnal ilmiah berbahasa Indonesia. Hasil pengujian menunjukkan bahwa pengintegrasian kedua fitur tersebut berjalan sangat efektif. Algoritma SymSpell menunjukkan performa yang sangat baik dengan tingkat akurasi koreksi ejaan mencapai 98%. Sementara itu, metode TF-IDF dan Cosine similarity mencetak hasil klasifikasi dokumen yang optimal dengan akurasi sebesar 98,3% pada pengujian dengan ambang batas kemiripan (threshold) 40%. Kehadiran sistem analisis teks terpadu ini diharapkan mampu memberikan kemudahan bagi akademisi dalam memvalidasi naskah secara mandiri dan mendukung peningkatan kualitas publikasi ilmiah.