The manual thesis title submission process is prone to duplication and similarity with previous research. This problem not only hinders innovation and originality in student research, but also creates an administrative burden for supervisors and program administrators. Manual checking of old title archives is highly inefficient, especially if there is no well-documented digital database. This often results in the approval of titles that have actually been used before. To overcome this, researchers developed a web-based thesis title similarity detection system using a Natural Language Processing (NLP) and Word Embeddings approach. The system measures the level of semantic similarity between titles using the Cosine Similarity algorithm. The dataset used consists of 500 thesis titles from the Informatics Engineering Study Program over the past five years. The test results show that the system is capable of detecting title similarities with an accuracy of up to 85%. This system is expected to assist academics in assessing the feasibility of thesis titles objectively, efficiently, and in a standardized manner.ABSTRAKProses pengajuan judul skripsi yang dilakukan secara manual rentan terhadap duplikasi dan kemiripan dengan penelitian terdahulu. Masalah ini tidak hanya menghambat inovasi dan orisinalitas penelitian mahasiswa, tetapi juga menimbulkan beban administratif bagi dosen pembimbing dan pengelola program studi. Proses pengecekan manual terhadap arsip judul lama sangat tidak efisien, apalagi jika tidak tersedia database digital yang terdokumentasi dengan baik. Hal ini sering kali mengakibatkan disetujuinya judul-judul yang sebenarnya telah dikerjakan sebelumnya. Untuk mengatasi hal ini, peneliti mengembangkan sistem pendeteksi kemiripan judul skripsi berbasis web menggunakan pendekatan Natural Language Processing (NLP) dan Word Embeddings. Sistem mengukur tingkat kesamaan semantik antarjudul menggunakan algoritma Cosine Similarity. Dataset yang digunakan terdiri atas 500 judul skripsi dari Program Studi Teknik Informatika selama lima tahun terakhir. Hasil pengujian menunjukkan bahwa sistem mampu mendeteksi kemiripan judul dengan akurasi hingga 85%. Sistem ini diharapkan dapat membantu akademisi dalam menilai kelayakan judul skripsi secara objektif, efisien, dan terstandarisasi.
Copyrights © 2025