Abstrak-Skripsi mahasiswa menjadi salah satu bagian yang harus ditempuh bagi mahasiswa calon sarjana S1 di sebuah perguruan tinggi. Pada Fakultas Ilmu Komputer Universitas Widya Dharma Klaten, mahasiswa yang akan membuat skripsi terlebih dulu harus mengajukan judul skripsi dan selanjutnya diikuti pembuatan proposal skripsi. Salah satu yang menjadi unsur pertimbangan layak atau tidaknya proposal tersebut adalah masalah kemiripan proposal tersebut dengan proposal-proposal yang lain. Berdasarkan acuan kemiripan tersebut maka tim evaluasi dan seleksi proposal skripsi diharapkan akan mendapat bahan masukan, dan perbaikan apa yang seharusnya dilakukan oleh mahasiswa pengusul skripsi sehingga bisa dilakukan perbaikan proposal skripsi, dan harapannya skripsi yang dihasilkan nantinya akan berkualitas, dan jauh dari tindak plagiarisme. Implementasi pengukuran kemiripan proposal tema skripsi ini, menggunakan pengelompokan dengan prinsip text clustering dan text similarity. Sebelum dokumen proposal skripsi dihitung nilai kemiripannya satu sama lain, maka untuk mempercepat proses perhitungan kemiripannya, maka dokumen-dokumen tersebut akan dikelompokan terlebih dahulu dengan teknik clustering dengan algoritma K-means, berdasarkan kandungan topik judul proposal skripsi. Penghitungan tingkat kemiripan proposal skripsi, dilakukan hanya pada masing-masing kelompok judul. Proses klusterisasi judul didahului dengan proses pembobotan term dengan prinsip TF-IDF, selanjutnya dengan metode K-means judul-judul proposal skripsi dikeleompokan berdasarkan topiknya. Pada penentuan kemiripan setiap topik dokumen proposal skripsi didahului dengan proses pembentukan fingerprint untuk setiap dokumen tersebut dengan menggunakan algoritma Winnowing. Untuk menentukan tingkat kemiripan dari dua dokumen proposal skripsi dilakukan penghitungan tingkat kemiripan dengan menggunakan rumusan Jaccard Coefficien. Dari hasil penelitian ini, diperoleh bahwa algoritma K-means dan algoritma Winowing dapat diimplementasikan dalam sebuah sistem klusterisasi judul proposal skripsi sekaligus penghitungan kemiripan sebagian isinya dengan baik, hal ini terlihat dari hasil proses perhitungan kemiripan teks proposal dalam kluster judul proposal skripsi. Kata Kunci : proposal skripsi, K-means, Winnowing, Jaccard Coefficient
Copyrights © 2022