Skripsi merupakan salah satu persyaratan akhir dalam pendidikan akademis mahasiswa yang harus ditulis sesuai dengan bidang ilmunya. Proses awal dalam pembuatan skripsi adalah pengajuan judul, di mana mahasiswa harus memastikan bahwa judul yang diajukan tidak mirip dengan judul skripsi sebelumnya untuk menghindari plagiarisme. Deteksi kemiripan judul sangat penting untuk mencegah plagiarisme dan meningkatkan akurasi sistem rekomendasi dengan mengidentifikasi judul yang relevan. Dengan kemajuan teknologi informasi, tantangan seperti plagiarisme menjadi lebih kompleks, memerlukan sistem yang efisien untuk mengecek kemiripan judul. Salah satu metode yang digunakan adalah Support Vector Machine (SVM), sebuah teknik pembelajaran mesin yang efektif dalam klasifikasi teks, termasuk judul skripsi, berkat kemampuannya dalam menangani hubungan non-linear melalui kernel. Penggunaan Support vector machine dalam deteksi kemiripan judul bertujuan untuk memastikan keakuratan dan efisiensi dalam mengidentifikasi potensi plagiarisme. Kombinasi metode Support Vector Machine (SVM) dan Natural Language Processing (NLP), khususnya melalui vektorisasi menggunakan TF-IDF, telah terbukti efektif dalam mendeteksi kemiripan judul skripsi. Proses ini melibatkan pengumpulan data dari database judul_skripsi, diikuti dengan preprocessing yang meliputi tokenisasi, penghapusan kata-kata tidak relevan, dan stemming. Data yang bersih dan terstruktur ini kemudian diubah menjadi representasi numerik melalui TF-IDF, yang memberikan bobot lebih tinggi pada kata-kata yang spesifik namun signifikan. Model SVM yang dilatih dengan data ini berhasil mendeteksi kemiripan dengan tingkat akurasi yang memadai.
                        
                        
                        
                        
                            
                                Copyrights © 2024