Penelitian tentang klasifikasi telah banyak dipelajari secara luas yang digunakan dalam berbagai hal, seperti: data mining, machine learning dan database. Selain itu pencarian information retrieval yang dapat digunakan untuk menentukan klasifikasi dokumen, konten berita, target pemasaran serta diagnosis medis. Klasifikasi dokumen menjadi daya tarik tersendiri oleh banyak peneliti selama dua dekade terakhir. Meskipun dalam melakukan klasifikasi dokument selalu ada pembaharuan antara metode dan teknik yang digunakan, namun kebutuhannya masih terus berkembang dan tidak pernah berakhir. Kemampuan untuk melakukan klasifikasi dokumen ke dalam kategori tertentu sangat membantu untuk menghadapi informasi yang berlebihan. Klasifikasi dokumen secara otomatis dikembangkan karena pekerjaan manual tidak lagi efektif. Pada penelitian ini akan dibahas bagaimana algoritma naïve bayes dan forward selection digunakan untuk mengklasifikasi judul skripsi dan tugas akhir yang ada di Prodi TI, SI, MI dan KA yang ada di STMIK Widya Pratama Pekalongan. Naïve bayes akan digunakan untuk menghitung probabilitas kemunculan kata yang mempresentasikan dokumen teks dari judul skripsi dan tugas akhir. Berdasarkan penelitian yang dilakukan diperoleh hasil rata-rata akurasi adalah 67.67% menggunakan algoritma naïve bayes, sedangkan nilai rata-rata akurasi sebesar 92.57% didapatkan pada saat menggabungkan algoritma naïve bayes dengan forward selection. Untuk mengetahui tingkat efektifitas lainya disarankan untuk melakukan pembobotan lain seperti Backward Selection pada dokument teks yang dapat digunakan untuk penelitian eksperimen lanjutanKata Kunci: text mining, klasifikasi, naïve bayes, forward selection
Copyrights © 2021