Masalah klasifikasi teks bahasa Indonesia menyebabkan adanya jumlah dokumen yang terlalu banyak dan masih manual, Dalam proses pengklasifikasian Membutuhkan waktu yang lama karena dokumen yang terlalu banyak. Permasalahan lain muncul ketika dokumen yang akan dikelompokkan dalam masing-masing kategori memiliki kemiripan isi. aplikasi yang dibangun dengan menggunakan metode K-Nearest Neighbor dapat mengubah suatu dokumen yang siap untuk digunakan dalam proses klasifikasi. diharapkan dengan menggunakan metode K-Nearest Neighbor dan fungsi Squared Euclidean Distance dalam pengklasifikasian teks bahasa Indonesia dapat memberikan hasil yang relevan. Dari hasil pengklasifikasian tersebut dari tiga puluh dokumen test hanya 14 hasil pengklasifikasian yang relevan. Untuk nilai k=5 Menghasilkan nilai precision 0,46. Nilai precision pada proses pengklasifikasian dokumen sangat dipengaruhi oleh frekuensi kata yang ada pada dokumen, dimana proses stemming dan stopword removal sangat mempengaruhi nilai pembobotan pada setiap dokumen tersebut.
Copyrights © 2020