BRITech : Jurnal Ilmiah Ilmu Komputer, Sains dan Teknologi Terapan
Vol 1 No 2 (2020): Periode Januari

KLASIFIKASI TEKS BERBAHASA INDONESIA PADA ARTIKEL BERITA MENGGUNAKAN METODE K-NEAREST NEIGHBOR DENGAN FUNGSI SQUARED EUCLIDEAN DISTNCE

Rika, Rika Astuti (Unknown)



Article Info

Publish Date
21 Feb 2020

Abstract

Masalah klasifikasi teks bahasa Indonesia  menyebabkan adanya jumlah dokumen yang terlalu banyak dan  masih manual, Dalam proses pengklasifikasian Membutuhkan waktu yang lama karena dokumen yang terlalu banyak. Permasalahan lain muncul ketika dokumen yang akan dikelompokkan dalam masing-masing kategori  memiliki kemiripan isi. aplikasi yang dibangun dengan menggunakan metode K-Nearest Neighbor dapat mengubah suatu dokumen yang siap untuk digunakan dalam proses klasifikasi. diharapkan dengan menggunakan  metode K-Nearest Neighbor dan fungsi Squared Euclidean Distance dalam pengklasifikasian teks bahasa Indonesia dapat  memberikan  hasil yang relevan. Dari hasil pengklasifikasian tersebut dari tiga puluh dokumen test hanya 14 hasil pengklasifikasian yang relevan. Untuk nilai k=5 Menghasilkan nilai  precision 0,46. Nilai precision pada proses pengklasifikasian dokumen sangat dipengaruhi oleh frekuensi kata yang ada pada dokumen, dimana proses stemming dan stopword removal sangat mempengaruhi  nilai pembobotan pada setiap dokumen tersebut.

Copyrights © 2020






Journal Info

Abbrev

britech

Publisher

Subject

Computer Science & IT

Description

BRITech, the Scientific Journal of Computer Science, Applied Science and Technology is the result of quality, useful and efficient research or scientific work that can improve the quality and quantity of internal and external lecturer research at the Bank Rakyat Indonesia Institute of Technology and ...