SENSITEK
2018: Proceeding Seminar Nasional Sistem Informasi dan Teknologi Informasi (SENSITEK)

Analisis Pengklasifikasian Dokumen dengan Pembobotan Frekuensi Kata Berbanding Logaritma Jumlah Kata Serta Fungsi Cosine

Krisna Adiyarta (Universitas Budi Luhur)
Yohana Yohana (Universitas Budi Luhur)



Article Info

Publish Date
12 Jul 2018

Abstract

Dokumen merupakan suatu kumpulan data yang berguna sebagai referensi dalam penulisan suatu karya tulis ilmiah maupun non ilmiah yang dapat dimanfaatkan sebagai referensi tulisan. Dengan dukungan referensi yang tepat maka suatu karya dapat dikatakan kredibel dan dapat dipercaya. Namun pertumbuhan yang pesat dari jumlah dokumen informasi maka diperlukan sebuah teknik pencarian yang tepat untuk dapat menemukan dokumen sesuai kebutuhan salah satunya dengan sistem temu kembali informasi (information retrieval system/IRS). Salah satu teknik IRS yang dapat digunakan untuk merepresentasikan profil dokumen adalah model ruang vektor (vector space model). Pembobotan yang  didasarkan pada term dengan teknik stemming untuk mendapatkan bentuk kata dasar dari term yang bersangkutan. Penelitian ini akan menguji aplikasi mesin klasifikasi teks bahasa Indonesia yang mengunakan algoritma stemming Nazief Adriani, algoritma K-Nearest Neighbor dan metode Vector Space Model berdasarkan pembobotan frekuensi kata berbanding logaritma jumlah kata serta fungsi cosine. Dengan penelitian ini dapat disimpulkan bahwa proses pengkategorian dokumen teks berbahasa Indonesia yang dilakukan melalui perbandingan antara dokumen uji dengan koleksi sampel pengujian  mendapatkan hasil yang sesuai dengan kategori yang telah ditentukan setelah diuji dan juga telah dilakukan pengukuran precision dan recall untuk mengetahui efektifitas proses klasifikasi.Kata kunci: klasifikasi dokumen, cosine, stemming, K-Nearest Neighbor

Copyrights © 2018






Journal Info

Abbrev

sensitek

Publisher

Subject

Computer Science & IT

Description

Dalam rangka meningkatkan minat publikasi ilmiah di kalangan akademisi maupun praktisi dibidang teknologi informasi dan multimedia, STMIK Pontianak menyelenggarakan Seminar Nasional Sistem Informasi dan Teknologi Informasi (SENSITEK) 2018. ...