Jurnal Pengembangan Riset dan Observasi Teknik Informatika
Vol 3 (2016)

Pemanfaatan Vector Space Model pada Penerapan Algoritma Nazief Adriani, KNN dan Fungsi Similarity Cosine untuk Pembobotan IDF dan WIDF pada Prototipe Sistem Klasifikasi Teks Bahasa Indonesia

Susandi, Diki (Unknown)
Sholahudin, Usep (Unknown)



Article Info

Publish Date
21 Feb 2017

Abstract

Vector space model (VSM) adalah suatu model yang digunakan untuk mengukur kemiripan antara suatu dokumen dengan suatu query. Pada model ini, query dan dokumen dianggap sebagai vektor-vektor pada ruang n-dimensi, dimana n adalah jumlah dari seluruh term yang ada di dalam daftar. Teknologi informasi khususnya internet sangat mendukung terjadinya pertukaran informasi dengan sangat cepat. Kondisi tersebut memunculkan masalah untuk mengakses informasi yang diinginkan secara akurat dan cepat. Untuk mengatasi masalah tersebut, salah satu teknik yang dapat digunakan adalah dengan mengklasifikasikan teks dokumen tersebut sesuai dengan karakteristik, fitur, maupun kelasnya berdasarkan aturan baku bahasa yang akan diolah. Dalam penelitian ini Bahasa Indonesia adalah bahasa yang digunakan sebagai sumber acuan. Jenis penelitian ini termasuk kepada penelitian terapan (Applied Research). Objek dalam penelitian ini adalah dokumen Teks Berbahasa Indonesia. Tujuan dari penelitian ini menganalisis efektifitas model sistem klasifikasi / kategorisasi dokumen dalam penerapan vector space model berdasarkan pembobotan term dokumen dan query, juga menerapkan metode stemming Bahasa Indonesia dengan algoritma nazief adriani, menghasilkan nilai similarity dengan fungsi cosine yang berpengaruh pada pemeringkatan hasil kategorisasi dokumen yang relevan.

Copyrights © 2016






Journal Info

Abbrev

ProTekInfo

Publisher

Subject

Computer Science & IT Control & Systems Engineering Decision Sciences, Operations Research & Management

Description

rotekinfo (Pengembangan Riset dan Observasi Teknik Informatika) is a Computer Science or Informatics journal published by Program Studi Informatika Universitas Serang Raya with registered number ISSN 2406-7741(Print) 2597-6559 (On-Line). This journal aims to publish the results of research in the ...