Jurnal CoreIT
Vol 3, No 2 (2017): Desember 2017

Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen

Radili, Adi (Unknown)
Sanjaya, Suwanto (Unknown)



Article Info

Publish Date
03 Jan 2018

Abstract

Keanekaragaman dokumen teks serta jumlahnya saat ini terus bertambah yang menyebabkan penumpukan dokumen. Dokumen yang tersebar dan tidak terkoordinasi dengan baik akan menyulitkan pencari informasi dalam mendapatkan informasi yang diinginkan, maka perlu dibuatnya suatu sistem yang dapat mengelompokkan dokumen. Penelitian ini menerapkan metode winnowing untuk pemilihan fitur yaitu fingerprint dan naive bayes untuk pengelompokan. Pengelompokan dokumen dengan menggunakan winnowing fingerprint dan naive bayes mempunyai 8 bidang keahlian dengan menggunakan 1050 dokumen abstrak dengan 90% data latih dan 10% data uji. Pengujian menghasilkan akurasi 40% (k-gram=3, bilangan prima=2 dan jumlah window=8), 49,52% (k-gram=5, bilangan prima=2 dan jumlah window=8), 84,76% (k-gram=8, bilangan prima=2 dan jumlah window=8) dan 67,61% (k-gram=12, bilangan prima=2 dan jumlah window=8). Sedangkan pengujian menggunakan data yang seimbang, yaitu 400 data latih (masing-masing kelas memiliki 50 dokumen) menghasilkan akurasi 20% (k-gram=3, bilangan prima=2 dan jumlah window=8), 27,5% (k-gram=5, bilangan prima=2 dan jumlah window=8), 70% (k-gram=8, bilangan prima=2 dan jumlah window=8) dan 47,5% (k-gram=12, bilangan prima=2 dan jumlah window=8). Konfigurasi winnowing dengan nilai k-gram=8, bilangan prima=2 dan jumlah window=8 akan menghasilkan ciri dokumen yang terbaik untuk pengelompokan dokumen.Kata kunci – Text Mining, Winnowing, Naive Bayes, Fingerprint, Pengelompokan Dokumen

Copyrights © 2017






Journal Info

Abbrev

coreit

Publisher

Subject

Computer Science & IT

Description

Jurnal CoreIT: Jurnal Hasil Penelitian Ilmu Komputer dan Teknologi Informasi published by Informatics Engineering Department – Universitas Islam Negeri Sultan Syarif Kasim Riau with Registration Number: Print ISSN 2460-738X | Online ISSN 2599-3321. This journal is published 2 (two) times a year ...