Sulistyoningrum, Trie Endah
Unknown Affiliation

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Implementasi Single Pass Clustering pada Preprocessing Temu Kembali Koleksi Berita Teks Rahutomo, Faisal; Puspitasari, Dwi; Sulistyoningrum, Trie Endah
JEPIN (Jurnal Edukasi dan Penelitian Informatika) Vol 6, No 1 (2020): Volume 6 No 1
Publisher : Program Studi Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jp.v6i1.34311

Abstract

Berita saat ini masih menjadi sumber yang dipercaya untuk mendapatkan informasi. Namun seiring dengan perkembangan teknologi berita yang terbit menjadi semakin banyak jumlahnya. Akibat dari jumlah berita yang banyak diperlukan suatu sistem yang dapat dipergunakan untuk menemukan berita dengan cepat. Sistem Temu Kembali menjadi cara yang dapat dipergunakan untuk membantu menangani masalah tersebut. Sistem temu kembali yang ada masih terus dikaji efisiensinya jika berhubungan dengan jumlah informasi yang sangat besar. Makalah ini melakukan pengujian efektifitas dan efisiensi tambahan preprocessing pada sistem temu kembali. Langkahnya yaitu mengklasterkan informasi yang ada terlebih dahulu. Pada preprocesing ini diimplementasikan metode single pass clustering. Kemudian pencocokan query dengan dokumen disederhanakan kepada pencocokan query dengan centroid klaster. Hasil uji coba efisiensi menunjukkan bahwa sistem temu kembali yang mengimplementasikan single pass clustering mampu mencari berita dengan lebih cepat. Sedangkan pengujian efektifitas untuk mengetahui seberapa tepat berita yang bisa diketahui dari nilai pengujian precision, recall, dan f-score. Dari pengujian tersebut didapatkan hasil jika proses pencarian paling tepat dilakukan pada cluster dengan nilai threshold 0,1. Pengujian pada cluster threshold 0,1, f-score terbaik didapatkan ketika dilakukan proses temu kembali berita dengan keyword ‘4g lte’ bernilai 0,732. Sedangkan pengujian f-score terburuk terdapat pada pengujian dengan keyword ‘aplikasi whatsapp’ dengan nilai 0,111. Sedangkan secara umum, sistem yang diusulkan selalu lebih cepat hanya saja lebih rendah nilai performa precision, recall, dan f-score-nya.