Teknika
Vol 6 No 1 (2017): November 2017

Peningkatan Kinerja Pencarian Dokumen Tugas Akhir Menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi BM25

Monica Widiasri (Program Studi Teknik Informatika, Universitas Surabaya)
Ellysa Tjandra (Program Studi Teknik Informatika, Universitas Surabaya)
Lisa Maria Chandra (Program Studi Teknik Informatika, Universitas Surabaya)



Article Info

Publish Date
30 Nov 2017

Abstract

Proses pencarian dokumen yang menggunakan information retrieval akan menerima query dan mengembalikan dokumen yang relevan dengan query pencarian tersebut. Relevansi diperhitungkan dari relevansi kata pada query dan kumpulan dokumen yang dicari. Pada sistem pencarian yang tidak mempertimbangkan variasi morfologi kata mengakibatkan dokumen yang mempunyai kata yang merupakan variasi dari kata pada query tidak dianggap sebagai dokumen hasil pencarian. Proses stemming dilakukan untuk mengenali variasi morfologi tersebut, dengan cara melakukan perubahan pada kata-kata berimbuhan dengan cara penghapusan awalan dan akhiran suatu kata menjadi kata dasarnya. Proses stemming dilakukan pada proses indexing, sehingga akan mengurangi ukuran dari index file. Hal itu dapat mengurangi waktu pencarian dan kebutuhan memori. Dokumen hasil pencarian akan ditampilkan sesuai nilai peringkat relevansi dokumen dengan query yang diberikan. Pemberian peringkat dilakukan dengan cara memberikan bobot pada dokumen. Dokumen yang mempunyai relevansi kata yang tinggi dengan query, akan diberikan bobot yang lebih besar. Pada sistem pencarian Tugas Akhir pada Universitas X, belum dilakukan proses stemming dan indexing. Untuk meningkatkan kinerja pencarian Tugas Akhir tersebut akan ditambahkan proses stemming dan indexing, serta pengurutan peringkat dokumen hasil pencarian. Proses stemming menggunakan porter stemmer bahasa Indonesia karena dokumen TA yang dicari berbahasa Indonesia, proses indexing menggunakan inverted index. Serta pengurutan dokumen hasil menggunakan fungsi peringkat Okapi BM25. Dari hasil uji coba, proses stemming dan fungsi peringkat yang dilakukan memberikan hasil pencarian yang lebih baik sesuai relevansi query. Penggunaan stemming dan inverted index menghemat penggunaan memori serta dapat mempercepat proses pencarian secara signifikan.

Copyrights © 2017






Journal Info

Abbrev

teknika

Publisher

Subject

Computer Science & IT Electrical & Electronics Engineering Engineering

Description

Teknika is a peer-reviewed journal dedicated to disseminate research articles in Information and Communication Technology (ICT) area. Researchers, lecturers, students, or practitioners are welcomed to submit paper which has topic below: Computer Networks Computer Security Artificial Intelligence ...