Ainet : Jurnal Informatika
Vol. 7 No. 2 (2025): September (2025)

Penerapan Sistem Pencarian Dokumen Berdasarkan Frasa di Abstrak Perpustakaan Digital Menggunakan Algoritma BM25 dan Word2Vec

Fahrim Irhmna Rachman (Unknown)
Ida Mulyadi (Unknown)
Fajar, Nur (Unknown)



Article Info

Publish Date
30 Sep 2025

Abstract

Perkembangan perpustakaan digital menyebabkan meningkatnya volume abstrak dokumen sehingga menuntut metode pencarian yang akurat untuk menemukan buku relevan. Penelitian ini mengusulkan penerapan sistem pencarian berbasis frasa pada abstrak dengan menggabungkan algoritma BM25 dan Word2Vec untuk meningkatkan relevansi hasil. Dataset terdiri dari 500 abstrak skripsi yang dipreproses (lowercasing, tokenisasi, stopword removal); model Word2Vec dilatih dengan arsitektur skip-gram (vector_size=100, window=5, epochs=50) dan BM25 diinisialisasi pada representasi token dokumen. Skor BM25, Word2Vec (cosine similarity) dan TF-IDF dinormalisasi lalu digabungkan (rata-rata) untuk pemeringkatan akhir. Evaluasi dilakukan menggunakan metrik Precision, Recall dan F1-Score pada beberapa query uji. Hasil menunjukkan peningkatan performa pada banyak query (rata-rata F1 ≈ 0.80) dengan beberapa kasus mencapai nilai sempurna (1.00), meskipun ada variabilitas antar tipe query. Temuan ini menegaskan bahwa penggabungan pencocokan lesikal BM25 dan representasi semantik Word2Vec dapat meningkatkan relevansi pencarian; pengembangan lanjutan direkomendasikan pada metode penggabungan skor dan perluasan korpus.

Copyrights © 2025






Journal Info

Abbrev

ainet

Publisher

Subject

Computer Science & IT Engineering Languange, Linguistic, Communication & Media

Description

Ainet : Jurnal Informatika is a scientific journal in the field of Informatics which contains scientific articles on various pure and applied research as well as general reviews on the development of theories, methods and related applied sciences. Ainet is published by Department of Informatics, ...