Perkembangan perpustakaan digital menyebabkan meningkatnya volume abstrak dokumen sehingga menuntut metode pencarian yang akurat untuk menemukan buku relevan. Penelitian ini mengusulkan penerapan sistem pencarian berbasis frasa pada abstrak dengan menggabungkan algoritma BM25 dan Word2Vec untuk meningkatkan relevansi hasil. Dataset terdiri dari 500 abstrak skripsi yang dipreproses (lowercasing, tokenisasi, stopword removal); model Word2Vec dilatih dengan arsitektur skip-gram (vector_size=100, window=5, epochs=50) dan BM25 diinisialisasi pada representasi token dokumen. Skor BM25, Word2Vec (cosine similarity) dan TF-IDF dinormalisasi lalu digabungkan (rata-rata) untuk pemeringkatan akhir. Evaluasi dilakukan menggunakan metrik Precision, Recall dan F1-Score pada beberapa query uji. Hasil menunjukkan peningkatan performa pada banyak query (rata-rata F1 ≈ 0.80) dengan beberapa kasus mencapai nilai sempurna (1.00), meskipun ada variabilitas antar tipe query. Temuan ini menegaskan bahwa penggabungan pencocokan lesikal BM25 dan representasi semantik Word2Vec dapat meningkatkan relevansi pencarian; pengembangan lanjutan direkomendasikan pada metode penggabungan skor dan perluasan korpus.
Copyrights © 2025