Indonesia sebagai negara dengan mayoritas penduduk Muslim terbanyak menjadikan Al-Qur’an sebagai pedoman utama kehidupan. Namun, pemahaman terhadap isi Al-Qur’an masih terbatas, terutama bagi penutur bahasa Indonesia. Pendekatan dengan Natural Language Processing (NLP), khususnya dengan pemerolehan informasi berbasis semantik, menjadi solusi potensial untuk meningkatkan pemahaman ayat Al-Qur’an melalui pencocokan makna, bukan hanya kata kunci secara leksikal. Penelitian ini bertujuan untuk merancang dan mengevaluasi hasil pemerolehan informasi melalui pendekatan semantik menggunakan model sentence-BERT versi Indonesia oleh denaya/indosbert-large. Dataset yang digunakan berupa seluruh terjemahan ayat Al-Quran versi kementerian agama tahun 2020 sebanyak 6236 ayat dan pasangan kueri-jawaban sebanyak 1225 pasang. Evaluasi dilakukan menggunakan metrik Mean Average Precision (MAP), precision@k, dan recall@k. Pengujian dilakukan kepada 5 partisipan yang masing-masing memberikan 3 kueri. Hasil pengujian menunjukkan model memiliki MAP sebesar 0,3115, dengan rata-rata precision@10 sebesar 0,2007, dan rata-rata recall@k sebesar 0,7675. Hasil evaluasi model kurang optimal yang dapat terjadi karena model pretrained tidak spesifik dilatih pada domain Al-Qur’an dan dataset finetuning yang terbatas serta tidak merata sehingga menimbulkan bias pada kueri tertentu.
Copyrights © 2025