LOGIC: Jurnal Penelitian Informatika
Vol. 2 No. 1 (2024): Mei 2024

Identifikasi Similar Question dengan IndoBERT (Studi Kasus Dataset QAS Covid-19)

Pramana, Rifki Adi (Unknown)
Romadhony, Ade (Unknown)



Article Info

Publish Date
03 Jun 2024

Abstract

Question answering system (QAS) merupakan sebuah task pada bidang informatika, secara lebih spesifik yaitu pada bidang Natural Language Processing (NLP). Sebuah QAS menyediakan jawaban secara otomatis berdasarkan pertanyaan yang diberikan oleh pengguna. Salah satu bagian dari tahapan pemrosesan dalam QAS adalah identifikasi pertanyaan yang mirip (similar question identifition). Tahapan similar question identification bertujuan untuk mengidentifikasi pertanyaan yang mirip, sehingga didapatkan jawaban yang tepat. Pada penelitian ini, dilakukan identifikasi similar question pada dataset yang berisi pertanyaan seputar Covid-19. Identifikasi similar question diaplikasikan dengan memanfaatkan model IndoBERT, dimana diterapkan pengukuran similarity berdasarkan cosine similarity. Berdasarkan eksperimen yang dilakukan, diperoleh 197 dari total 611 pasang pertanyaan yang berhasil diidentifikasi kemiripannya. Analisis terhadap hasil identifikasi menunjukkan bahwa faktor yang memperngaruhi dalam kemiripan antar pertanyaan antara lain adalah panjang dari suatu kalimat yang dibandingkan, kata awal dari kalimat yang dibandingkan, dan relevansi antar beberapa kata yang terdeteksi memiliki kemiripan satu sama lain.

Copyrights © 2024






Journal Info

Abbrev

logic

Publisher

Subject

Computer Science & IT Engineering

Description

LOGIC: Jurnal Penelitian Informatika is a peer-reviewed open-access journal that publishes high-quality research in Data Science, Intelligent Systems, Software Engineering, and Information Technology. The journal aims to advance knowledge in informatics by providing a platform for researchers, ...