Seminar Nasional Aplikasi Teknologi Informasi (SNATI)
2015

Question Classification Menggunakan Support Vector Machines dan Stemming

Abdiansah Abdiansah Abdiansah (Unknown)
Edi Winarko (Unknown)



Article Info

Publish Date
16 Oct 2015

Abstract

Abstract—Question Classification (QC) merupakan salah satukomponen penting dalam Question Answering System (QAS)karena akan berpengaruh langsung terhadap kinerjakeseluruhan QAS. Sejauh ini metode yang disarankan olehkomunitas QAS untuk QC adalah menggunakan SupportVector Machines (SVM). Untuk melakukan klasifikasi teksdibutuhkan fitur berdimensi tinggi, banyaknya fitur dapatmengurangi performa SVM. Stemming adalah teknik yangdigunakan untuk mereduksi term suatu dokumen.Penggunaan stemming akan berpengaruh terhadap sintaksisdan semantik suatu pertanyaan. Penelitian ini bertujuan untukmengetahui pengaruh stemming terhadap akurasi SVM. Telahdilakukan dua percobaan klasifikasi pertanyaan, yaitu denganmenggunakan SVM dan SVM+stemming. Hasil rata-rataakurasi dari percobaan diperoleh sebesar 86.75% untuk SVMdan 87.48% SVM+stemming sehingga telah terjadi kenaikanakurasi sebesar 0.73%. Walaupun peningkatan akurasi tidaksignifikan tetapi stemming dapat mereduksi fitur tanpamenurunkan akurasi SVM.Keywords—question classification, question answering system,support vector machines, stemming

Copyrights © 2015