Journal of Informatics and Computer Science (JINACS)
Vol 2 No 04 (2021)

Klasifikasi Berdasarkan Question dalam Stack Overflow Menggunakan Algoritma Naïve Bayes

Bagus Geriansyah Putra (Universitas Negeri Surabaya)
Naim Rochmawati (Universitas Negeri Surabaya)



Article Info

Publish Date
18 Jun 2021

Abstract

Abstrak—Stackoverflow merupakan sebuah website yang menyediakan banyak informasi tentang pemrograman. Pengguna dapat berinteraksi dengan pengguna lainnya dalam sebuah forum diskusi yang diajukan. Pengguna dapat mengajukan sebuah pertanyaan yang kemudian akan ditanggapi oleh pengguna lain. Ketika mengajukan sebuah pertanyaan, pengguna harus memasukkan kategori yang tepat pada pertanyaan yang diajukan agar mendapatkan respons atau jawaban yang sesuai. Berdasarkan beberapa kasus yang terjadi masih banyak pengguna website mengalami kebingungan ketika memilih kategori pertanyaan yang diajukan. Akibatnya, pertanyaan yang diajukan tidak mendapat respons yang tepat atau kurang sesuai. Sehingga, penelitian ini diajukan untuk membantu proses pengkategorian pertanyaan pada website Stackoverflow. Penelitian menggunakan Algoritma Naïve Bayes untuk memprediksi kategori pertanyaan yang diajukan. Pada penelitian ini dilakukan beberapa proses, dimulai dengan proses input dataset dilanjutkan dengan pembacaan file dataset. Kemudian dataset akan melalui preprocessing yang dilanjutkan dengan pembobotan dan proses ekstraksi fitur dengan Algoritma TF-IDF. Selanjutnya, data diproses menggunakan Algoritma Naïve Bayes yang akan menghasilkan kategori pertanyaan. Selanjutnya dilakukan proses evaluasi model untuk menentukan model terbaik yang akan digunakan untuk tampilan antarmuka aplikasi. Hasil yang didapat dari tahap evaluasi model dengan 4 kali percobaan menggunakan 10.000-40.000 data menghasilkan nilai akurasi, precision, recall, dan f1-score tertinggi sebesar 75%, 75%, 75% dan 74%. Dari hasil pengujian yang telah dilakukan Algoritma Naïve Bayes dapat digunakan sebagai klasifikasi text dan menghasilkan nilai yang cukup baik. Kata Kunci— text mining, Algoritma Naïve Bayes, stackoverflow, Algoritma TF-IDF

Copyrights © 2021






Journal Info

Abbrev

jinacs

Publisher

Subject

Computer Science & IT

Description

JINACS (Journal of Informatics and Computer Science) diterbitkan oleh Program Studi S1 Teknik Informatika Universitas Negeri Surabaya dalam empat kali setahun dengan No ISSN Online : 2686-2220 JINACS merupakan jurnal ilmiah dalam bidang Teknik Informatika dan Computer Science. Jurnal ini mencakup ...