Bagus Geriansyah Putra
Universitas Negeri Surabaya

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Klasifikasi Berdasarkan Question dalam Stack Overflow Menggunakan Algoritma Naïve Bayes Bagus Geriansyah Putra; Naim Rochmawati
Journal of Informatics and Computer Science (JINACS) Vol 2 No 04 (2021)
Publisher : Universitas Negeri Surabaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (302.411 KB) | DOI: 10.26740/jinacs.v2n04.p259-267

Abstract

Abstrak—Stackoverflow merupakan sebuah website yang menyediakan banyak informasi tentang pemrograman. Pengguna dapat berinteraksi dengan pengguna lainnya dalam sebuah forum diskusi yang diajukan. Pengguna dapat mengajukan sebuah pertanyaan yang kemudian akan ditanggapi oleh pengguna lain. Ketika mengajukan sebuah pertanyaan, pengguna harus memasukkan kategori yang tepat pada pertanyaan yang diajukan agar mendapatkan respons atau jawaban yang sesuai. Berdasarkan beberapa kasus yang terjadi masih banyak pengguna website mengalami kebingungan ketika memilih kategori pertanyaan yang diajukan. Akibatnya, pertanyaan yang diajukan tidak mendapat respons yang tepat atau kurang sesuai. Sehingga, penelitian ini diajukan untuk membantu proses pengkategorian pertanyaan pada website Stackoverflow. Penelitian menggunakan Algoritma Naïve Bayes untuk memprediksi kategori pertanyaan yang diajukan. Pada penelitian ini dilakukan beberapa proses, dimulai dengan proses input dataset dilanjutkan dengan pembacaan file dataset. Kemudian dataset akan melalui preprocessing yang dilanjutkan dengan pembobotan dan proses ekstraksi fitur dengan Algoritma TF-IDF. Selanjutnya, data diproses menggunakan Algoritma Naïve Bayes yang akan menghasilkan kategori pertanyaan. Selanjutnya dilakukan proses evaluasi model untuk menentukan model terbaik yang akan digunakan untuk tampilan antarmuka aplikasi. Hasil yang didapat dari tahap evaluasi model dengan 4 kali percobaan menggunakan 10.000-40.000 data menghasilkan nilai akurasi, precision, recall, dan f1-score tertinggi sebesar 75%, 75%, 75% dan 74%. Dari hasil pengujian yang telah dilakukan Algoritma Naïve Bayes dapat digunakan sebagai klasifikasi text dan menghasilkan nilai yang cukup baik. Kata Kunci— text mining, Algoritma Naïve Bayes, stackoverflow, Algoritma TF-IDF