Jurnal Ilmiah Informatika Komputer
Vol 27, No 1 (2022)

KLASIFIKASI TOPIK TWEET MENGENAI COVID MENGGUNAKAN METODE MULTINOMIAL NAÏVE BAYES DENGAN PEMBOBOTAN TF-IDF

Lydia Mayasari (Universitas Gunadarma)
Dina Indarti (Universitas Gunadarma)



Article Info

Publish Date
18 May 2022

Abstract

COVID merupakan virus yang banyak menjangkiti masyarakat Indonesia, bahkan dunia saat ini. Upaya yang dilakukan oleh pemerintah yang tidak luput dari komentar masyarakat mulai dari komentar berupa pujian, kritik, serta saran yang diberikan melalui berbagai media sosial seperti Twitter. Banyak tweet yang dikirimkan mengenai COVID. Tujuan penelitian ini adalah mengklasifikasikan topik tweet mengenai COVID menggunakan Multinomial Naïve Bayes dengan pembobotan Term Frequency-Inverse Document Frequency (TF-IDF). Tahapan penelitian terdiri dari analisis masalah, pengumpulan data, pelabelan data, preprocessing, pembobotan TF-IDF, pelatihan menggunakan Multinomial Naïve Bayes, dan pengujian performa. Data tweet dikumpulkan dari 9 Juni 2021 sampai 9 Juli 2021 dengan kata kunci ‘COVID’. Jumlah tweet yang digunakan dalam penelitian ini yaitu 4.909 yang terdiri dari 3.436 data pelatihan dan 1.473 data pengujian. Topik tweet dalam penelitian ini terdiri dari ekonomi, kesehatan, hiburan, sosial, dan hukum. Klasifikasi topik tweet dilakukan pada tweet bahasa Indonesia. Tweet yang telah dikumpulkan lalu melalui tahap preprocessing terdiri dari case folding, tokenizing, stopword removal, normalisasi, dan stemming. Berdasarkan hasil pengujian, akurasi klasifikasi topik tweet menggunakan Multinomial Naïve Bayes dengan pembobotan TF-IDF sebesar 61%.

Copyrights © 2022






Journal Info

Abbrev

infokom

Publisher

Subject

Computer Science & IT Decision Sciences, Operations Research & Management

Description

This journal is published periodically three times a year, April, August, and December. It publishes a broad range of research articles on Information Technology and Communication, whether in Indonesian Language or ...