Linier: Literatur Informatika dan Komputer
Vol 2, No 2 (2025)

Implementasi Fitur Vector Bag Of Word Dan TF IDF untuk Analisis Sentiment

Muhammad Salman Al Markas (Universitas Muslim Indonesia)
Siska Anraeni (Universitas Muslim Indonesia)
Lutfi Budiman Ilmuwan (Universitas Muslim Indonesia)



Article Info

Publish Date
12 Sep 2025

Abstract

Penggunaan internet dengan media sosial mempengaruhi masyarakat terhadap kegiatan yang dilakukan saat ini. Salah satu media sosial yang sekarang ini sedang populer digunakan oleh masyarakat adalah X. Informasi yang disebarkan dapat merupakan berita, opini, komentar, serta kritikan. Data yang didapat dari tweet ini dapat menjelaskan tanggapan masyarakat terhadap pelayanan pajak dari X. Maka dari itu penelitian ini sangat efisien jika X menjadi media untuk pengambilan data mengenai komentar Masyarakat sehingga dapat memberikan efektivitas perubahan yang diberikan kepada instansi pemerintah. Analisis sentimen menjadi proses yang sangat penting dalam memahami isi data dengan tujuan mengolah komentar yang diberikan oleh pengguna melalui tweet di X mengenai sebuah produk, layanan, dan instansi. Karya ilmiah ini bertujuan untuk membandingkan fitur Vector Bag Of Word dan TF IDF untuk mengevaluasi seberapa penting suatu term dalam sebuah dokumen pada dokumen yang lebih besar. Seperti diketahui bahwa komputer hanya mampu memproses input yang numerik sehingga data opini public berupa teks perlu direpresentasikan sebagai nilai numerik yang dikenal dengan ekstraksi fitur dan dapat dilakukan menggunakan model Binary Bag of Words (BOW), Count BOW dan Term Frequency-Inverse Document Frequency (TF-IDF) dikarenakan kedua teknik tersebut sangat berperan baik dan sama-sama digunakan untuk merepresentasikan numerik dari data teks serta memiliki kekurangan dan kelebihan masing masing. Berdasarkan hasil analisis maka dapat disimpulkan dengan menganalisis statement dengan menggunakan Bag Of Word dan TF-IDF dapat mengetahui jumlah tiap kemunculan kata di setiap kalimat dan dari hasil yang didapatkan bahwa kata yang sering diucapkan dalam sentimen yaitu dengan bobot nilai TF-IDF sebesar 0.1403.

Copyrights © 2025






Journal Info

Abbrev

LINIER

Publisher

Subject

Computer Science & IT Control & Systems Engineering Electrical & Electronics Engineering Mathematics

Description

LINIER: Literatur Informatika dan Komputer encompasses all aspects of the latest outstanding research and developments in the field of Computer science including: Artificial intelligence, Computer networks, Software ...