Waskita, Arya Adyaksa
Unknown Affiliation

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

ANALISIS SENTIMEN OPINI DEBAT CALON PRESIDEN DENGAN MENGGUNAKAN CLASSIFIER MACHINE LEARNING (STUDI KASUS : PADA DATA TWITTER 2024) Purba, Rini Widaswari; Waskita, Arya Adyaksa; Makshun, Makshun
Infotech: Journal of Technology Information Vol 10, No 2 (2024): NOVEMBER
Publisher : ISTEK WIDURI

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.37365/jti.v10i2.300

Abstract

This study aims to analyze public sentiment towards the Indonesian 2024 Presidential Debate using five Machine Learning classification algorithms: Naïve Bayes, Decision Tree, Support Vector Machine, Random Forest, and K-Nearest Neighbors. The data used in this research was sourced from Twitter, a major social media platform with a large and diverse volume of data. The research object is public opinions expressed on Twitter, with the subject of the research being tweets collected using the Twitter API, resulting in 1,300 data points. Data analysis involves text extraction and preprocessing, including data cleaning, tokenization, stemming, and stopword removal. The research results show the following sentiment distribution: 51.55% positive (663 tweets), 14.83% negative (183 tweets), and 34.21% neutral (440 tweets). Among the models, Support Vector Machine and Random Forest demonstrated the highest performance with an accuracy of 81%, while Naïve Bayes had the lowest performance with an accuracy of 62%. Despite variations in performance among the algorithms used, no single method was consistently effective in sentiment classification. This research contributes to mapping public sentiment related to political debates in Indonesia through social media data analysis and provides insights into the effectiveness of Machine Learning algorithms in sentiment analysis. ABSTRAKPenelitian ini bertujuan untuk menganalisis sentimen opini masyarakat terhadap Debat Calon Presiden Indonesia 2024 menggunakan lima algoritma klasifikasi Machine Learning: Naïve Bayes, Decision Tree, Support Vector Machine, Random Forest, dan K-Nearest Neighbors. Data yang digunakan dalam penelitian ini diambil dari Twitter, yang merupakan salah satu platform media sosial dengan volume data yang besar dan beragam. Objek penelitian ini adalah opini publik yang diekspresikan di Twitter, dengan subjek penelitian berupa tweet yang diambil menggunakan Twitter API, menghasilkan 1300 data poin. Analisis data melibatkan proses ekstraksi teks dan preprocessing yang mencakup pembersihan data, tokenisasi, stemming, dan penghapusan stopwords. Hasil penelitian menunjukkan distribusi sentimen sebagai berikut: 51,55% positif (663 tweet), 14,83% negatif (183 tweet), dan 34,21% netral (440 tweet). Dari hasil pemodelan, Support Vector Machine dan Random Forest menunjukkan performa tertinggi dengan akurasi 81%, sedangkan Naïve Bayes memiliki performa paling rendah dengan akurasi 62%. Meskipun terdapat variasi kinerja di antara algoritma yang di gunakan,  tidak ada satu metode pun yang sepenuhnya konsisten dalam klasifikasi sentimen. Penelitian ini memberikan kontribusi dalam memetakan sentimen publik terkait perdebatan politik di Indonesia melalui analisis data media sosial. serta memberikan wawasan tentang efektivitas algoritma Machine Learning dalam analisis sentimen.