eProceedings of Engineering
Vol 6, No 2 (2019): Agustus 2019

Identifikasi Karakter Presiden Melalui Analisis Sentimen Pada Twitter Menggunakan Naïve Bayes Classifier Dan Pos Tagging

Bastomy Bastomy (Telkom University)
Anisa Herdiani (Telkom University)
Indra Lukmana Sardi (Telkom University)



Article Info

Publish Date
01 Aug 2019

Abstract

AbstrakMedia sosial merupakan salah satu media untuk menyampaikan opini tentang politik, salah satunyatentang presiden. Opini atau pandangan masyarakat dapat berupa opini positif dan negatif. MenurutKBBI karakter merupakan kata sifat, dengan demikian opini yang menjadi fokus utama adalah opiniyang memiliki jenis kata sifat. Kita dapat meneliti sentimen yang terdapat pada Twitter berupa tweetyang menandai presiden untuk mendapatkan karakter. Inti dari penelitian ini menggunakan metodeNaïve Bayes Classifier (NBC) untuk mengklasifikasikan tweet dan POS tagging untuk mengetahui jeniskata dari setiap tweet positif. Dari pengujian yang telah dilakukan menghasilkan pre-processing seperticasefolding, tokenizing, penghapusan kata yang tidak memiliki makna, simbol atau tanda baca. Untukmeningkatkan akurasi NBC digunakan metode N-gram yang bertujuan menggabungkan kata negasi dankata selanjutnya untuk menghindari perubahan makna dari kata tersebut. Hasil pengujian klasifikasidengan menggunakan metode cross-validation menghasilkan rata-rata akurasi sebesar 80,29% dan POStagging menghasilkan akurasi sebesar 73,3% dalam menentukan karakter presiden. pengujian di atasmenunjukkan bahwa identifikasi karakter melalui analisis sentimen menggunakan NBC dan POS taggingdapat digunakan untuk mendapatkan karakter presiden. Hasil akhir penelitian ini berupa daftar kataberjenis kata sifat yang telah diurutkan berdasarkan polaritas kemunculannya yang telah divalidasi olehahli Bahasa.Kata kunci : Analisis sentimen, Naïve Bayes Classifier, N-gram, POS tagging, Preprocessing, TwitterAbstractSocial media is one of the media to express opinions about politics, one of which is about the president.Public opinion or opinion can take the form of positive and negative opinions. According to KBBIcharacters are adjectives, thus opinions that are the main focus are opinions that have the type ofadjectives. We can consider the sentiments on Twitter in the form of tweets needed by the president to getthe character. The core of this research uses the Naïve Bayes Classifier (NBC) method to classify tweetsand POS markings to understand the type of words of each positive tweet. From the testing that has beendone, it produces pre-processing such as casefolding, tokenizing, deletion of words that do not havemeaning, symbols or punctuation. To improve the accuracy of NBC the N-gram method is used whichreplaces the negation words and subsequent words to avoid changing the meaning of the word. Testresults using the cross-validation method produce an average accuracy of 80.29% and POS markingproduces an accuracy of 73.3% in determining the character of the president. Learn above How toexamine characters through sentiment analysis using NBC and POS marking can be used to get thepresident's character. The final results of this study contain a list of adjective type words that have beensorted based on the polarity of their appearance which has been validated by language experts.Keywords: Naïve Bayes Classifier, N-gram, POS tagging, Preprocessing, Sentiment analysis, Twitter

Copyrights © 2019






Journal Info

Abbrev

engineering

Publisher

Subject

Computer Science & IT Control & Systems Engineering Electrical & Electronics Engineering Engineering Industrial & Manufacturing Engineering

Description

Merupakan media publikasi karya ilmiah lulusan Universitas Telkom yang berisi tentang kajian teknik. Karya Tulis ilmiah yang diunggah akan melalui prosedur pemeriksaan (reviewer) dan approval pembimbing ...