Social media platforms such as Twitter make it easy for users to share and receive critical information on disasters and emergencies. Information from eyewitnesses can be useful for law enforcement agencies and humanitarian organizations. Identification disaster messages on Twitter can also be used as information that can be used to see the current situation. In several research studies, earthquake disasters are divided into three categories: eyewitnesses, non-eye witnesses, and do not know. Meanwhile, the feature extraction that used in this research is bag-of-words that produce high-dimensional data output. The purpose of this research is to utilize lexicon-based feature extraction to produce low-dimensional data. However, there has never been the use of Lexicon based on the multiclass classification in cases of natural disasters. The features built by the Lexicon-based are far less, namely 2-15 features. This research was divided into two steps, namely the first step was carried out without combining Lexicon and the second step was carried out by combining Lexicon. The highest accuracy produced by the combination of Barasa SentiwordNet, Bing Liu, NRC, AFINN, and Heeryon Cho’s Lexicon using the Support Vector Machine classification with an accuracy of 64.13% with a total of 15 features.Keywords: Lexicon Based, Support Vector Machine, Classification, Text Mining, Twitter, DisastersPlatform media sosial seperti Twitter memudahkan para pengguna untuk berbagi dan menerima informasi penting selama bencana dan keadaan darurat. Informasi dari saksi mata dapat berguna bagi lembaga penegak hukum dan organisasi kemanusiaan. Pesan bencana di Twitter juga dapat digunakan sebagai informasi yang digunakan untuk mengetahui situasi yang sedang berlangsung. Pada beberapa riset yang telah dilakukan oleh peneliti, tweet bencana gempa dibagi menjadi tiga kategori yaitu eyewitness, non-eyewitness, dan don’t know. Sedangkan ekstraksi fitur yang digunakan pada riset-riset tersebut adalah bag-of-words yang menghasilkan keluaran berupa data berdimensi tinggi. Tujuan penelitian ini adalah memanfaatkan ekstraksi fitur berbasis lexicon untuk menghasilkan data berdimensi rendah. Namun belum pernah ada pemanfaatan Lexicon Based untuk klasifikasi multiclass pada kasus klasifikasi pesan bencana alam. Fitur yang dihasilkan oleh Lexicon based jauh lebih sedikit yaitu 2-15 fitur. Penelitian ini dibagi menjadi dua tahap, yaitu tahap pertama dilakukan tanpa penggabungan kamus Lexicon dan tahap kedua dilakukan dengan menggabungkan kamus Lexicon. Akurasi tertinggi dihasilkan oleh kombinasi Barasa SentiwordNet, Bing Liu, NRC, AFINN, dan Lexicon Heeryon Cho menggunakan klasifikasi Support Vector Machine dengan akurasi sebesar 64,13% dengan jumlah fitur sebanyak 15 fitur. Kata kunci: Lexicon based, Support Vector Machine, Klasifikasi, Text Mining, Twitter, Bencana Alam
                        
                        
                        
                        
                            
                                Copyrights © 2021