Penggunaan hashtag pada pelaporan bencana dapat membantu pihak yang berkepentingan seperti pemerintah atau lembaga penanggulangan bencana dalam menangani bencana. Akan tetapi pemberian hashtag oleh pengguna seringkali tidak sesuai dengan isi tweet. Sehingga perlu untuk dilakukan klasifikasi twitter ke dalam kategori darurat, non darurat, dan tidak relevan. Hal tersebut dilakukan untuk mempermudah lembaga terkait untuk melakukan koordinasi, pemantauan dan tanggap darurat dalam penanggulangan bencana. Penelitian ini melakukan perbandingan klasifikasi menggunakan metode Naïve Bayes, Support Vector Machine, dan Logistic Regression. Ekstraksi fitur menggunakan pembobotan term TF IDF. Guna mengatasi ketidakseimbangan kelas pada dataset dilakukan teknik untuk mensintesis sampel baru menggunakan metode Synthetic Minority Over-sampling Technique (SMOTE). Hasil penelitian menunjukkan klasifikasi menggunakan metode Logistic Regression memberikan hasil terbaik yaitu akurasi sebesar 92,4%. Keywords: Klasifikasi, Twitter, Bencana, Naïve Bayes, Support Vector Machine, Logistic Regression
Copyrights © 2023