Penelitian ini bertujuan untuk memahami bagaimana warganet merespons banjir di Sumatera melalui percakapan di Twitter, yang dipilih sebagai objek karena bersifat real-time, datanya relatif terbuka melalui API, dan telah banyak dimanfaatkan sebagai kanal komunikasi bencana serta sumber data untuk analisis kebencanaan di Indonesia maupun global. Data dikumpulkan menggunakan tweet‑harvest dengan kata kunci terkait “banjir” dan “pemerintah”, sehingga diperoleh 517 tweet berbahasa Indonesia dalam rentang waktu tertentu. Teks tweet kemudian dibersihkan melalui serangkaian langkah pre‑processing, seperti penghapusan URL, mention, tanda baca, angka, serta normalisasi menjadi bentuk kata yang lebih ringkas dalam kolom text_final. Tahap berikutnya, setiap tweet diberi skor dan label sentimen menggunakan VADER Sentiment Analyzer, sehingga diperoleh kategori negatif, netral, dan positif. Data tersebut kemudian direpresentasikan secara numerik menggunakan TF‑IDF dan dimanfaatkan sebagai masukan untuk melatih model Logistic Regression sebagai klasifikator sentimen, dengan pemisahan data training dan testing. Evaluasi pada data uji menunjukkan bahwa model mencapai accuracy 0,860, dengan macro F1‑score 0,308 dan weighted F1‑score 0,805, yang menandakan performa sangat baik pada kelas netral namun masih terbatas untuk kelas negatif dan positif akibat ketidakseimbangan data. Secara keseluruhan, sekitar 92,59% tweet diklasifikasikan netral, 3,01% negatif, dan 4,41% positif, menggambarkan bahwa mayoritas percakapan bersifat informatif, sementara keluhan maupun apresiasi hadir dalam porsi kecil namun bermakna. Temuan ini menunjukkan bahwa analisis sentimen berbasis Twitter dapat menjadi alat bantu penting untuk memantau persepsi publik terhadap penanganan banjir, sekaligus menggarisbawahi perlunya model yang lebih sensitif terhadap ekspresi emosi negatif dan positif.
Copyrights © 2026