Penelitian ini membandingkan kinerja Support Vector Machine dan Naive Bayes untuk analisis sentimen komentar demonstrasi DPR pada 25 agustus 2025, mengidentifikasi faktor yang memengaruhi prediksi, serta memahami peran preprocessing dan fitur TF-IDF dalam menghasilkan klasifikasi yang stabil. Penelitian ini menggunakan komentar dari youtube berjumlah 17.335 komentar yang diproses melalui tahapan eksplorasi data, pembersihan teks, pelabelan berbasis lexicon berbasis bootstrapping, dan ekstraksi fitur utama (TF-IDF unigram/biagram). Hasil penelitian menunjukkan bahwa Support Vector Machine memberikan akurasi lebih tinggi yaitu 98% dibandingkan Naive Bayes memberikan 88% karena cenderung bias pada kelas mayoritas . Perbedaan performa dipengaruhi oleh struktur data, distribusi kata, serta sensitivitas model terhadap fitur yang tidak merata. SVM mampu memaksimalkan pemisahan antar kelas sehingga lebih stabil pada ruang fitur berdimensi tinggi, sedangkan Naive Bayes menghadapi kesulitan dalam mengenali pola sentimen ketika kelasTidakSeimbang mendominasi. Penelitian ini menegaskan bahwa preprocessing dan representasi fitur TF-IDF berperan besar dalam mengurangi noise serta meningkatkan kualitas pembelajaran model. Penelitian ini menyimpulkan bahwa SVM lebih sesuai digunakan untuk analisis sentimen komentar politik di Indonesia. Temuan ini memberi dasar empiris bagi pengembangan metode analisis sentimen pada isu sosial yang memiliki dinamika bahasa dan variasi konteks yang tinggi.
Copyrights © 2025