Kecepatan dan akurasi menjadi semakin penting dalam analisis sentimen publik, terutama di media sosial seperti Twitter, yang sering digunakan untuk menyampaikan opini terkait berbagai isu terkini. Penelitian ini mengaplikasikan metode Logistic Regression untuk klasifikasi sentimen pada dataset terbatas yang terdiri dari 300 sampel, yang dikategorikan menjadi sentimen positif, negatif, dan netral. Studi kasus mengeksplorasi respons masyarakat terhadap pengangkatan Kaesang Pangarep sebagai Ketua Umum Partai Solidaritas Indonesia (PSI) di Twitter. Data eksternal dari vaksinasi COVID-19 dan topik umum (open topic) digunakan dalam penelitian ini untuk meningkatkan proses klasifikasi. Metode TF-IDF digunakan untuk meningkatkan representasi teks. Grid Search digunakan untuk mengoptimalkan hyperparameter model. Evaluasi dilakukan menggunakan metrik F1-score untuk mengukur precision dan recall. Hasil baseline menunjukkan F1-score sebesar 40,83%, sementara berdasarkan hasil eksperimen yang dilakukan optimasi menghasilkan peningkatan hingga 52,68% dengan akurasi 61,76% pada eksperimen terbaik (C7). Penelitian ini menunjukkan bahwa metode Logistic Regression yang dioptimalkan dapat melakukan klasifikasi dengan dataset terbatas, yang relevan untuk analisis sentimen.
Copyrights © 2025