Penelitian ini memiliki tujuan untuk melakukan komparasi tiga perhitungan klasifikasi, yakni Naïve Bayes, Random Forest, dan Support Vector Machine (SVM), dalam melakukan Analisis Sentimen terkait opini masyarakat pada Pertamina di media Twitter. Data diperoleh melalui proses crawling menggunakan pustaka Tweepy pada rentang waktu 1 Januari 2025 hingga 17 Maret 2025, dengan jumlah total sebanyak 7.224 tweet. Setelah melalui tahap preprocessing dan pelabelan, ditemukan bahwa sebagian besar percakapan didominasi oleh sentimen negatif. Salah satu tantangan yang dihadapi dalam penelitian ini adalah ketidakseimbangan distribusi data antar kelas sentimen. Untuk mengatasi permasalahan tersebut, digunakan teknik SMOTE (Synthetic Minority Over-sampling Technique) guna meneysuaikan jumlah data pada setiap kelasPenilaian dilakukan dengan menggunakan pengukuran presisi, akurasi, recall, dan skor F1-Score, serta dianalisis melalui confusion matrix. Hasil akhir menunjukkan bahwa penerapan SMOTE berdampak positif terhadap peningkatan kinerja model. Akurasi Naïve Bayes meningkat dari enam puluh menjadi tujuh puluh delapan, Random Forest dari tujuh puluh menjadi delapan puluh delapan, dan SVM mengalami peningkatan paling tinggi dari tujuh puluh lima menjadi sembilan puluh satu. Berdasarkan hasil tersebut, SVM dinilai sebagai model yang paling optimal dalam mengklasifikasikan sentimen publik terhadap Pertamina setelah dilakukan penyeimbangan data
Copyrights © 2026