Kasus korupsi PT. Pertamina (Persero) yang mencuat pada awal tahun 2025 telah menarik perhatian luas masyarakat, khususnya di platform X. Penelitian ini bertujuan untuk menganalisis sentimen masyarakat terhadap kasus tersebut menggunakan algoritma Support Vector Machine (SVM) sebagai metode klasifikasi. Data diperoleh melalui teknik tweet harvest dengan kata kunci "korupsi pertamina" dalam rentang waktu 24 Februari 2025 hingga 31 Maret 2025, menghasilkan 280 data yang terdiri dari 7 sentimen positif dan 273 sentimen negatif. Tahapan penelitian mencakup pre-processing data, seperti pembersihan teks, tokenisasi, normalisasi, penghapusan stopword, dan stemming. Namun, karena dataset awal menunjukkan ketidakseimbangan kelas yang signifikan, dengan dominasi sentimen negatif, maka dari itu, digunakan metode Synthetic Minority Over-sampling Technique (SMOTE) untuk meningkatkan keseimbangan distribusi data. Hasil pengujian menunjukkan bahwa model SVM tanpa SMOTE memperoleh akurasi 89%, sedangkan setelah penerapan SMOTE, akurasi meningkat menjadi 96%. Hal ini membuktikan bahwa SMOTE mampu meningkatkan kinerja model dengan memperbaiki keseimbangan data. Penelitian ini berkontribusi dalam pengembangan analisis sentimen berbasis kecerdasan buatan, terutama dalam memahami persepsi publik terhadap isu sosial
Copyrights © 2025