Penelitian ini bertujuan untuk mengembangkan dan menguji model klasifikasi sentimen publik terhadap layanan BPJS Ketenagakerjaan berdasarkan data media sosial Twitter. Metode yang digunakan adalah pendekatan kuantitatif eksperimental yang terdiri dari lima tahap, yaitu pengumpulan data, pra-pemrosesan teks, pelabelan data, ekstraksi fitur dan pelatihan model, serta evaluasi performa. Data dikumpulkan melalui API Twitter menggunakan kata kunci terkait layanan BPJS Ketenagakerjaan dengan total 4.357 tweet. Setelah pra-pemrosesan dan pelabelan, data bersih sebanyak 4.102 tweet diklasifikasikan ke dalam tiga kategori sentimen: positif, negatif, dan netral. Dua pendekatan representasi teks digunakan, yaitu TF-IDF dan IndoBERTweet embedding, yang kemudian diuji dengan algoritma pembelajaran mesin seperti Naive Bayes, SVM, Random Forest, dan Logistic Regression. Hasil penelitian menunjukkan bahwa model IndoBERTweet + Logistic Regression memberikan performa terbaik dengan akurasi 86,5% dan F1-score 85,6%. Temuan ini menegaskan efektivitas pretrained language models dalam memahami bahasa Indonesia informal di media sosial. Model yang dikembangkan memiliki potensi untuk digunakan sebagai sistem pemantauan opini publik secara real-time guna meningkatkan kualitas layanan BPJS Ketenagakerjaan. Penelitian selanjutnya disarankan mengeksplorasi penanganan sarkasme dan dataset multi-platform untuk meningkatkan generalisasi model.
Copyrights © 2025