Studi ini bertujuan menganalisis sentimen publik terhadap Core Tax Administration System (CTAS), layanan pajak digital baru Direktorat Jenderal Pajak (DJP) di Indonesia. Sebanyak 2.530 tweet berbahasa Indonesia di platform X dikumpulkan melalui web scraping antara 1 Januari dan 8 Februari 2025. Setiap tweet dipra-proses: pembersihan, case folding, tokenisasi, normalisasi, stemming, penyaringan, dan pelabelan sentimen dengan leksikon InSet. Term Frequency Inverse Document Frequency (TF-IDF) digunakan untuk ekstraksi fitur, lalu dua algoritma klasifikasi Naive Bayes dan Logistic Regression diuji dengan rasio 80:20. Logistic Regression unggul dengan akurasi 80,83%, presisi 80,4%, recall 80,8%, dan skor F1 78,6%, sedangkan Naive Bayes mencapai akurasi 52,96%. Analisis word cloud mengidentifikasi kata atau frasa yang paling sering muncul. Temuan ini menegaskan keunggulan Logistic Regression dalam klasifikasi sentimen dan memberikan rekomendasi bagi pembuat kebijakan serta pengembang sistem untuk meningkatkan kegunaan CTAS dan memperkuat kepercayaan publik
Copyrights © 2025