Penelitian ini bertujuan memprediksi tingkat viralitas tweet berbahasa Indonesia dengan menggabungkan fitur teks, sentimen, dan numerik melalui model IndoBERTweet, RoBERTa, dan Multi-Layer Perceptron (MLP). IndoBERTweet digunakan untuk menghasilkan representasi semantik, RoBERTa untuk menganalisis polaritas sentimen, dan MLP sebagai klasifikator yang menggabungkan seluruh fitur. Dataset terdiri dari 1.716 tweet promosi pada platform X (27 November 2024–27 Mei 2025), yang setelah pra-pemrosesan dan pelabelan menggunakan Gaussian Mixture Model (GMM) menghasilkan 1.481 data bersih siap latih. Model mencapai performa tinggi dengan akurasi 96,99%, precision 96,97%, recall 96,99%, dan F1-score 96,97%, mencatat peningkatan sebesar 0,32% dibandingkan Linear SVM dan 1,66% dibandingkan Decision Tree. Temuan ini menunjukkan bahwa integrasi representasi semantik dan sentimen secara efektif meningkatkan akurasi prediksi dibandingkan pendekatan tunggal, serta berpotensi membantu praktisi pemasaran digital merancang strategi kampanye yang lebih tepat sasaran dan berpeluang viral.
Copyrights © 2025