Media sosial, khususnya Twitter, sering dimanfaatkan pengguna untuk mengekspresikan pengalaman yang berpotensi mengandung ungkapan stres. Penelitian ini bertujuan mengimplementasikan model IndoBERT dalam mengklasifikasikan potensi sumber stres pada teks berbahasa Indonesia. Data dikumpulkan melalui scraping Twitter dan diproses melalui normalisasi, pembersihan, serta tokenisasi sebelum diberi label ke dalam lima kategori: akademik, hubungan, kesehatan, pekerjaan, dan keuangan. Model dilatih menggunakan pendekatan supervised learning dengan fine-tuning, sedangkan evaluasi dilakukan menggunakan precision, recall, dan F1-score. Hasil pengujian menunjukkan kinerja sangat baik dengan rata-rata precision 0.9748, recall 0.9742, dan F1-score 0.9731. Temuan ini membuktikan bahwa IndoBERT efektif digunakan untuk deteksi potensi sumber stres pada media sosial dan berkontribusi terhadap pengembangan NLP untuk kesehatan mental digital.
Copyrights © 2025