Danantara merupakan isu nasional yang tengah menjadi sorotan publik di media sosial X (sebelumnya Twitter) karena keterkaitannya dengan proyek strategis dan dampak sosial-ekonomi yang luas. Penelitian ini bertujuan untuk menganalisis sentimen publik terhadap Danantara menggunakan pendekatan Natural Language Processing (NLP) berbasis semi-supervised learning dengan menggabungkan metode K-Means Clustering untuk pelabelan otomatis dan model klasifikasi Support Vector Machine (SVM) serta Bidirectional Encoder Representations from Transformers (BERT). Sebanyak 2.009 tweet berbahasa Indonesia dikumpulkan dan diproses melalui tahapan preprocessing yang mencakup pembersihan, tokenisasi, stopword removal, dan stemming. Hasil pelabelan menunjukkan distribusi sentimen yang tidak seimbang, dengan dominasi negatif sebesar 87,0%, netral 3,6%, dan positif 9,4%. Visualisasi word cloud memperlihatkan kata-kata dominan bernuansa kritik seperti “bumn”, “korupsi”, dan “investasi”. Evaluasi performa model menunjukkan bahwa SVM memberikan akurasi tertinggi sebesar 98%, sedangkan BERT hanya mencapai 25%. Rendahnya performa BERT disebabkan oleh keterbatasan jumlah data, distribusi kelas yang tidak seimbang, serta kompleksitas bahasa informal dalam tweet. Temuan ini menunjukkan bahwa pendekatan TF-IDF + SVM lebih tepat digunakan untuk analisis opini publik di media sosial berbahasa Indonesia, terutama ketika data terbatas dan tidak berlabel. Kontribusi utama penelitian ini terletak pada penerapan pendekatan semi-supervised untuk menganalisis isu lokal menggunakan kombinasi teknik unsupervised dan supervised learning yang belum banyak dieksplorasi dalam konteks NLP Indonesia.
                        
                        
                        
                        
                            
                                Copyrights © 2025