Penelitian ini bertujuan untuk membandingkan kinerja dua algoritma klasifikasi, yaitu Naive Bayes (NB) dan K-Nearest Neighbor (KNN), dalam menganalisis sentimen komentar masyarakat terhadap topik Danantara di X. Data diperoleh melalui proses crawling menggunakan Google Collab, kemudian diolah dengan pendekatan kuantitatif eksperimental. Penelitian ini menguji empat skenario preprocessing teks untuk mengevaluasi pengaruhnya terhadap akurasi klasifikasi sentimen, dengan implementasi dilakukan melalui RapidMiner. Hasil analisis menunjukkan bahwa kombinasi cleaning, case folding, tokenizing, dan stemming merupakan skema preprocessing paling optimal, menghasilkan akurasi tertinggi sebesar 66,59% untuk NB dan 68,89% untuk KNN. Sebaliknya, tanpa preprocessing, akurasi menurun drastis menjadi 51,38% (NB) dan 51,15% (KNN). Skema parsial lainnya memberikan hasil akurasi yang mendekati, seperti kombinasi cleaning, case folding, tokenizing, dan stopword removal yang menghasilkan 65,21% (NB) dan 66,13% (KNN). Secara umum, algoritma KNN menunjukkan kinerja yang lebih unggul dibandingkan NB dalam setiap skenario. Analisis visual menggunakan word cloud mengungkapkan bahwa kata "Indonesia" dan "semangat" mendominasi sentimen positif, "korupsi" dan "koruptor" mendominasi sentimen negatif, serta "presiden" dan "BUMN" muncul dominan pada sentimen netral. Temuan ini diharapkan dapat menjadi acuan dalam pengembangan sistem klasifikasi sentimen, sekaligus memberikan gambaran umum tentang pandangan publik terhadap isu Danantara.
Copyrights © 2025