Perbedaan struktur kalimat, pilihan kata, dan tingkatkesopanan dalam Bahasa Jawa dan Sunda dibandingkan dengan Bahasa Indonesia membuat analisis sentimenmenjadi lebih kompleks. Karakteristik unik kedua bahasaini sering kali sulit dipahami, terutama bagi bukan penuturaslinya, sehingga metode pemrosesan teks yang umumdigunakan untuk Bahasa Indonesia tidak selalu efektif. Oleh karena itu, diperlukan pendekatan yang dapatmengklasifikasikan sentimen teks berbahasa daerah ini, apakah bersifat positif, negatif, atau netral, gunameningkatkan pemahaman terhadap opini masyarakat sertamemperluas aksesibilitas informasi. Mengingat tantangantersebut, penelitian ini berfokus pada eksplorasi metodeklasifikasi yang dapat secara efektif menanganikarakteristik unik dari Bahasa Jawa dan Sunda dalamanalisis sentimen. Untuk itu, penelitian ini bertujuanmelakukan perbandingan antara algoritma Support Vector Machine (SVM) dan Naive Bayes guna menentukanpendekatan yang paling sesuai dalam mengklasifikasikansentimen teks pada kedua bahasa ini. SVM mencari garis pemisah terbaik untuk mengklasifikasikan data, sedangkanNaive Bayes menggunakan perhitungan probabilitasberdasarkan pola kata yang muncul. Dalam penelitian iniekstraksi fitur dilakukan menggunakan TF-IDF dan seleksifitur menggunakan Chi-Square. Data yang digunakan dariIndonesian NLP data catalogue yang terdata mulai daritahun 2020-2023. Hasil penelitian menunjukkan bahwametode klasifikasi Support Vector Machine (SVM) lebihbaik dari pada Naive Bayes di kedua bahasa. SVM mendapatkan akurasi pada Bahasa Jawa sebesar 76% dan Bahasa Sunda sebesar 80% sedangkan Naive Bayes pada Bahasa Jawa sebesar 73% dan Bahasa Sunda sebesar 77%. SVM menjadi metode terbaik dalam penelitian ini karenamenunjukkan performa yang lebih baik pada kedua bahasadibandingkan Naive Bayes.
                        
                        
                        
                        
                            
                                Copyrights © 2025