Penelitian ini bertujuan untuk membandingkan performa algoritma Multinomial Naïve Bayes (MNB) dan Logistic Regression (LR) dalam klasifikasi sentimen multi-kelas pada ulasan pengguna aplikasi TIX ID. Sebanyak 2.500 ulasan dikumpulkan melalui proses scraping dari Google Play Store dan diproses melalui tahapan preprocessing, yang meliputi pembersihan teks, case folding, tokenisasi, stopword removal, dan stemming. Dua teknik ekstraksi fitur digunakan, yaitu CountVectorizer dan TF-IDF, sebelum model dilatih menggunakan kedua algoritma. Proses hyperparameter tuning dilakukan menggunakan GridSearchCV dengan lima lipatan cross-validation untuk memperoleh konfigurasi parameter terbaik. Hasil penelitian menunjukkan bahwa MNB dengan CountVectorizer pada tahap sebelum tuning memberikan performa paling unggul, dengan akurasi mencapai 84,80% dan F1-score macro tertinggi dibandingkan kombinasi lainnya. Sementara tuning meningkatkan stabilitas performa model, nilai akurasi tidak melampaui model awal tersebut. Temuan ini menunjukkan bahwa kombinasi MNB dan CountVectorizer lebih sesuai untuk karakteristik teks ulasan aplikasi berbahasa Indonesia yang bersifat sparse dan memiliki pola repetitif. Model terbaik kemudian diimplementasikan dalam sistem analisis sentimen berbasis web yang mampu memproses ulasan secara real time. Penelitian ini memberikan kontribusi pada pengembangan metode analisis sentimen di Indonesia dan penerapannya pada aplikasi layanan digital.
Copyrights © 2026