Peningkatan penggunaan aplikasi transportasi umum, seperti KRL Access, menciptakan kebutuhan untuk memahami sentimen pengguna terhadap aplikasi tersebut. Analisis sentimen dapat menjadi alat efektif dalam memahami persepsi dan kepuasan pengguna. Penelitian ini mengisi kesenjangan dengan mengeksplorasi pengaruh berbagai algoritma klasifikasi dan langkah-langkah data preprocessing terhadap analisis sentimen ulasan pengguna KRL Access. Penelitian ini memberikan pandangan yang melibatkan pertanyaan-pertanyaan kritis tentang pengaruh algoritma klasifikasi (Naïve Bayes, Random Forest, Logistic Regression, Supervised Machine Learning [SVM], dan K-Nearest Neighbors [KNN]) terhadap hasil analisis sentimen. Selain itu, penting untuk memahami kontribusi langkah-langkah data preprocessing (case folding, data filtering, tokenization, stemming, dan removing stopwords) terhadap akurasi dan keandalan analisis sentimen. Hasil penelitian menunjukkan bahwa setiap algoritma memiliki kelebihan dan kelemahan masing-masing. Naïve Bayes menonjol dalam precision, sementara Random Forest memberikan keseimbangan yang baik antara precision dan recall. Langkah-langkah data preprocessing, terutama tokenization dan stemming, berkontribusi signifikan terhadap kualitas analisis sentimen. Visualisasi sentimen melalui wordcloud memberikan gambaran intuitif, menyoroti kepuasan pengguna atas akses informasi jadwal KRL Access, tetapi juga masalah dalam pendaftaran dan login. Kesimpulan penelitian menekankan pentingnya pemilihan algoritma dan data preprocessing yang sesuai untuk analisis sentimen yang akurat. Temuan ini dapat mendukung pengembangan aplikasi yang lebih responsif dan sesuai dengan kebutuhan pengguna, menciptakan pengalaman pengguna transportasi umum yang lebih baik. Dalam penelitian mendatang, disarankan untuk memperluas cakupan dataset dan eksplorasi lebih lanjut terhadap teknik data preprocessing dan penggunaan fitur tambahan
Copyrights © 2024