Saat ini, platform media sosial yang memiliki penggunaan paling luas adalah Twitter. Twitter memiliki potensi untuk memberikan pemahaman mendalam tentang perubahan perilaku masyarakat terkait aturan pencegahan, tingkat kepatuhan terhadap vaksinasi, dan perubahan adaptasi sosial seiring berjalannya waktu selama masa endemi. Untuk dapat mengklasifikasikan data dari Twitter secara efisien, diperlukan pengembangan model klasifikasi yang solid dan penerapan metode analisis data yang canggih. Pendekatan yang diadopsi dalam penelitian ini adalah menerapkan teknik Latent Semantic Analysis (LSA), yang bertujuan untuk mengungkap struktur semantik atau makna yang tersembunyi dalam kalimat. Fokus utama penelitian ini adalah untuk mengevaluasi pengaruh dari klasifikasi data Twitter sepanjang masa pandemi hingga fase endemi terhadap performa Latent Semantic Analysis yang diaplikasikan menggunakan metode Naïve Bayes. Hasil penelitian menunjukkan bahwa dalam skenario klasifikasi menggunakan metode Naïve Bayes tanpa melalui proses LSA, tingkat akurasi yang berhasil dicapai adalah 22,00%. Akan tetapi, dalam konteks yang sama, saat LSA diaplikasikan sebelum menerapkan metode Naïve Bayes, terjadi peningkatan signifikan dalam tingkat akurasi menjadi 24,00%. Dari hasil ini, dapat ditarik kesimpulan bahwa penggunaan LSA memberikan sumbangan positif dalam mencapai hasil yang lebih memuaskan. Selanjutnya, dalam upaya mengklasifikasikan data menggunakan metode Naïve Bayes, penelitian dilakukan dalam dua skenario, yaitu menggunakan data yang seimbang dan tidak seimbang. Ketika data seimbang digunakan bersamaan dengan penerapan metode Naïve Bayes setelah tahap LSA, tingkat akurasi yang tercapai adalah 16,00%. Sebaliknya, ketika data tidak seimbang digunakan dalam skenario yang sama, terjadi peningkatan yang signifikan dalam tingkat akurasi, mencapai angka 24,00%. Dari hasil ini, dapat disimpulkan bahwa penggunaan data yang tidak seimbang memiliki dampak positif pada performa klasifikasi.