Analisis sentimen merupakan salah satu penerapan Natural Language Processing (NLP) yang digunakan untuk mengidentifikasi opini atau emosi seseorang terhadap suatu objek, produk, atau layanan. Dalam penelitian ini, dilakukan analisis sentimen terhadap ulasan film pada dataset IMDb dengan tujuan untuk mengklasifikasikan ulasan menjadi sentimen positif atau negatif. Metode yang digunakan adalah N-Gram sebagai teknik ekstraksi fitur teks dan Logistic Regression sebagai algoritma klasifikasi. Proses diawali dengan pra-pemrosesan teks yang mencakup case folding, penghapusan stopwords, dan lemmatization menggunakan WordNetLemmatizer. Selanjutnya, data direpresentasikan menggunakan TF-IDF (Term Frequency–Inverse Document Frequency) dengan kombinasi N-Gram (1–3) untuk menangkap konteks kata berurutan. Hasil pengujian menunjukkan bahwa model yang dihasilkan memiliki tingkat akurasi sebesar 83%, dengan performa yang baik dalam mendeteksi sentimen positif maupun negatif. Meskipun demikian, model masih memiliki keterbatasan dalam memahami konteks kalimat negasi seperti “not bad” atau “no good”.
Copyrights © 2026