Penelitian ini mengeksplorasi penggunaan pemrosesan bahasa alami (NLP) untuk menganalisis sentimen dalam tweet mengenai kepemimpinan muda dalam pemilihan presiden. Data dikumpulkan dari Twitter, kemudian diproses dan diekstraksi. Proses tokenisasi menghasilkan tokenisasi kata yang kemudian diklasifikasikan menggunakan algoritma Convolutional Neural Network (CNN). Penelitian ini bertujuan untuk membandingkan akurasi algoritma CNN dalam klasifikasi sentimen. Data dikategorikan menjadi dua kelas: positif dan negatif, setelah dikumpulkan dari Twitter. Pre-processing dilakukan menggunakan teknik NLP sebelum tokenisasi. Token yang dihasilkan kemudian dimasukkan ke dalam model CNN untuk proses klasifikasi. Model 1D CNN yang digunakan terdiri dari satu lapisan konvolusi dan satu lapisan pooling, dengan aktivasi ReLU pada lapisan konvolusi. Dataset terdiri dari 200 data, dipecah menjadi 160 data pelatihan dan 40 data uji. Hasil penelitian menunjukkan bahwa label prediksi sesuai dengan label sebenarnya dari kalimat baru. Namun, beberapa faktor seperti ejaan yang tidak konsisten, penggunaan bahasa yang tidak formal, kata-kata yang memiliki arti tersirat atau ambigu,dan kesamaan kata dalam data pelatihan dan uji menyebabkan kesalahan klasifikasi. Penemuan ini menunjukkan bahwa meskipun CNN efektif dalam klasifikasi sentimen, ada tantangan yang perlu diatasi untuk meningkatkan akurasi, terutama dalam memahami konteks bahasa yang kompleks.
Copyrights © 2024