Sehubung dengan mudahnya akses digital seperti penggunaan media sosial twitter, maka setiap individu menjadi lebih bisa untuk saling berinteraksi dalam bertukar pendapat, argumen dan pokok pikiran. Sehingga ketersediaan data untuk dikumpulkan dan diolah menjadi suatu informasi seperti sentimen analisis terasa lebih gampang dan cepat untuk didapatkan. Melalui analisis sentimen atau opinion mining, maka sentimen analisis dapat diklasifikasikan menjadi 3 jenis, yaitu sentimen positif, netral dan negatif. Tujuan penelitian ini adalah untuk menghasilkan model klasifikasi dengan performa terbaik dan optimal dalam melakukan klasifikasi sentimen tweet Bahasa Indonesia dan juga untuk mengetahui pengaruh penerapan Stopword Removal dalam membangun model klasifikasi sentimen analisis. Adapun agoritma yang digunakan pada penelitian ini adalah algoritma Naïve Bayes dan Decision Tree. Berdasarkan hasil evaluasi, model klasifikasi terbaik pada penelitian ini adalah dengan pengimplementasian algoritma Naïve Bayes tanpa disertai Stopword Removal dengan nilai f1-score sebesar 71.78%. Sedangkan model klasifikasi terburuk pada penelitian ini adalah pada pengimplementasian algoritma Decision Tree tanpa disertai Stopword Removal dengan nilai f1-score sebesar 58.08%. Untuk penerapan Stopword Removal, pada algoritma Decision Tree penerapannya lebih memberikan performa optimal jika dibandingkan dengan algoritma Naïve Bayes. Hal ini terlihat dengan terjadinya peningkatan nilai f1-score pada algoritma Decision Tree dan penurunan nilai f1-score pada algoritma Naïve Bayes. Salah satu faktor penurunan ini ialah dikarenakan Stopword Removal dapat mengurangi informasi dan mengubah makna tweet yang diolah dikarenakan ia akan melakukan penghapusan pada kata yang masuk kedalam daftar stoplist, sehingga tweet tersebut kehilangan sentimennya. Ditambah lagi penerapan stoplist NLTK yang digunakan untuk melakukan Stopword Removal pada penelitian ini lebih bekerja optimal pada pengklasifikasian dokumen dibandingkan sentimen.
Copyrights © 2023