Dalam penelitian ini, sentimen masyarakat mengenai cryptocurrency yang disampaikan melalui tweet pada media sosial twitter akan di analisis menggunakan machine learning. Terdapat beberapa tahapan dalam melakukan analisis sentimen yaitu tahap pengumpulan data, preprocessing, labeling, pembobotan kata, klasifikasi dan evaluasi. Proses pengumpulan data dilakukan dengan metode scraping menggunakan library python snscrape dan menghasilkan sebanyak 10000 data tweet bahasa Indonesia yang berkaitan yang berkaitan dengan cryptocurrency. Proses preprocessing untuk pembersihan data terdiri dari 6 tahapan yaitu remove duplicate, case folding, cleansing, normalisasi kata, tokenizing, stopword removal dan lemmatization. Pada proses labeling data akan dilakukan secara otomatis menggunakan program python dengan library textblob, hasil labeling data terbagi menjadi 3 kelas yaitu sentimen positif, negatif dan netral. Pada tahap klasifikasi, algoritma naive bayes akan dikombinasikan dengan fitur pembobotan kata TF-IDF dalam satu kelas pipeline python. Data tweet yang digunakan dalam tahap klasifikasi sebanyak 5000 data yang terdiri dari 2500 data dengan label positif dan 2500 data dengan label negatif yang kemudian dibagi menjadi 2 yaitu sebanyak 4000 data untuk data latih dan 1000 data untuk data uji. Pengujian dan evaluasi yang dilakukan dengan metode confusion matrix menggunakan algoritma naive bayes menghasilkan nilai akurasi sebesar 89%
Copyrights © 2024