Noor, Farras Rachmanisa
Unknown Affiliation

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Penerapan Support Vector Machine untuk Klasifikasi Opini Masyarakat Terhadap Isu Bullying Noor, Farras Rachmanisa; Sirodj, Dwi Agustin Nuriani
Jurnal Riset Statistika Volume 4, No. 1, Juli 2024, Jurnal Riset Statistika (JRS)
Publisher : UPT Publikasi Ilmiah Unisba

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/jrs.v4i1.3877

Abstract

Abstract. Support Vector Machine (SVM) concept is explained as an attempt to find the best hyperplane (separation function) that serves as a separator of two classes in the input space by maximizing the distance between classes (Alhaq, et al., 2021). This algorithm has proven to have good performance as a classification method, by producing a fairly good model accuracy value. This analysis process uses the Python programming language, the keywords used for crawling tweet data are a combination of the words bully/bullying and school/elementary school/junior high/high school, with a data retrieval period from November 1, 2022 to June 30, 2023, the results obtained are 13,918 tweets. Then preprocessing is carried out, at this stage the data that passes the classification process is 2,519 tweets with the number of positive sentiments 1,268 tweets and negative sentiments 1,251 tweets. Furthermore, the division of training and testing data with a ratio of 80:20. The application of the SVM algorithm produces an accuracy value of 84.5%, meaning that this method can predict the sentiment of the bullying issue tweet sentence with the category of good classification (Gorunescu, 2011), precision 84.7%, recall 82.9% and F1-score 83.8%. Overall, this model works well and consistently for the case of tweet data. Abstrak. Support Vector Machine (SVM) dijelaskan sebagai usaha mencari hyperplane (fungsi pemisah) terbaik yang berfungsi sebagai pemisah dua buah kelas pada input space dengan memaksimalkan jarak antar kelas (Alhaq, et al., 2021). Algoritma ini sudah terbukti memiliki kinerja yang baik sebagai metode klasifikasi, dengan menghasilkan nilai akurasi model yang cukup baik. Proses analisis ini menggunakan bahasa pemrograman Python, kata kunci yang digunakan untuk crawling data tweet yaitu kombinasi kata bully/bullying dan sekolah/SD/SMP/SMA, dengan periode pengambilan data dari 1 November 2022 hingga 30 Juni 2023, hasilnya diperoleh 13.918 tweet. Kemudian dilakukan preprocessing, pada tahap ini data yang lolos dilanjutkan proses klasifikasi sebanyak 2.519 tweet dengan jumlah sentimen positif 1.268 tweet dan sentimen negatif 1.251 tweet. Selanjutnya pembagian data training dan testing dengan perbandingan 80:20. Penerapan algoritma SVM menghasilkan nilai accuracy sebesar 84.5%, artinya metode ini dapat melakukan prediksi sentimen dari kalimat tweet isu bullying dengan kategori good classification (Gorunescu, 2011), precision 84.7%, recall 82.9% dan F1-score 83.8%. Secara keseluruhan model ini bekerja dengan baik dan konsisten untuk kasus data tweet.