Thrisna, Mochamad Adrian Nuradha
Unknown Affiliation

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Optimasi Klasifikasi Sentimen Menggunakan Random Forest dengan Preprocessing K-Means Clustering dan SMOTE Angkoso, Cucun Very; Thrisna, Mochamad Adrian Nuradha; Satoto, Budi Dwi; Kusumaningsih, Ari
JEPIN (Jurnal Edukasi dan Penelitian Informatika) Vol 10, No 3 (2024): Volume 10 No 3
Publisher : Program Studi Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jp.v10i3.84514

Abstract

Salah satu topik penelitian terkini dalam bidang pengolahan informasi adalah opinion mining atau analisis sentimen dimana didalamnya terdapat pekerjaan utama yaitu klasifikasi sentimen pada data teks. Penelitian ini bertujuan mengoptimalkan proses klasifikasi sentimen dengan mengatasi tantangan-tantangan umum seperti ketidakseimbangan kelas dan kualitas data input dengan mengusulkan metode baru untuk meningkatkan kinerja mesin klasifikasi yang digunakan. Data yang digunakan untuk mengevaluasi metode yang diusulkan adalah satu topik yang diperbincangkan di media sosial Twitter yaitu terkait kebijakan peralihan mobil listrik di Indonesia. Jumlah data yang dikumpulkan adalah tweet berbahasa Indonesia dimulai pada tanggal 01 Januari 2019 hingga 27 Februari 2023 dengan jumlah data yang diperoleh adalah 7.745 data tweet. Penelitian ini mengikuti model penelitian data science CRISP-DM, dimulai dengan observasi topik, pengumpulan data, pelabelan, dan preprocessing data. Data yang telah diberi label dibagi menjadi data train dan data test, kemudian melalui tahap ekstraksi fitur menggunakan TF-IDF (Term Frequency-Inverse Document Frequency). Model Random Forest diterapkan untuk klasifikasi sentimen, dan teknik SMOTE (Synthetic Minority Over-sampling Technique) digunakan untuk menangani ketidakseimbangan kelas. Hasil eksperimen menunjukkan bahwa kombinasi preprocessing K-Means Clustering dan SMOTE secara signifikan meningkatkan kinerja model klasifikasi sentimen. Model Random Forest menghasilkan akurasi sebesar 98,47% dengan 5-fold cross validation, dan setelah penambahan teknik SMOTE, akurasi meningkat menjadi 99,55%.