Jurnal Edukasi dan Penelitian Informatika (JEPIN)
Vol 10, No 3 (2024): Volume 10 No 3

Optimasi Klasifikasi Sentimen Menggunakan Random Forest dengan Preprocessing K-Means Clustering dan SMOTE

Angkoso, Cucun Very (Unknown)
Thrisna, Mochamad Adrian Nuradha (Unknown)
Satoto, Budi Dwi (Unknown)
Kusumaningsih, Ari (Unknown)



Article Info

Publish Date
30 Dec 2024

Abstract

Salah satu topik penelitian terkini dalam bidang pengolahan informasi adalah opinion mining atau analisis sentimen dimana didalamnya terdapat pekerjaan utama yaitu klasifikasi sentimen pada data teks. Penelitian ini bertujuan mengoptimalkan proses klasifikasi sentimen dengan mengatasi tantangan-tantangan umum seperti ketidakseimbangan kelas dan kualitas data input dengan mengusulkan metode baru untuk meningkatkan kinerja mesin klasifikasi yang digunakan. Data yang digunakan untuk mengevaluasi metode yang diusulkan adalah satu topik yang diperbincangkan di media sosial Twitter yaitu terkait kebijakan peralihan mobil listrik di Indonesia. Jumlah data yang dikumpulkan adalah tweet berbahasa Indonesia dimulai pada tanggal 01 Januari 2019 hingga 27 Februari 2023 dengan jumlah data yang diperoleh adalah 7.745 data tweet. Penelitian ini mengikuti model penelitian data science CRISP-DM, dimulai dengan observasi topik, pengumpulan data, pelabelan, dan preprocessing data. Data yang telah diberi label dibagi menjadi data train dan data test, kemudian melalui tahap ekstraksi fitur menggunakan TF-IDF (Term Frequency-Inverse Document Frequency). Model Random Forest diterapkan untuk klasifikasi sentimen, dan teknik SMOTE (Synthetic Minority Over-sampling Technique) digunakan untuk menangani ketidakseimbangan kelas. Hasil eksperimen menunjukkan bahwa kombinasi preprocessing K-Means Clustering dan SMOTE secara signifikan meningkatkan kinerja model klasifikasi sentimen. Model Random Forest menghasilkan akurasi sebesar 98,47% dengan 5-fold cross validation, dan setelah penambahan teknik SMOTE, akurasi meningkat menjadi 99,55%.

Copyrights © 2024






Journal Info

Abbrev

jepin

Publisher

Subject

Computer Science & IT Education

Description

Jurnal Edukasi dan Penelitian Informatika (JEPIN) merupakan peer reviewed journal di bidang informatika. Jurnal ini diterbitkan 3 bulan dalam setahun (April, Agustus, dan Desember) oleh Program Studi Informatika, Fakultas Teknik, Universitas Tanjungpura, ...