Jurnal Sains Sistem Informasi
Vol 4, No 2 (2026): JSSI (Mei)

Klasifikasi Sentimen Ulasan Produk Tokopedia Menggunakan SVM dan Random Forest dengan Strategi Eliminasi Label Ambigu Berbasis Binary Classification

Aziza, Annisa Fathia (Unknown)
Noor, Hayati (Unknown)



Article Info

Publish Date
15 May 2026

Abstract

@font-face {font-family:"Cambria Math"; panose-1:2 4 5 3 5 4 6 3 2 4; mso-font-charset:0; mso-generic-font-family:roman; mso-font-pitch:variable; mso-font-signature:-536870145 1107305727 0 0 415 0;}p.MsoNormal, li.MsoNormal, div.MsoNormal {mso-style-unhide:no; mso-style-qformat:yes; mso-style-parent:""; margin:0cm; mso-pagination:widow-orphan; font-size:11.0pt; font-family:"Times New Roman",serif; mso-fareast-font-family:"Times New Roman";}.MsoChpDefault {mso-style-type:export-only; mso-default-props:yes; font-size:11.0pt; mso-ansi-font-size:11.0pt; mso-bidi-font-size:11.0pt; mso-font-kerning:0pt; mso-ligatures:none;}div.WordSection1 {page:WordSection1;} Analisis sentimen ulasan produk e-commerce merupakan teknik penting untuk memahami opini konsumen secara otomatis. Penelitian ini membandingkan performa algoritma Support Vector Machine (SVM) dengan kernel Linear dan Random Forest (RF) dalam mengklasifikasikan sentimen ulasan produk Tokopedia ke dalam dua kelas: Positif dan Negatif. Dataset yang digunakan adalah Tokopedia Product Reviews dari Kaggle (farhan999) yang terdiri dari 40.607 ulasan. Penelitian ini mengusulkan strategi labeling berbasis binary classification dengan membuang ulasan rating 3 bintang yang secara linguistik ambigu, sehingga tersisa 976 dokumen valid dari subsample seimbang 500 per kelas. Representasi teks menggunakan TF-IDF dengan 300 fitur (unigram dan bigram, min_df=1). Optimasi hyperparameter dilakukan dengan GridSearchCV 5-Fold dan validasi akhir menggunakan 10-Fold Stratified Cross-Validation. Hasil menunjukkan SVM dengan parameter C=0,1 menghasilkan akurasi 86,73%, precision 86,75%, recall 86,73%, dan F1-score 86,73%, mengungguli Random Forest yang memperoleh akurasi 80,10%. Penelitian ini membuktikan bahwa eliminasi label ambigu (rating 3 bintang) meningkatkan akurasi secara signifikan sebesar 28,57 poin persentase dibandingkan pendekatan 3 kelas sebelumnya.

Copyrights © 2026






Journal Info

Abbrev

JSSI

Publisher

Subject

Computer Science & IT

Description

Jurnal Sains Sistem Informasi adalah media yang menyebarluaskan, mengembangkan dan menfasilitasi hasil penelitian mengenai Ilmu Sistem Informasi, menjadi wadah bagi para dosen, guru, peneliti, mahasiswa dan para praktisi dalam bidang sistem informasi dari seluruh Indonesia, dalam melakukan ...