JUSTIN (Jurnal Sistem dan Teknologi Informasi)
Vol 13, No 2 (2025)

Perbandingan Algoritma Support Vector Machine (SVM) dan Naive Bayes pada Analisis Sentimen Bahasa Jawa dan Sunda

Putri, Galuh Kusuma (Unknown)
Sujaini, Herry (Unknown)
Ulumi, Desepta Isna (Unknown)



Article Info

Publish Date
02 May 2025

Abstract

Perbedaan  struktur  kalimat,  pilihan  kata, dan  tingkatkesopanan  dalam  Bahasa Jawa dan Sunda  dibandingkan  dengan  Bahasa Indonesia  membuat  analisis  sentimenmenjadi  lebih  kompleks.  Karakteristik  unik  kedua  bahasaini  sering  kali  sulit  dipahami,  terutama  bagi  bukan  penuturaslinya,  sehingga  metode  pemrosesan  teks  yang  umumdigunakan  untuk  Bahasa Indonesia  tidak  selalu  efektif.  Oleh  karena  itu,  diperlukan  pendekatan  yang  dapatmengklasifikasikan  sentimen  teks  berbahasa  daerah  ini,  apakah  bersifat  positif,  negatif,  atau  netral,  gunameningkatkan  pemahaman  terhadap  opini  masyarakat  sertamemperluas  aksesibilitas  informasi.  Mengingat  tantangantersebut,  penelitian  ini  berfokus  pada  eksplorasi  metodeklasifikasi  yang  dapat  secara  efektif  menanganikarakteristik  unik  dari  Bahasa Jawa dan Sunda  dalamanalisis  sentimen.  Untuk  itu,  penelitian  ini  bertujuanmelakukan  perbandingan  antara  algoritma  Support Vector Machine  (SVM) dan  Naive Bayes  guna  menentukanpendekatan  yang paling  sesuai  dalam  mengklasifikasikansentimen  teks  pada  kedua  bahasa  ini.  SVM  mencari  garis  pemisah  terbaik  untuk  mengklasifikasikan  data,  sedangkanNaive Bayes  menggunakan  perhitungan  probabilitasberdasarkan  pola  kata yang  muncul.  Dalam  penelitian  iniekstraksi  fitur  dilakukan  menggunakan  TF-IDF  dan  seleksifitur  menggunakan  Chi-Square. Data yang  digunakan  dariIndonesian NLP data catalogue  yang  terdata  mulai  daritahun  2020-2023.  Hasil  penelitian  menunjukkan  bahwametode  klasifikasi  Support Vector Machine  (SVM)  lebihbaik  dari  pada  Naive Bayes  di  kedua  bahasa.  SVM  mendapatkan  akurasi  pada Bahasa Jawa  sebesar  76% dan Bahasa Sunda  sebesar  80%  sedangkan  Naive Bayes  pada Bahasa Jawa  sebesar  73% dan Bahasa Sunda  sebesar  77%. SVM  menjadi  metode  terbaik  dalam  penelitian  ini  karenamenunjukkan  performa  yang  lebih  baik  pada  kedua  bahasadibandingkan  Naive Bayes.

Copyrights © 2025






Journal Info

Abbrev

justin

Publisher

Subject

Computer Science & IT

Description

JUSTIN aims to publish research results and thoughts among academics, researchers, scientists, and practitioners in the field of informatics/computer science so that they are freely available to the public, and support the exchange of knowledge. The scope of JUSTIN is but is not limited to the ...