Pada era informasi ini semakin banyak penilaian, pendapat dan pandangan yang dapat ditemukan secara luas di dunia maya. Contohnya adalah ulasan film, di mana penonton berbagi pandangannya mengenai sebuah film. Ulasan film adalah platform di mana para penggemar film dapat mengungkapkan pendapat mereka, baik itu dalam bentuk komentar negatif atau pun positif. Sebagian besar website untuk ulasan film sudah memiliki rating atau bintang, namun rating tinggi tidak selalu diiringi oleh ulasan yang baik begitu pun sebaliknya. Untuk itu, dibutuhkan metode untuk menganalisis teks dengan tujuan mengklasifikasikan apakah ulasan film tersebut termasuk dalam kategori negatif ataupun positif. Teknik yang digunakan adalah analisis sentimen atau opinion mining. Analisis sentimen adalah bidang dalam machine learning yang bertujuan untuk mengambil informasi bersifat subjektif dari teks ulasan. Salah satu metode klasifikasi machine learning adalah Support Vector Machine (SVM). Namun semakin banyak data akan muncul beberapa masalah yaitu banyaknya kata atau fitur yang tidak relevan menyebabkan kinerja pengklasifikasian menurun. Fitur tidak relevan akan menyebab perfomansi yang rendah. Seleksi fitur Gini Indeks dan Chi-Square dibandingkan untuk mengatasi masalah kata yang tidak relevan. Pada penelitian ini, metode klasifikasi SVM kombinasikan dengan metode seleksi fitur untuk meningkatkan performansi. Kombinasi SVM dan Gini Index menghasilkan performansi F1-score sebesar 85.8%. Sedangkan menggunakan SVM dan Chi-Square menghasilkan performansi F1-score tertinggi yaitu sebesar 89.2%.
Copyrights © 2023