Jurnal Teknologi Informasi dan Ilmu Komputer
Vol 13 No 2: April 2026

Fitur Information Gain untuk Meningkatkan Nilai Performa Pengklasifikasi Machine Learning pada Analisis Sentimen Komentar Spam Pengguna Youtube

Jasmir, Jasmir (Unknown)
Gunardi, Gunardi (Unknown)
Rohaini, Eni (Unknown)
Naibaho, Ronald (Unknown)
Sukoco, Bambang (Unknown)
Jasmir , Jasmir (Unknown)



Article Info

Publish Date
30 Apr 2026

Abstract

Perkembangan pesat media sosial telah memberikan ruang bagi setiap individu untuk menyampaikan pendapat, baik berupa komentar positif maupun negatif terhadap konten yang mereka akses. Kemudahan dalam memberikan opini secara daring ini berdampak pada semakin besarnya jumlah ulasan yang tersedia. Namun, volume ulasan yang sangat besar sering kali sulit untuk dianalisis secara manual dan berpotensi menimbulkan bias dalam penilaian. Untuk mengatasi permasalahan tersebut, diperlukan pendekatan otomatis melalui klasifikasi sentimen yang bertujuan mengelompokkan opini pengguna ke dalam kategori positif atau negatif. Dalam penelitian ini digunakan tiga algoritma pembelajaran mesin, yaitu Naïve Bayes (NB), K-Nearest Neighbor (KNN), dan Random Forest (RF). Data penelitian diperoleh dari public dataset UCI Machine Learning. Fokus penelitian adalah meningkatkan kinerja klasifikasi dengan memanfaatkan teknik seleksi fitur information gain. Hasil eksperimen menunjukkan bahwa penerapan information gain secara konsisten meningkatkan performa semua algoritma yang diuji, baik pada metrik akurasi, presisi, recall, maupun f1-score. Naïve Bayes awalnya memperoleh akurasi tertinggi sebesar 74,33% pada kondisi tanpa fitur tambahan. Namun, setelah penerapan information gain, algoritma KNN menunjukkan hasil paling optimal dengan akurasi mencapai 81,28% serta performa yang relatif seimbang pada semua metrik evaluasi. Sementara itu, Random Forest juga mengalami peningkatan, meskipun tidak melampaui KNN. Secara keseluruhan, penelitian ini menegaskan bahwa pemilihan fitur yang relevan melalui information gain mampu meningkatkan efisiensi dan efektivitas klasifikasi sentimen, serta dapat menjadi pendekatan yang potensial untuk menganalisis opini dalam skala besar.   Abstract The rapid growth of social media has provided individuals with the opportunity to freely express their opinions, whether positive or negative, toward the content they encounter. The increasing ease of sharing opinions online has resulted in a massive volume of user reviews. However, the large number of reviews is difficult to analyze manually and may introduce bias in interpretation. To address this issue, sentiment classification is applied to automatically categorize user opinions into positive or negative classes. In this study, three machine learning algorithms were employed: Naïve Bayes (NB), K-Nearest Neighbor (KNN), and Random Forest (RF). The dataset was obtained from the public UCI Machine Learning repository. The main objective of this research is to improve classification performance by utilizing feature selection through the information gain method. Experimental results demonstrate that applying information gain consistently enhances the performance of all evaluated algorithms across multiple metrics, including accuracy, precision, recall, and F1-score. Without feature selection, Naïve Bayes achieved the highest accuracy of 74.33%. However, after applying information gain, KNN outperformed the other algorithms by reaching an accuracy of 81.28% and exhibited balanced results across all evaluation metrics. Random Forest also showed improvement but did not surpass the performance of KNN. Overall, these findings highlight the importance of feature selection in improving both the efficiency and effectiveness of sentiment classification. Furthermore, the use of information gain proves to be a promising approach for large-scale opinion analysis, particularly in handling the high dimensionality of textual data.

Copyrights © 2026






Journal Info

Abbrev

JTIIK

Publisher

Subject

Computer Science & IT Engineering

Description

Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) merupakan jurnal nasional yang diterbitkan oleh Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya (UB), Malang sejak tahun 2014. JTIIK memuat artikel hasil-hasil penelitian di bidang Teknologi Informasi dan Ilmu Komputer. JTIIK berkomitmen ...