This Author published in this journals
All Journal Buffer Informatika
Fattah, Mi'raj
Unknown Affiliation

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Analisis Komparasi TF-IDF dan Word2Vec pada Algoritma SVM Untuk Sentimen Pembangunan IKN di YouTube: Studi Kasus Komentar YouTube pada Kanal Pembangunan IKN Fattah, Mi'raj; Taghfirul Azhima Yoga Siswa; Naufal Azmi Verdikha
Buffer Informatika Vol. 12 No. 1 (2026): Buffer Informatika
Publisher : Department of Informatics Engineering, Faculty of Computer Science, University of Kuningan, Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.25134/buffer.v12i1.551

Abstract

Pembangunan Ibu Kota Negara (IKN) Nusantara merupakan kebijakan strategis nasional yang menuai beragam reaksi publik, baik positif maupun negatif, terutama di media sosial seperti YouTube. Penelitian ini bertujuan untuk melakukan analisis sentimen terhadap opini masyarakat mengenai pembangunan IKN serta membandingkan kinerja akurasi antara dua metode ekstraksi fitur, yaitu Term Frequency-Inverse Document Frequency (TF-IDF) dan Word2Vec, menggunakan algoritma Support Vector Machine (SVM). Data penelitian terdiri dari 1.969 komentar bersih yang dikumpulkan melalui teknik scraping pada periode Juli hingga September 2025. Tahapan penelitian meliputi pengambilan data, pre-processing (pembersihan, case folding, normalisasi, tokenisasi, stopword removal, dan stemming), pelabelan data manual yang divalidasi ahli bahasa, ekstraksi fitur, serta klasifikasi menggunakan SVM dengan kernel Radial Basis Function (RBF). Evaluasi model dilakukan menggunakan metode 10-Fold Cross Validation dan Confusion Matrix. Hasil penelitian menunjukkan bahwa TF-IDF memberikan kinerja yang lebih baik dibandingkan Word2Vec pada dataset ini. SVM dengan TF-IDF menghasilkan rata-rata akurasi sebesar 74,40%, sedangkan SVM dengan Word2Vec menghasilkan akurasi sebesar 72,98%. Penelitian ini menyimpulkan bahwa representasi fitur berbasis frekuensi (TF-IDF) lebih efektif dibandingkan representasi semantik (Word2Vec) dalam mengklasifikasikan sentimen komentar singkat di YouTube terkait topik IKN.