Fransesko Indrajid
Unknown Affiliation

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

MODEL KLASIFIKASI TWEET TERKAIT ISU #INDONESIAGELAP MENGGUNAKAN SUPPORT VECTOR MACHINE BERBASIS DISTRIBUSI TOPIK LDA Fransesko Indrajid; I Nyoman Saputra Wahyu Wijaya
Jurnal Informatika dan Teknik Elektro Terapan Vol. 14 No. 1 (2026)
Publisher : Universitas Lampung

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.23960/jitet.v14i1.8878

Abstract

Abstrak. Tagar #IndonesiaGelap di platform X mencerminkan keresahan masyarakat terhadap dinamika sosial-politik Indonesia. Tingginya volume data tweet terkait tagar ini menghadirkan tantangan praktis dalam pengembangan model klasifikasi teks. Kendala utama terletak pada proses pelabelan data untuk supervised learning, di mana pelabelan manual pada dataset berskala besar menjadi tidak efisien dan memakan waktu lama. Penelitian ini bertujuan untuk mengembangkan model klasifikasi teks sekaligus menyelesaikan permasalahan efisiensi pelabelan tersebut melalui pendekatan otomatis. Metode yang diusulkan mengintegrasikan Latent Dirichlet Allocation (LDA) sebagai generator label otomatis (automated labeling) dan Support Vector Machine (SVM) sebagai pengklasifikasi. LDA digunakan untuk mengekstraksi struktur topik tersembunyi yang kemudian dikonversi menjadi label kategori untuk data latih. Hasil eksperimen menunjukkan bahwa LDA berhasil membentuk 6 label topik yang koheren. Model SVM yang dilatih menggunakan data berlabel otomatis ini, melalui optimasi hyperparameter Kernel RBF, mampu mencapai akurasi sebesar 88,05%. Penelitian ini membuktikan bahwa integrasi LDA dan SVM merupakan solusi strategis untuk mengatasi hambatan pelabelan data, memungkinkan pembangunan model klasifikasi yang akurat pada data media sosial berskala besar tanpa memerlukan intervensi manual. Abstract. The #IndonesiaGelap hashtag on the X platform reflects public unrest regarding Indonesia's socio-political dynamics. The high volume of tweets regarding this hastag presents practical challenges in developing text classification models. The primary obstacle lies in the data labeling process for supervised learning, where manual labeling on large-scale datasets is inefficient and time-consuming. This study aims to develop a text classification model while solving the labeling efficiency problem through an automated approach. The proposed method integrates Latent Dirichlet Allocation (LDA) as an automated label generator and Support Vector Machine (SVM) as a classifier. LDA is utilized to extract hidden topic structures, which are then converted into category labels for training data. Experimental results show that LDA successfully formed 6 coherent topic labels. The SVM model trained using this automatically labeled data, through RBF Kernel hyperparameter optimization, achieved an accuracy of 88.05%. This study demonstrates that the integration of LDA and SVM is a strategic solution to overcome data labeling bottlenecks, enabling the construction of accurate classification models on massive social media data without the need for manual intervention.