Jurnal Informatika dan Teknik Elektro Terapan
Vol. 14 No. 1 (2026)

MODEL KLASIFIKASI TWEET TERKAIT ISU #INDONESIAGELAP MENGGUNAKAN SUPPORT VECTOR MACHINE BERBASIS DISTRIBUSI TOPIK LDA

Fransesko Indrajid (Unknown)
I Nyoman Saputra Wahyu Wijaya (Unknown)



Article Info

Publish Date
17 Jan 2026

Abstract

Abstrak. Tagar #IndonesiaGelap di platform X mencerminkan keresahan masyarakat terhadap dinamika sosial-politik Indonesia. Tingginya volume data tweet terkait tagar ini menghadirkan tantangan praktis dalam pengembangan model klasifikasi teks. Kendala utama terletak pada proses pelabelan data untuk supervised learning, di mana pelabelan manual pada dataset berskala besar menjadi tidak efisien dan memakan waktu lama. Penelitian ini bertujuan untuk mengembangkan model klasifikasi teks sekaligus menyelesaikan permasalahan efisiensi pelabelan tersebut melalui pendekatan otomatis. Metode yang diusulkan mengintegrasikan Latent Dirichlet Allocation (LDA) sebagai generator label otomatis (automated labeling) dan Support Vector Machine (SVM) sebagai pengklasifikasi. LDA digunakan untuk mengekstraksi struktur topik tersembunyi yang kemudian dikonversi menjadi label kategori untuk data latih. Hasil eksperimen menunjukkan bahwa LDA berhasil membentuk 6 label topik yang koheren. Model SVM yang dilatih menggunakan data berlabel otomatis ini, melalui optimasi hyperparameter Kernel RBF, mampu mencapai akurasi sebesar 88,05%. Penelitian ini membuktikan bahwa integrasi LDA dan SVM merupakan solusi strategis untuk mengatasi hambatan pelabelan data, memungkinkan pembangunan model klasifikasi yang akurat pada data media sosial berskala besar tanpa memerlukan intervensi manual. Abstract. The #IndonesiaGelap hashtag on the X platform reflects public unrest regarding Indonesia's socio-political dynamics. The high volume of tweets regarding this hastag presents practical challenges in developing text classification models. The primary obstacle lies in the data labeling process for supervised learning, where manual labeling on large-scale datasets is inefficient and time-consuming. This study aims to develop a text classification model while solving the labeling efficiency problem through an automated approach. The proposed method integrates Latent Dirichlet Allocation (LDA) as an automated label generator and Support Vector Machine (SVM) as a classifier. LDA is utilized to extract hidden topic structures, which are then converted into category labels for training data. Experimental results show that LDA successfully formed 6 coherent topic labels. The SVM model trained using this automatically labeled data, through RBF Kernel hyperparameter optimization, achieved an accuracy of 88.05%. This study demonstrates that the integration of LDA and SVM is a strategic solution to overcome data labeling bottlenecks, enabling the construction of accurate classification models on massive social media data without the need for manual intervention.

Copyrights © 2026






Journal Info

Abbrev

jitet

Publisher

Subject

Computer Science & IT

Description

Jurnal Informatika dan Teknik Elektro Terapan (JITET) merupakan jurnal nasional yang dikelola oleh Jurusan Teknik Elektro Fakultas Teknik (FT), Universitas Lampung (Unila), sejak tahun 2013. JITET memuat artikel hasil-hasil penelitian di bidang Informatika dan Teknik Elektro. JITET berkomitmen untuk ...