Claim Missing Document
Check
Articles

Found 1 Documents
Search

Optimasi Linear Support Vector Machine untuk Deteksi Smishing Multi-Kelas pada Dataset Tidak Seimbang Vannia, Anggun; Muljono
Jurnal Sistem Komputer dan Informatika (JSON) Vol. 7 No. 2 (2025): Desember 2025
Publisher : Universitas Budi Darma

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30865/json.v7i2.9299

Abstract

Serangan smishing (SMS phishing) menghadapi tantangan mendasar dalam deteksi berbasis machine learning akibat ketidakseimbangan distribusi kelas pada dataset dunia nyata, di mana instance kelas minoritas (smishing) justru paling kritis untuk diidentifikasi. Penelitian ini mengusulkan sebuah framework robust yang mengoptimasi Linear Support Vector Machine (SVM) dengan strategi hybrid sampling tiga tingkat untuk klasifikasi multi-kelas pada kondisi data tidak seimbang. Framework yang dikembangkan mengintegrasikan ekstraksi fitur hibrida TF-IDF dan meta-features dengan strategi penanganan ketidakseimbangan data yang komprehensif, yang meliputi Random Oversampling (ROS) untuk kelas minoritas, Random Undersampling (RUS) untuk kelas mayoritas, dan Embedding MixUp untuk augmentasi data level embedding. Optimasi parameter melalui GridSearchCV dengan validasi 5-fold berhasil menentukan konfigurasi optimal SVM Linear (C=0.5). Hasil evaluasi pada test set mendemonstrasikan kemampuan klasifikasi yang tinggi dan seimbang, dengan pencapaian akurasi 96,7% dan F1-macro 87,6%. Kinerja yang konsisten merata pada semua kelas ini tercermin dari recall smishing 84% sambil mempertahankan recall ham 99%. Temuan ini menegaskan bahwa kombinasi Linear SVM dan strategi hybrid sampling  berhasil menghasilkan model deteksi smishing yang robust, seimbang, dan siap diimplementasikan dalam skenario dunia nyata.