Journal of Informatics and Interactive Technology (JIITE)
Vol. 3 No. 1 (2026): April

Feature Fusion TF-IDF dan Analisis URL untuk Deteksi Phishing Lintas Domain dengan LinearSVC

Aurelya, Gemara (Unknown)
Sahputra, Ridho Rian (Unknown)
Pratama, Hanrifki (Unknown)
Nur Rahma Keysha Maharani (Unknown)
Setiaputri, Indah Adi (Unknown)
Saputra, Mohammad Rizki Dwi (Unknown)



Article Info

Publish Date
30 Apr 2026

Abstract

Meningkatnya serangan phishing melalui email menuntut sistem deteksi otomatis yang tidak hanya akurat, tetapi juga mampu beradaptasi terhadap perbedaan karakteristik data antar domain. Meskipun berbagai pendekatan berbasis machine learning telah menunjukkan performa tinggi, sebagian besar penelitian masih berfokus pada penggunaan satu jenis fitur dan evaluasi dalam satu domain, sehingga kemampuan generalisasi model pada data nyata yang heterogen belum teruji secara komprehensif. Penelitian ini bertujuan untuk mengatasi keterbatasan tersebut dengan mengusulkan pendekatan deteksi email phishing yang lebih menyeluruh melalui integrasi fitur tekstual dan struktural serta evaluasi lintas domain. Metode yang diusulkan mengombinasikan fitur tekstual dari badan email yang diekstraksi menggunakan Term Frequency–Inverse Document Frequency (TF-IDF) dan fitur struktural URL dalam skema feature fusion, dengan proses klasifikasi menggunakan algoritma Linear Support Vector Classifier (LinearSVC) yang efisien untuk data berdimensi tinggi dan bersifat sparse. Dataset SpamAssassin digunakan sebagai data pelatihan dan evaluasi internal, sedangkan dataset Enron digunakan untuk evaluasi lintas domain guna mengukur ketahanan model terhadap domain bias. Hasil evaluasi internal menunjukkan bahwa model mencapai akurasi sebesar 98,84% dengan nilai F1-score makro 97,75%, sementara pada evaluasi lintas domain model mempertahankan kemampuan deteksi email legitimate dengan nilai recall sebesar 93,62% meskipun terjadi penurunan kinerja akibat perbedaan distribusi data. Temuan ini menunjukkan bahwa pendekatan feature fusion lebih tangguh dibandingkan penggunaan fitur tunggal dan efektif sebagai baseline deteksi phishing lintas domain, serta berpotensi dikembangkan lebih lanjut melalui strategi adaptasi domain untuk meningkatkan ketahanan model pada lingkungan nyata.

Copyrights © 2026






Journal Info

Abbrev

jiite

Publisher

Subject

Computer Science & IT Control & Systems Engineering Electrical & Electronics Engineering Engineering Languange, Linguistic, Communication & Media

Description

The Journal of Informatics and Interactive Technology aims to provide a platform for the exchange of knowledge and innovation in the field of computer science, human-computer interaction, data analysis, artificial intelligence, information systems, computer engineering, and emerging technologies. ...