Fitra Salam S. Nagalay
Fakultas Sains dan Teknologi, Universitas Wira Buana, Lampung, Indonesia

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Analisis Komparatif Kinerja Algoritma Naive Bayes dengan dan tanpa Seleksi Fitur Chi-Square untuk Deteksi Spam Email Fitra Salam S. Nagalay; Desi Rahma Aryanti; Fathurrahman Kurniawan Ikhsan
Coding: Journal of Computing and Software Engineering Vol. 1 No. 2: DESEMBER 2025
Publisher : Coding: Journal of Computing and Software Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.25181/coding.v1i2.4572

Abstract

Email telah menjadi alat komunikasi vital, namun efektivitasnya terdegradasi oleh volume spam yang tinggi. Algoritma Naive Bayes (NB) adalah metode machine learning yang populer untuk klasifikasi spam. Namun, kinerja NB dapat dipengaruhi oleh tingginya dimensi data (jumlah fitur kata yang sangat banyak). Penelitian ini bertujuan untuk menganalisis dampak seleksi fitur Chi-Square  terhadap kinerja Naive Bayes. Metode penelitian ini adalah analisis komparatif antara dua model: (A) Naive Bayes standar, dan (B) Naive Bayes dengan seleksi fitur Chi-Square. Kedua model menggunakan vektorisasi TF-IDF pada dataset Enron yang berisi 33.716 email. Model A menggunakan 5.000 fitur, sedangkan Model B direduksi menjadi 1.000 fitur terbaik hasil seleksi . Hasil penelitian menunjukkan bahwa Model A (tanpa ) telah mencapai akurasi sangat tinggi sebesar 98,1%. Model B (dengan  mampu mencapai akurasi yang hampir identik sebesar 98,0%, dengan nilai presisi dan recall yang juga serupa. Kesimpulan dari penelitian ini adalah penerapan Chi-Square pada kasus ini tidak meningkatkan akurasi (karena model dasar sudah mencapai kinerja puncak), namun terbukti sangat efektif dalam mereduksi dimensi fitur sebesar 80% (dari 5.000 menjadi 1.000 fitur) sambil tetap mempertahankan kinerja model. Hal ini menunjukkan bahwa kombinasi NB+  menghasilkan model yang jauh lebih efisien secara komputasi.