Deteksi spam pada email merupakan masalah penting dalam bidang keamanan siber dan pengelolaaninformasi. Berbagai algoritma klasifikasi telah dikembangkan untuk mengidentifikasi dan memfilteremail spam secara efektif. Penelitian ini bertujuan untuk menganalisis performa beberapa algoritmaklasifikasi, termasuk Naive Bayes, K-Nearest dan Random Forest, Support Vector Machine dalammendeteksi email spam. Penelitian menggunakan data Enron-Spam, yang berisi email spam dan non-spam (ham) yang telah dikategorikan. Evaluasi dilakukan berdasarkan beberapa metrik performa sepertiF1-score, akurasi, presisi, dan recall. Dengan hasil bahwa tingkat akurasi yang tinggi dengan algoritmaRandom Forest, sedangkan Naive Bayes menunjukkan performa yang lebih baik dalam hal presisi. SVMdan KNN juga menunjukkan hasil yang kompetitif, namun kinerja mereka bervariasi tergantung padaparameter dan konfigurasi yang digunakan. Penelitian ini memberikan wawasan tentang kelebihan dankelemahan masing-masing algoritma dalam konteks deteksi spam, serta rekomendasi untukimplementasi praktis dalam sistem filter email. Dengan memahami karakteristik dan performa dariberbagai algoritma klasifikasi, diharapkan dapat meningkatkan efektivitas sistem deteksi spam danmengurangi jumlah email spam yang diterima oleh pengguna.
Copyrights © 2024