Claim Missing Document
Check
Articles

Found 1 Documents
Search

DETEKSI EMAIL SPAM DENGAN CONTINUOUS BAG-OF-WORDS DAN RANDOM FOREST Michiavelly Rustam; Agung Brotokuncoro; Rusdianto Roestam
Scientica: Jurnal Ilmiah Sains dan Teknologi Vol. 2 No. 4 (2024): Scientica: Jurnal Ilmiah Sains dan Teknologi
Publisher : Komunitas Menulis dan Meneliti (Kolibi)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.572349/scientica.v2i4.1260

Abstract

Email Spam merupakan ancaman dunia maya yang signifikan, karena penipu menggunakan berbagai taktik untuk mengelabuhi individu agar membocorkan informasi sensitif atau mengunduh konten berbahaya. Misalnya, pada bulan Juni 2023, Indonesia menghadapi sekitar 6,51 ribu serangan Spam, yang menunjukkan luasnya permasalahan ini. Serangan-serangan ini sering kali melibatkan strategi penipuan, seperti peniruan identitas atau janji hadiah palsu, untuk menjerat korban yang tidak menaruh curiga. Mengalah pada Spam dapat mengakibatkan kerugian finansial dan dampak buruk lainnya. Untuk mengatasi masalah ini, Penelitian ini mengatasi masalah mendesak ini dengan berfokus pada klasifikasi konten email untuk mendeteksi upaya Phishing. Solusi yang diusulkan memanfaatkan platform runtime seperti Google Colab dan menggunakan analisis Continuous Bag of Words (CBOW) dan metode Random Forest. CBOW dipilih karena efektivitasnya dalam menangkap hubungan semantik antar kata, sehingga memungkinkan model mengekstrak fitur bermakna dari konten email. Random Forest, di sisi lain, dipilih karena kemampuannya menangani kumpulan data tidak seimbang yang biasa ditemui dalam tugas klasifikasi email, memastikan representasi yang adil dari email Spam dan Ham selama pelatihan model. Dengan menggabungkan kedua teknik ini, kami bertujuan untuk mengembangkan model klasifikasi yang kuat yang mampu membedakan secara akurat antara email Phishing (Spam) dan email sah (Ham), sehingga meningkatkan langkah keamanan email. Melalui pendekatan kami, kami bertujuan untuk mengklasifikasikan kumpulan data SpamAssassin ke dalam kategori Ham atau Spam, dengan tingkat presisi yang diharapkan sebesar 0,98, yang menunjukkan efektivitas model dalam mengidentifikasi email Phishing secara akurat.