Journal of Intelligent Systems
Vol 1, No 2 (2015)

Penanganan Fitur Kontinyu dengan Feature Discretization Berbasis Expectation Maximization Clustering untuk Klasifikasi Spam Email Menggunakan Algoritma ID3

Safuan, . ( Universitas Dian Nuswantoro)
Wahono, Romi Satria ( Universitas Dian Nuswantoro)
Supriyanto, Catur ( Universitas Dian Nuswantoro)



Article Info

Publish Date
29 Dec 2015

Abstract

Pemanfaatan jaringan internet saat ini berkembang begitu pesatnya, salah satunya adalah pengiriman surat elektronik atau email. Akhir-akhir ini ramai diperbincangkan adanya spam email. Spam email adalah email yang tidak diminta dan tidak diinginkan dari orang asing yang dikirim dalam jumlah besar ke mailing list, biasanya beberapa dengan sifat komersial. Adanya spam ini mengurangi produktivitas karyawan karena harus meluangkan waktu untuk menghapus pesan spam. Untuk mengatasi permasalahan tersebut dibutuhkan sebuah filter email yang akan mendeteksi keberadaan spam sehingga tidak dimunculkan pada inbox mail. Banyak peneliti yang mencoba untuk membuat filter email dengan berbagai macam metode, tetapi belum ada yang menghasilkan akurasi maksimal. Pada penelitian ini akan dilakukan klasifikasi dengan menggunakan algoritma Decision Tree Iterative Dicotomizer 3 (ID3) karena ID3 merupakan algoritma yang paling banyak digunakan di pohon keputusan, terkenal dengan kecepatan tinggi dalam klasifikasi, kemampuan belajar yang kuat dan konstruksi mudah. Tetapi ID3 tidak dapat menangani fitur kontinyu sehingga proses klasifikasi tidak bisa dilakukan. Pada penelitian ini,  feature discretization berbasis Expectation Maximization (EM) Clustering digunakan  untuk merubah fitur kontinyu menjadi fitur diskrit, sehingga proses klasifikasi spam email bisa dilakukan. Hasil eksperimen menunjukkan ID3 dapat melakukan klasifikasi spam email dengan akurasi 91,96% jika menggunakan data training 90%. Terjadi peningkatan sebesar 28,05% dibandingkan dengan klasifikasi ID3 menggunakan binning.

Copyrights © 2015






Journal Info

Abbrev

JIS

Publisher

Subject

Computer Science & IT

Description

Journal of Intelligent Systems adalah jurnal ilmiah berkala yang memuat hasil penelitian pada bidang komputasi dan sistem cerdas dari aspek teori, praktis maupun aplikasi. Jurnal ini akan mempublikasikan makalah orisinal baik makalah technical maupun makalah survei atau review perkembangan terakhir ...