Perkembangan ilmu komputer sekarang memungkinkan adanya pencatatan semua proses bisnis di segala bidang dengan media penyimpanan yang besar. Data di bidang atronomi, kesehatan, ekonomi, pemerintahan dan sebagainya banyak tercatat dan semakin banyak dari tahun ke tahun. Data mining merupakan ilmu yang dapat mengolah data menjadi sebuah representasi pengetahuan dengan menggunakan beberapa metode atau algoritma matematis. Salah satu fungsi utama data mining adalah klasifikasi. Dalam proses klasifikasi semua data lama digunakan sebagai data pembelajaran untuk menyimpulkan data baru yang belum sepenuhnya diketahui. Data yang sebelumnya tidak memiliki makna dapat menjadi sebuah pengetahuan baru dengan menggunakan klasifikasi data mining. Banyak algoritma yang dapat digunakan dalam proses klasifikasi. Salah satu algoritma yang terbukti baik untuk proses klasifikasi data berdimensi tinggi adalah naïve bayes. Dalam data berdimensi tinggi banyaknya atribut data dapat mempengaruhi hasil klasifikasi. Banyaknya atribut data yang relevan dapat meningkatkan performa algoritma. Sedangkan banyaknya atribut data yang tidak  relevan dapat menurunkan tingkat akurasi sebuah algoritma. Dari hasil penelitian ini diketahui bahwa seleksi fitur information gain dapat meningkatkan performa klasifikasi naive bayes.
Copyrights © 2019