Kanker adalah salah satu penyakit yang sampai saat ini memakan banyak korban jiwa. Tercatat dalam 5 tahun dari data tahun 2012 International Agency for Research of Cancer (IARC) merilis ada lebih dari 14 juta jiwa mengidap penyakit kanker dan 8,2 juta diantaranya meninggal dunia karena kanker yang diderita. Dari data tersebut jenis kanker yang paling banyak diderita adalah kanker payudara yaitu 19,2% dari keseluruhan 14 juta kasus lebih. Pencatatan terkait pasien dan jenis kanker banyak dilakukan di dunia medis. Data tersebut semakin banyak dan hanya akan menjadi sampah apabila tidak dapat digunakan sebagai pengetahuan baru. Data mining merupakan bidang ilmu yang menjawab tantangan banyaknya data. Klasifikasi merupakan bagian dari data mining yang memungkinkan penciptaan informasi dan pengetahuan baru dari data lampau. Salah satu teknik klasifikasi terbaik dan terbukti banyak digunakan adalah naive bayes. Dari penelitian thun 2016 naive bayes memiliki performa yang terbaik untuk klasifikasi penyakit kanker payudara. Dataset yang besar dengan atribut yang banyak tidak menjamin performa algoritma akan lebih baik. Salah satu proses peningkatan performa algoritma adalah dengan melakukan seleksi fitur. Gain ratio merupakan pengembangan dari algoritma information gain yang terbukti handal dan dapat menangani data berdimensi tinggi. Penelitian ini membuktikan bahwa penggunaan algoritma seleksi fitur gain ratio dapat meningkatkan performa naive bayes dalam klasifikasi dataset breast cancer wisconsin. Performa naive bayes tanpa seleksi fitur adalah 92,7% sedangkan setelah dilakukan seleksi fitur menggunakan gain ratio akurasinya naik 4,01% menjadi 96,71%.
Copyrights © 2018