Data mining merupakan sebuah proses untuk menganalisa sebuah kasus untuk menemukan performa terbaik dari algoritma yang diuji. Salah satu cara untuk mendapatkan informasi atau pola dari kumpulan data yang besar adalah dengan menggunakan teknik-teknik dalam data mining. Ada banyak metode klasifikasi yang di gunakan untuk menghasilkan nilai akurasi yang akurat. Terdapat 5 algoritma klasifikasi yang digunakan dalam mengklasifikasi dataset blogger yaitu decision tree, Naïve bayes, k-nearest neighbour, ID3, dan CHAID. Dataset menggunakan data blogger dari UCI Machine Learning Repository.Blog adalah media yang bergantung pada teknologi informasi dan kemajuan teknologi. Penelitian ini diuji Dengan menggunakan validasi 10-fold cross validation dan uji t-test. Sehingga hasil tertinggi dari nilai akurasi yang didapat adalah sebesar 85.00% untuk algoritma KNN. Sedangkan untuk nilai AUC algoritma CHAID yang memiliki hasil tertinggi yaitu sebesar 0.758. dan dari asil uji t-test yang dilakukan bahwa algoritma ID3,CHAID dan Naive Bayes merupakan algoritma dengan performa terbaik yang diterapkan pada dataset blogger. Sedangkan untuk algoritma KNN dan C45 merupakan algoritma dengan performa yang kurang baik dengan nilai AUC 0,500%.Kata Kunci: Data Mining, Algoritma, Klasifikasi, Dataset Blogger
Copyrights © 2018