Sistem manajemen E-learning merupakan bentuk kemajuan teknologi dalam bidang pendidikan dan telah banyak menghasilkan kumpulan data-data pendidikan yang salah satunya adalah data aktivitas pembelajaran siswa dalam sistem manajemen E-learning. Banyaknya data pendidikan yang belum tereksplorasi dengan baik dapat di manfaatkan dengan menggunakan teknik data mining. Pada penelitian ini akan dilakukan perbandingan 3 model data berbeda yaitu data awal tanpa preprocessing dan data yang di preprocessing menggunakan seleksi fitur correlation-based feature selection dan Information Gain. Data yang digunakan adalah data aktivitas pembelajaran siswa dalam sistem manajemen E-learning. Selanjutnya proses pengujian data dengan menggunakan 10 folds cross validation dengan metode C4.5 dan evaluasi data menggunakan confusion matrix. Hasil dari pengujian data menggunakan algoritma C4.5 yang dikombinasikan dengan seleksi fitur correlation-based feature selection menghasilkan nilai akurasi yang lebih tinggi dengan nilai akurasi sebesar 76.92%. Sementara itu hasil dari pengujian data awal tanpa selesksi fitur dan data yang di seleksi fitur menggunakan information gain memiliki nilai akrasi yang sama dengan nilai akurasi sebesar 76.19%. Hal ini dikarenakan data yang diproses menggunakan algoritma C4.5 tanpa preprocessing dan data yang telah di preprocessing menggunakan information gain sama-sama menghitung nilai gain untuk membuat model pohon keputusan, dan menghasilkan model pohon keputusan yang sama. Sehingga hasil dari proses pengujian data memiliki nilai akurasi yang sama.
                        
                        
                        
                        
                            
                                Copyrights © 2018