Data mining merupakan proses semi automatis yang menggunakan teknik statistik, matematika, keceradan buatan dan machine learning untuk mengekstraksi dan mengidentifikasi informasi pengetahuan yang potensial dan bermanfaat yang tersimpan dalam database. Klasi kasi dengan pohon keputusan merupakan salah satu teknik data mining. Pohon keputusan adalah struktur flowchart yang menyerupai tree (pohon), dimana setiap node internal menandakan suatu tes pada atribut dan setiap cabang merepresentasikan hasil tes, dan node daun merepresentasikan kelas-kelas. Alur pada pohon keputusan ditelusuri dari node akar ke node daun yang memegang prediksi kelas. Pohon keputusan terdiri dari node yang membentuk pohon yang berakar, semua node memiliki satu masukan. Node yang keluar disebut node tes. Node yang lain disebut node keputusan atau sering disebut node daun. Setiap node internal membagi dua atau lebih sub-ruang sesuai dengan kategori atribut dan akan dipartisi sesuai dengan nilai kategori kasus. Kasus-kasus tersebut membentuk pohon keputusan, yang menghasilkan problem solving. Dalam menentukan pohon keputusan ada beberapa algoritme salah satunya adalah algoritme C5.0. Pohon keputusan berbasis algoritme C5.0 merupakan penyempurnaan dari algoritme ID3 dan C4.5. Algortime C5.0 dapat menangani atribut kontinu dan diskrit yang tidak dapat ditangani oleh algoritme ID3. Pada penelitian dilakukan kajian klasifikasi dengan pohon keputusan berbasis algoritme C5.0.
Copyrights © 2020