Algoritma klasifikasi C4.5, CART, k-Nearest Neighbours (k-NN) dan Naive Bayes termasuk dalam “Top 10 algorithms in data miningâ€. Penulis melakukan pengujian dan analisis pada keempatnya untuk mendapatkan urutan peringkat menurut kualitas kinerjanya. Metode yang umum dan cukup memadai untuk membandingkan kualitas kinerja klasifier untuk klasifikasi dua label kelas dengan proporsi jumlah kelas dari dataset yang seimbang adalah dengan menguji kinerja accuracy klasifier. Untuk dataset yang tidak seimbang seperti dalam penelitian ini menggunakan metode ini bisa bias, bahkan bisa menghasilkan kesimpulan yang menyesatkan. Dengan menghitung skor nilai yang merupakan gabungan dari parameter kinerja “accuracyâ€, “precisionâ€, “recall†dan “AUC†dimana nilai tertinggi dari masing-masing parameter adalah yang terbaik akan menghasilkan penilaian kinerja klasifier yang lebih representatif menunjukkan kualitas klasifier. Dilakukan dua metode pengujian yaitu 10-fold Cros Validation dan Pengujian Secara Diskrit untuk memastikan hasil penilaian kinerja yang representatif dari masing-masing klasifier. Penerapan pengujian terhadap empat algoritma klasifikasi diatas dan analisis perbandingan kinerja menghasilkan urutan peringkat kualitas kinerja terbaik yaitu: 1. k-NN, 2. C4.5, 3. CART, 4. Naive Bayes.Kata Kunci: C4.5, CART, k-NN, Naive Bayes, skor
Copyrights © 2020