Algoritma C4.5 merupakan salah satu algoritma yang populer digunakan dalam pengambilan keputusan dan klasifikasi data. Artikel ini mengevaluasi performa algoritma C4.5 dalam berbagai kondisi dataset, termasuk dataset dengan atribut numerik dan kategorikal, dataset dengan missing values, serta dataset yang tidak seimbang. Penelitian ini menggunakan beberapa dataset dari UCI Machine Learning Repository seperti Iris, Adult, Breast Cancer, dan Wine. Proses evaluasi meliputi preprocessing data, pembagian data menjadi set pelatihan dan pengujian, implementasi algoritma C4.5, serta evaluasi performa menggunakan metrik seperti akurasi, presisi, recall, dan F-measure. Hasil penelitian menunjukkan bahwa Algoritma C4.5 mampu memberikan performa yang baik dalam berbagai kondisi dataset, namun performanya dapat dipengaruhi oleh ketidakseimbangan data dan jumlah missing values. Selain itu, penelitian ini juga mengevaluasi pengaruh parameter-parameter seperti nilai minimum gain ratio dan ukuran minimum untuk simpul daun terhadap performa algoritma. Temuan ini memberikan wawasan yang berguna bagi para peneliti dan praktisi dalam mengoptimalkan penggunaan Algoritma C4.5 untuk berbagai aplikasi klasifikasi data.
                        
                        
                        
                        
                            
                                Copyrights © 2024