Data akademik sangat dibutuhkan sebagai bahan evaluasi, pengolahan data akademik siswa secara sistematis diperlukan untuk mendukung identifikasi tingkat prestasi secara lebih objektif. Dalam penelitian ini masalah yang ditemukan adalah belum optimalnya pemanfaatan data nilai akademik sebagai dasar klasifikasi prestasi siswa dengan menerapkan algoritma C4.5 dengan data set sebanyak 507 data dan 11 atribut. Metode yang digunakan meliputi preprocessing data, perhitungan entropy, information gain, split information, gain ratio, pembentukan pohon keputusan, serta evaluasi model dengan pembagian data 80:20 secara stratified dan validasi silang 5-fold. Hasil penelitian menunjukkan bahwa atribut IPA menjadi pemisah awal terbaik dengan nilai entropy 1,5108, information gain 0,0742, dan gain ratio 0,0524. Model yang dihasilkan memperoleh akurasi pengujian sebesar 56,86% dan rerata akurasi validasi silang sebesar 55,42%.
Copyrights © 2026