Tingkat putus sekolah di Sekolah Menengah Kejuruan (SMK) merupakan tantangan serius yang mempengaruhi kualitas sumber daya manusia Indonesia. Penelitian ini bertujuan mengembangkan model prediktif untuk mengidentifikasi siswa berisiko putus sekolah di SMK dengan menggunakan data akademik dan sosioekonomik sebanyak 1.690 siswa. Metode penelitian membandingkan empat algoritma klasifikasi (Random Forest, Logistic Regression, SVM, dan XGBoost) dengan penerapan SMOTE untuk mengatasi ketidakseimbangan data. Validasi model dilakukan menggunakan cross-validation 5-fold dan interval kepercayaan 95%. Hasil penelitian menunjukkan bahwa kombinasi Random Forest dan SMOTE menghasilkan performa terbaik dengan akurasi 99,54%, presisi 100%, recall 99,09%, F1-Score 99,54%, dan AUC-ROC 100%. Penerapan SMOTE meningkatkan recall secara signifikan dari 0% menjadi 99,09%, menegaskan efektivitas teknik penyeimbangan data. Model yang dikembangkan ini tidak hanya berfungsi sebagai sistem peringatan dini, tetapi juga memberikan kontribusi ilmiah terhadap bidang educational data mining dengan menunjukkan efektivitas kombinasi Random Forest dan SMOTE dalam konteks data SMK Indonesia yang tidak seimbang, dan secara praktis dapat dijadikan dasar bagi sekolah dalam merancang kebijakan intervensi berbasis data untuk menurunkan angka putus sekolah.
Copyrights © 2025