Abstrak. Penelitian ini bertujuan untuk meningkatkan model prediksi kelulusan santri Tahfidz di Pondok Pesantren Al-Kautsar dengan menerapkan algoritma Random Forest , yang dikenal memiliki kemampuan menangani data kompleks dan menghasilkan prediksi yang lebih akurat dibandingkan metode tradisional. Dengan algoritma Random Forest, penelitian ini berusaha mengeksplorasi keunggulan dalam memberikan prediksi yang lebih baik. Penelitian ini melibatkan beberapa tahapan penting, dimulai dari pengumpulan data santri yang berjumlah 300 dengan mencakup beberapa atribut, seperti jumlah hafalan, tingkat kehadiran, nilai ujian, dan status izin sebagai target prediksi. Hasil penelitian menunjukkan bahwa algoritma Random Forest secara signifikan lebih unggul dibandingkan regresi linier dalam memprediksi kelulusan santri. Random Forest menghasilkan akurasi sebesar 99,64% , presisi 100,00% , dan recall 98,80% , sementara regresi linier hanya mencapai akurasi sebesar 77% . Analisis mendalam menunjukkan bahwa atribut jumlah hafalan dan tingkat kehadiran memiliki pengaruh terbesar terhadap prediksi kelulusan, diikuti oleh nilai ujian. Hal ini menegaskan bahwa faktor nonakademik seperti hafalan dan kehadiran mempunyai peranan penting dalam keberhasilan santri. Keunggulan algoritma Random Forest terletak pada kemampuannya menggabungkan prediksi dari banyak pohon keputusan, sehingga menghasilkan model yang lebih stabil dan tahan terhadap noise dalam data. Selain itu, algoritma ini dapat menangani data dengan kombinasi variabel numerik dan kategorikal tanpa perlu transformasi yang signifikan, menjadikannya cocok untuk dataset dunia nyata yang seringkali tidak sempurna. Abstrak. Penelitian ini bertujuan untuk memperbaiki model prediksi izin santri tahfidz di Pondok Pesantren Al-Kautsar dengan menerapkan algoritma Random Forest yang diketahui memiliki kemampuan dalam menangani data yang kompleks dan menghasilkan prediksi yang lebih akurat dibandingkan metode tradisional. Dengan algoritma Random Forest, penelitian ini berupaya untuk mengeksplorasi kelebihan dalam memberikan prediksi yang lebih baik. Penelitian ini melibatkan beberapa tahapan penting, dimulai dari pengumpulan data santri sebanyak 300 data yang mencakup beberapa atribut, seperti jumlah hafalan, tingkat kehadiran, nilai ujian, dan status izin sebagai target prediksi. Hasil penelitian menunjukkan bahwa algoritma Random Forest secara signifikan lebih unggul dibandingkan regresi linier dalam memprediksi kelulusan santri. Random Forest menghasilkan akurasi sebesar 99,64%, presisi sebesar 100,00%, dan recall sebesar 98,80%, sedangkan regresi linier hanya mencapai akurasi sebesar 77%. Analisis mendalam menunjukkan bahwa atribut hafalan dan tingkat kehadiran memiliki pengaruh paling besar dalam memprediksi penerimaan, diikuti oleh nilai ujian. Hal ini menegaskan bahwa faktor non akademis seperti hafalan dan kehadiran memiliki peran penting dalam keberhasilan siswa. Keunggulan algoritma Random Forest terletak pada kemampuannya menggabungkan prediksi dari banyak pohon keputusan, sehingga menghasilkan model yang lebih stabil dan tahan terhadap noise dalam data. Selain itu, algoritma ini dapat menangani data dengan kombinasi variabel numerik dan kategoris tanpa memerlukan transformasi yang signifikan, sehingga cocok untuk dataset dunia nyata yang seringkali tidak sempurna.
Copyrights © 2025