Prestasi siswa merupakan aspek krusial dalam dunia pendidikan yang dipengaruhi oleh berbagai faktor internal dan eksternal. Namun, memprediksi prestasi siswa dengan akurasi tinggi tetap menjadi tantangan bagi para pendidik dan peneliti. Studi ini bertujuan untuk membangun model prediksi yang mampu mengidentifikasi faktor-faktor utama yang berkontribusi terhadap prestasi siswa menggunakan algoritma regresi linear berganda. Model ini dikembangkan dengan menerapkan pendekatan Cross-Industry Standard Process for Data Mining (CRISP-DM), yang terdiri dari tahapan pemahaman bisnis, pengumpulan data, persiapan data, pemodelan, serta evaluasi. Faktor-faktor yang dianalisis dalam penelitian ini mencakup fasilitas belajar, kebiasaan belajar, partisipasi dalam kursus tambahan, motivasi diri, dan dukungan orang tua. Pengumpulan data dilakukan melalui survei kuesioner kepada 100 siswa Sekolah Menengah Atas (SMA) yang tersebar di beberapa wilayah. Hasil analisis menunjukkan bahwa dukungan orang tua memiliki pengaruh terbesar terhadap prestasi siswa, diikuti oleh motivasi diri, kebiasaan belajar, dan partisipasi dalam kursus tambahan. Namun, evaluasi model regresi menunjukkan nilai R² sebesar -0,34, yang mengindikasikan bahwa model belum optimal dalam menjelaskan variabilitas data target. Temuan ini menunjukkan bahwa regresi linear berganda mungkin bukan metode terbaik untuk prediksi prestasi siswa, dan diperlukan pendekatan yang lebih kompleks seperti machine learning non-linear atau model berbasis AI. Studi ini memberikan wawasan penting bagi pendidik dan pembuat kebijakan dalam memahami faktor utama yang berkontribusi terhadap prestasi siswa. Selain itu, penelitian ini merekomendasikan pengembangan model prediksi yang lebih canggih guna meningkatkan akurasi hasil dan memberikan rekomendasi berbasis data bagi institusi pendidikan.