Penelitian ini bertujuan untuk membandingkan kinerja beberapa algoritma machine learning dalam memprediksi tingkat kesehatan mental dan burnout mahasiswa, yang diklasifikasikan ke dalam tiga kategori, yaitu Low, Medium, dan High. Algoritma yang diuji meliputi Decision Tree, Logistic Regression, Naive Bayes, Support Vector Machine (SVM), dan Random Forest. Evaluasi dilakukan menggunakan metrik Accuracy, Precision, Recall, dan F1-Score pada dataset berjumlah 200.000 data. Hasil penelitian menunjukkan bahwa Logistic Regression memiliki performa terbaik secara keseluruhan dengan nilai akurasi sebesar 0,8720 dan F1-Score sebesar 0,8677, diikuti oleh Random Forest dengan akurasi 0,8708. Decision Tree dan SVM juga menunjukkan performa yang kompetitif dengan akurasi masing-masing sebesar 0,8646 dan 0,8684, sementara Naive Bayes memiliki performa terendah dengan akurasi 0,8503. Namun demikian, seluruh model mengalami kesulitan dalam memprediksi kelas High, yang ditunjukkan oleh nilai recall yang relatif rendah, terutama pada SVM yang gagal mendeteksi kelas tersebut. Hal ini mengindikasikan adanya ketidakseimbangan data yang signifikan, di mana kelas Low mendominasi dataset. Secara keseluruhan, Logistic Regression dan Random Forest dapat direkomendasikan sebagai model terbaik untuk prediksi kesehatan mental mahasiswa dalam studi ini. Namun, diperlukan strategi penanganan data tidak seimbang, seperti resampling atau cost-sensitive learning, untuk meningkatkan performa prediksi pada kelas minoritas, khususnya kategori High.
Copyrights © 2026