Kecelakaan lalu lintas menjadi penyebab utama kematian bagi kelompok usia 15-29 tahun, dengan lebih dari 1,3 juta kematian setiap tahunnya. di Indonesia, data dari korps lalu lintas polri menunjukkan bahwa pada tahun 2023 terjadi lebih dari 100 ribu kasus kecelakaan, dengan korban jiwa mencapai 25 ribu orang. Penelitian ini bertujuan untuk mengembangkan model klasifikasi tingkat keparahan kecelakaan lalu lintas dengan mengintegrasikan metode Adaptive Synthetic Sampling (ADASYN) dan Forward Selection ke dalam algoritma Random Forest. Data yang digunakan merupakan data kecelakaan dari Polresta Samarinda periode 2020–2024 yang terdiri dari 35 fitur. Proses penelitian mencakup tahapan data preprocessing, feature selection dengan Forward Selection, dan pembagian data testing dan training dengan 10k-fold validation. Permodelan menggunakan algoritma Random Forest, dan evaluasi model menggunakan confusion matrix untuk mencari akurasi, precision, recall, dan f1-score. Hasil penelitian menunjukkan fitur yang paling signifikan terhadap klasifikasi kecelakaan lalu lintas adalah cuaca, jumlah luka ringan, jumlah luka berat, dan jumlah meninggal dunia. Penerapan Random Forest tanpa penanganan ketidakseimbangan dan tanpa seleksi fitur hanya menghasilkan akurasi 79,26%, precision 29,03%, recall 34,62%, dan f1-score 31,58%. Setelah diterapkan ADASYN, metrik evaluasi meningkat signifikan menjadi akurasi 84,26%, precision 81,82%, recall 84,62%, dan f1-score 83,20%. Peningkatan lebih besar tercapai setelah seleksi fitur Forward Selection, menghasilkan akurasi akhir 95,28%, precision 94,23%, recall 96,15%, dan f1-score 95,18%.
Copyrights © 2025