Kecelakaan lalu lintas merupakan permasalahan signifikan di Indonesia, dengan dampak fatal dan kerugian ekonomi yang besar. Penelitian ini bertujuan untuk menerapkan algoritma K-means untuk mengelompokkan data kecelakaan lalu lintas dengan menggunakan seleksi fitur. Data kecelakaan lalu lintas yang digunakan diperoleh dari sebuah perusahaan asuransi kecelakaan di Sidoarjo dan diproses untuk menghasilkan fitur-fitur yang relevan. Proses seleksi fitur dilakukan untuk menentukan fitur-fitur yang memiliki kepentingan dan informasi yang paling relevan dalam proses pengelompokkan. Metode seleksi fitur yang digunakan dalam penelitian ini adalah seleksi fitur Chi-Square, yang bertujuan untuk memilih fitur-fitur yang memiliki hubungan signifikan dengan variabel target kecelakaan. Hasil penelitian menunjukkan bahwa data terbagi menjadi 2 cluster dengan seleksi fitur maupun tanpa seleksi fitur, yaitu wilayah dengan tingkat kecelakaan tinggi dan rendah. Nilai koefisien sillhouette cluster sebelum dilakukan seleksi fitur adalah sebesar 0,57. Sedangkan setelah diterapkan seleksi fitur dengan Chi-Square, diperoleh hasil yang lebih baik yaitu sebesar 0,72. Penelitian ini menunjukkan bahwa dengan menerapkan metode seleksi fitur dapat meningkatkan performa pengelompokkan data kecelakaan lalu lintas dengan algoritma K-means.
Copyrights © 2025