Penelitian ini bertujuan untuk mengembangkan sistem rekomendasi destinasi wisata berbasis data demografis menggunakan metode klasifikasi Support Vector Machine (SVM). Sistem dirancang untuk memberikan rekomendasi destinasi yang sesuai dengan karakteristik wisatawan, seperti usia, jenis kelamin, dan status sosial. Dataset yang digunakan terdiri dari sepuluh variabel demografis dan empat belas kategori destinasi wisata. Analisis awal menunjukkan bahwa dataset memiliki ketidakseimbangan kelas yang sangat tinggi, dengan kelas Jatim Park 1 mendominasi lebih dari separuh data sementara banyak kelas lain hanya memiliki 1–6 sampel. Untuk mengurangi dampak ketidakseimbangan ini, dilakukan teknik oversampling pada data training. Model SVM kemudian dilatih menggunakan beberapa kombinasi parameter dan kernel, serta diuji menggunakan metrik akurasi, precision, recall, dan F1-score. Hasil eksperimen menunjukkan bahwa pada data training yang sudah diseimbangkan, performa model meningkat signifikan, ditunjukkan oleh nilai F1-macro pada cross-validation sebesar 0.84. Namun, ketika diuji pada data testing yang mencerminkan kondisi distribusi asli, performa model menurun, dengan akurasi sebesar 54% dan nilai F1-macro yang rendah pada sebagian besar kelas minoritas. Temuan ini menunjukkan bahwa meskipun SVM efektif pada data yang seimbang, performanya masih belum optimal pada dataset rekomendasi wisata yang sangat timpang. Penelitian ini merekomendasikan pengayaan data, terutama untuk kelas-kelas minoritas, serta eksplorasi metode penanganan ketidakseimbangan kelas lainnya pada penelitian lanjutan.
Copyrights © 2025