Kaka Kalam Djati Permana
Unknown Affiliation

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Analisis Komparatif Linear Regression dan Support Vector Regression pada Prediksi Penduduk Kabupaten Sumedang Kaka Kalam Djati Permana; Esa Firmansyah; Beben Sutara
Data Sciences Indonesia (DSI) Vol. 5 No. 2 (2025): Article Research Volume 5 Issue 2, Desember 2025
Publisher : Yayasan Cita Cendikiawan Al Kharizmi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/dsi.v5i2.7423

Abstract

Perencanaan pembangunan daerah yang adaptif di Kabupaten Sumedang sangat bergantung pada ketersediaan data demografi yang presisi sebagai landasan pengambilan kebijakan publik. Namun, upaya pemodelan prediksi menghadapi tantangan teknis yang signifikan akibat karakteristik data historis yang terbatas (small dataset) serta keberadaan gangguan tren (structural break) berupa fluktuasi anomali data pada tahun 2020. Penelitian ini bertujuan untuk mengkomparasikan efektivitas kinerja algoritma Linear Regression sebagai model parametrik dan Support Vector Regression (SVR) berbasis kernel RBF yang dioptimasi menggunakan GridSearchCV sebagai model non-parametrik. Metodologi penelitian menerapkan teknik pra-pemrosesan normalisasi MinMax Scaler untuk mempertahankan struktur asli data yang tidak berdistribusi normal, serta menggunakan skema chronological split untuk validasi temporal yang objektif. Hasil evaluasi empiris menunjukkan bahwa Linear Regression memiliki performa yang jauh lebih unggul dan robust, mencatatkan nilai Root Mean Square Error (RMSE) sebesar 3.858 jiwa dan Koefisien Determinasi () 0,8265. Sebaliknya, meskipun telah melalui proses tuning, SVR mengalami kendala generalisasi atau bias struktural dengan nilai RMSE yang tinggi mencapai 8.810 jiwa, akibat sensitivitas berlebih terhadap pola penurunan data latih sehingga gagal menangkap tren pemulihan (rebound). Berdasarkan model terbaik, diproyeksikan jumlah penduduk akan tumbuh konstan sebesar 7.310 jiwa per tahun hingga mencapai estimasi 1,24 juta jiwa pada akhir tahun 2030. Temuan ini menyimpulkan bahwa pada kasus data terbatas dengan pola tren linier yang kuat, algoritma sederhana terbukti lebih andal dan stabil dibandingkan algoritma kompleks.