Peningkatan volume dan kompleksitas data pada era digital menuntut sistem basis data yang efisien dalam penyimpanan, pengolahan, dan eksekusi query. DuckDB merupakan sistem basis data embedded yang dirancang untuk mendukung operasi OLAP secara lokal, namun proses tuning parameter konfigurasinya masih dilakukan secara manual dan kurang efisien. Selain itu, belum ada pedoman khusus mengenai parameter DuckDB yang memiliki pengaruh paling signifikan terhadap performa waktu eksekusi query. Penelitian ini bertujuan untuk mengidentifikasi parameter konfigurasi DuckDB yang paling berpengaruh terhadap waktu eksekusi query serta menerapkan tuning otomatis menggunakan metode Bayesian Optimization. Seleksi parameter dilakukan kepada keseluruhan 127 parameter DuckDB melalui pendekatan rule-based serta perhitungan feature importance berbasis Shapley Additive exPlanations (SHAP) yang menghasilkan dua parameter akhir, yaitu threads dan max_expression_depth. Optimasi nilai parameter dilakukan menggunakan Bayesian Optimization berbasis Gaussian Process dengan fungsi akuisisi Expected Improvement. Hasil pengujian pada tiga kategori workload query (ringan, sedang, berat) menunjukkan signifikansi Bayesian Optimization dalam menurunkan waktu eksekusi sebesar lebih dari 40% antara iterasi pertama dan terbaik dalam batas 50 iterasi. Selain itu, dalam perbandingan dengan nilai parameter default, pada workload sedang dan berat, tuning menghasilkan rata-rata penurunan waktu eksekusi lebih dari 60%. Namun, pada workload ringan, konfigurasi default justru lebih unggul dengan waktu eksekusi rata-rata 10,08% lebih cepat dibanding hasil tuning.
Copyrights © 2025