Estimasi waktu tempuh atau Estimated Time of Arrival (ETA) memiliki dampak langsung terhadap efisiensi operasional armada transportasi dan kepuasan konsumen. Namun, memprediksi durasi perjalanan di kota metropolitan seperti New York City (NYC) merupakan tantangan kompleks karena dipengaruhi oleh faktor dinamis seperti jarak, waktu, dan pola lalu lintas. Penelitian ini bertujuan untuk membangun dan membandingkan kinerja model machine learning berbasis regresi untuk memprediksi durasi perjalanan taksi NYC. Algoritma yang diuji meliputi Linear Regression, Random Forest, Gradient Boosting, dan XGBoost. Penelitian ini menerapkan tahapan preprocessing data spasial-temporal dan feature engineering yang komprehensif. Hasil eksperimen menunjukkan bahwa model berbasis ensemble dan boosting mengungguli model linear sederhana. Secara khusus, algoritma XGBoost menghasilkan kinerja terbaik dengan tingkat kesalahan prediksi terendah (RMSE dan MAE minimum) dibandingkan model lainnya serta baseline penelitian sebelumnya.
Copyrights © 2026