Komparasi Algoritma Machine Learning Regresi untuk Prediksi Durasi Perjalanan Taksi di New York City
Keywords:
machine learning, regresi, NYC Taxi, XGBoost, feature engineering, travel time predictionAbstract
Estimasi waktu tempuh atau Estimated Time of Arrival (ETA) memiliki dampak langsung terhadap efisiensi operasional armada transportasi dan kepuasan konsumen. Namun, memprediksi durasi perjalanan di kota metropolitan seperti New York City (NYC) merupakan tantangan kompleks karena dipengaruhi oleh faktor dinamis seperti jarak, waktu, dan pola lalu lintas. Penelitian ini bertujuan untuk membangun dan membandingkan kinerja model machine learning berbasis regresi untuk memprediksi durasi perjalanan taksi NYC. Algoritma yang diuji meliputi Linear Regression, Random Forest, Gradient Boosting, dan XGBoost. Penelitian ini menerapkan tahapan preprocessing data spasial-temporal dan feature engineering yang komprehensif. Hasil eksperimen menunjukkan bahwa model berbasis ensemble dan boosting mengungguli model linear sederhana. Secara khusus, algoritma XGBoost menghasilkan kinerja terbaik dengan tingkat kesalahan prediksi terendah (RMSE dan MAE minimum) dibandingkan model lainnya serta baseline penelitian sebelumnya.
References
Chen, X., & Liu, Y. (2020). The Impact of Temporal Features in Travel Time Prediction Models. Journal of Traffic and Transportation Engineering.
Kaggle. (2017). NYC Taxi Trip Duration Dataset. https://www.kaggle.com/c/nyc-taxi-trip-duration
Miller, A., & Zhang, L. (2021). Predicting NYC Taxi Trip Duration using Gradient Boosting and Spatial Features. International Conference on Intelligent Transportation Systems.
Nasrullah, M., et al. (2022). Comparative Analysis of Machine Learning Algorithms for Travel Time Prediction. Transportation Research Part C: Emerging Technologies.
Seleck, T. (2017). New York City Taxi Trip Duration: Complete EDA. Kaggle.
Wang, J. (2024). Spatial-Temporal Modeling for Estimated Time of Arrival (ETA) in Public Transportation. Smart City Review.




