Prediksi Durasi Perjalanan Taxi NYC Menggunakan Regression Model
Keywords:
prediksi durasi perjalanan, XGBoost, Machine Learning, NYC Taxi, RegresiAbstract
Prediksi durasi perjalanan transportasi urban merupakan aspek penting dalam meningkatkan efisiensi operasional dan kualitas layanan. New York City Yellow Taxi menyediakan dataset perjalanan dalam jumlah besar yang dapat dimanfaatkan untuk membangun model prediksi berbasis machine learning. Penelitian ini mengembangkan sistem prediksi durasi perjalanan menggunakan empat algoritma: Linear Regression, Random Forest, Gradient Boosting, dan XGBoost. Dataset diproses melalui tahap preprocessing, feature engineering, dan pembagian data menjadi training dan testing set. Hasil penelitian menunjukkan bahwa XGBoost memberikan performa terbaik dengan MAE 189,23 detik, RMSE 287,91 detik, dan R² sebesar 0,8657, mengungguli model lainnya. Faktor paling berpengaruh terhadap durasi perjalanan meliputi trip_distance, haversine_distance, dan hour_of_day. Sistem yang dibangun memungkinkan prediksi real-time serta analisis data secara komprehensif. Penelitian ini membuktikan bahwa algoritma tree- based boosting, khususnya XGBoost, efektif digunakan dalam memodelkan dinamika durasi perjalanan taxi di lingkungan urban yang kompleks.
References
Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 785–794.
James, G., Witten, D., Hastie, T., & Tibshirani, R. (2021). An Introduction to Statistical Learning: With Applications in R (2nd ed.). Springer.
Johnson, M., & Lee, S. (2021). Comparative analysis of machine learning models for urban transportation prediction. Journal of Urban Informatics, 8(2), 112–125.
Kumar, A., Kaur, R., & Kumar, M. (2019). A comparative study of machine learning algorithms for travel time prediction in smart transportation systems. Journal of Big Data, 6(1), 1-21.
NYC Taxi & Limousine Commission. (2023). TLC Trip Record Data.
Rahman, M., & Abdullah, S. (2023). Performance comparison of regression algorithms for real- time traffic prediction. Journal of Big Data, 10(1), 24.
Singh, A., & Kaur, R. (2022). Predictive analysis of taxi trip duration using machine learning models. International Journal of Transportation Science and Technology, 11(3), 245–256.
Smith, R., Brown, K., & Davis, L. (2020). Neural network-based taxi trip duration prediction using GPS trajectory features. Transportation Research Part C: Emerging Technologies, 121, 102830.
Utsalina, R. (2017). Analisis performa algoritma machine learning untuk prediksi waktu tempuh kendaraan. Jurnal Teknologi Informasi, 15(2), 89-102.




