基于数字足迹与深度学习的城市旅游流量预测
Urban Tourism Flow Forecasting Based on Digital Footprints and Deep Learning
摘要: 随着智慧旅游的发展,如何实现对城市旅游流量的精准预测成为热点课题。本研究以杭州市为案例,结合2021~2024年百度指数关键词搜索数据与过夜旅客量数据,构建了一套基于数字足迹与深度学习的旅游预测体系。通过Spearman相关系数与随机森林算法,对关键词进行筛选与排序,选出8个与游客量高度相关的搜索词。在此基础上,构建BP神经网络与多特征LSTM神经网络模型,分别对游客量进行预测,并与传统ARIMA模型进行对比分析。研究结果显示,LSTM模型在拟合精度与波动趋势捕捉方面表现最优,MAPE最低为0.099,优于其他模型,验证了融合数字搜索数据与深度学习算法的有效性。研究为智慧旅游背景下的游客行为理解与资源调度优化提供了方法参考与实践支撑。
Abstract: With the advancement of smart tourism, accurate forecasting of urban tourist flows has become a critical research topic. This study takes Hangzhou as a case city and constructs a tourism flow prediction framework based on digital footprints and deep learning by integrating Baidu Index keyword search data and overnight tourist volume data from 2021 to 2024. Using Spearman correlation analysis and random forest algorithms, eight keywords most closely related to tourist volume were selected. Based on these, a BP neural network and a multi-feature LSTM neural network model were developed to predict tourist flows, and their performance was compared with a traditional ARIMA model. Results show that the LSTM model achieved the best performance in terms of fitting accuracy and trend capturing, with the lowest MAPE of 0.099, outperforming the other models. This study demonstrates the effectiveness of integrating digital search data and deep learning algorithms, and provides methodological and practical support for understanding tourist behavior and optimizing resource allocation under the smart tourism paradigm.
文章引用:潘嘉贝, 朱莹, 莫书迪. 基于数字足迹与深度学习的城市旅游流量预测[J]. 建模与仿真, 2025, 14(6): 304-318. https://doi.org/10.12677/mos.2025.146499

参考文献

[1] 刘洋. 旅游流时空分布特征及调控研究——以桂林为例[D]: [硕士学位论文]. 南宁: 广西大学, 2016.
[2] 李云飞. 基于ARIMA和LSTM神经网络对中国入境游客规模预测的比较研究[J]. 社会科学前沿, 2019, 8(7): 1291-1298.
[3] He, K., Ji, L., Wu, C.W.D. and Tso, K.F.G. (2021) Using SARIMA-CNN-LSTM Approach to Forecast Daily Tourism Demand. Journal of Hospitality and Tourism Management, 49, 25-33. [Google Scholar] [CrossRef
[4] 王雷雪. 基于机器学习的旅游需求量预测研究[D]: [硕士学位论文]. 西安: 西安石油大学, 2021.
[5] 邹红梅, 朱成涛. 基于LSTM和BP神经网络的水库入库径流中长期预测比较研究[J/OL]. 水文: 1-8. 20230413, 2024-05-14.[CrossRef
[6] 陈尚林. 基于LSTM神经网络和百度指数的新能源汽车销量预测[D]: [硕士学位论文]. 武汉: 湖北大学, 2024.
[7] 李山, 邱荣旭, 陈玲. 基于百度指数的旅游景区络空间关注度: 时间分布及其前兆效应[J]. 地理与地理信息科学, 2008(6): 102-107.
[8] 任乐, 崔东佳. 基于网络搜索数据的国内旅游客流量预测研究——以北京市国内旅游客流量为例[J]. 经济问题探索, 2014(4): 67-73.
[9] 谢天保, 赵萌. 基于网络搜索数据的游客量组合预测模型[J]. 计算机系统应用, 2018, 27(7): 199-204.
[10] 孟思聪, 马晓冬. 基于百度指数的连云港旅游网络关注度研究[J]. 旅游论坛, 2017, 10(5): 102-115.
[11] 戴贵洋, 綦秀利, 余晓晗. 融合人类知识的随机森林特征选择方法研究[J]. 计算机技术与发展, 2022, 32(7): 155-160.