1. 引言
改革开放以来,中国综合国力日益增强,人民物质生活日益丰富,旅游业产值在中国的国民经济总产值中所占的比重逐年提高,旅游业整体上体现出蓬勃发展的态势。当代旅游业的迅猛发展为中国经济迅速发展贡献了一份力量,而入境旅游在中国旅游业中有着重要的地位,入境旅游的收入也是中国重要的外资收入来源之一。然而,2019年新冠肺炎疫情的爆发给中国旅游业的发展造成了巨大的冲击。因此对于外国人入境人数的准确预测,对中国旅游业的发展有重要意义。可以避免资源浪费或者旅游服务差,优化旅游资源配置结构,做好入境旅游的接待工作,促进中国入境旅游的良性发展。故本文选取1990年~2020年的数据,对中国2021年~2025年的外国人的入境人数进行预测,并将2021年和2022年预测值与实际值进行对比,检验模型误差,最后对2023年~2025年的入境旅游人数进行预测。
本文的章节安排如下。第一部分是引言。第二部分是国内外文献综述。第三部分是模型介绍及现状分析,主要介绍了ARIMA模型及其原理,并且分析了中国入境旅游总人数和外国人入境人数的现状和趋势。第四部分是实证分析,对中国外国人入境旅游人数进行预测分析,首先进行了符号说明和数据说明,然后建立ARIMA模型对外国人的入境旅游人数进行预测分析。第五部分是结论。
2. 国内外文献综述
随着经济的高速发展,入境旅游市场的竞争也变得越来越激烈。入境旅游可持续发展的重点是旅游目的地要确保一定数量的游客。自2019年新冠肺炎席卷全球后,中国入境旅游人数呈现直线下降的趋势。国内外针对旅游的研究有很多,而且研究角度和研究方法都各不相同。
根据研究角度的不同,国内外对于入境旅游人数的研究大致可以分为以下两方面:
一方面,学者们对不同省份或者不同国家的入境旅外游人数进行预测。例如,Yoga和Yudiarta (2021)对印度尼西亚著名旅游景点巴厘岛的游客数量进行了预测并分析了新冠肺炎疫情对游客数量的影响 [1] ;Agustinus,Meita和Muhammad (2019)预测了印度尼西亚的外国游客的人数 [2] 。类似的,在国内,刘传意(2022)对江西省的入境旅游市场进行了分析并且作出人数预测 [3] ;郑芷雪(2020)对上海市的入境旅游人数进行比较预测等等 [4] 。国内学者对于不同省份旅游人数的研究较多,而鲜有学者从国家层面来对旅游人数进行预测研究。
另一方面,是入境旅游人数和需求的影响因素的研究。Lee,Olasehinde-Williams和Akadiri (2021)研究了地缘政治对入境旅游需求方面的影响,发现地缘政治风险对旅游的需求产生了负面的影响,而新冠肺炎疫情的大流行进一步加剧了地缘政治危机对旅游需求的负面影响 [5] ;Hanon和Wang (2020)研究了2011年前后叙利亚的政治不稳定(PI)和恐怖主义(TERR)对入境旅游的需求影响,发现旅游需求对政治不稳定更敏感 [6] ;Tica和Kožić (2015)进行了77亿次样本外回归后找到了4个对入境旅游人数影响的因素是波兰的实际GDP和进口以及捷克共和国和斯洛伐克的工资总额 [7] 。在国内,主要是从突发事件或者政策对入境旅游人数影响的角度进行研究。例如,徐雨利等(2022)探讨了“一带一路”倡议对中国沿线重点省份入境旅游效率的影响 [8] ;林玲和李江风(2020)分析COVID-19疫情对中国入境旅游人数的影响 [9] ;孟丰智 (2018)采用对比分析法研究了在中国政府实行“小三通”政策背景下,实施政策前后对入境旅游人数的影响 [10] ;赵永红和李珊(2015)研究了汶川大地震之后,政府所采取一系列的游客赢回策略对于四川省客流量的影响 [11] 。国外大多数学者认为影响入境旅游人数的因素主要可归结为地缘政治、不确定性事件以及GDP这几方面,而国内学者多研究的是政策的颁布和自然灾害对旅游人数的影响。
国内外学者对于旅游人数的研究大致可归结为对于不同国家省份旅游人数的预测和对影响旅游人数因素的研究。这些学者们主要研究某些重大事件例如节假日在不同程度上对入境旅游人数的影响,他们采用的大都是月度数据,研究显示月度数据在事件的发生前后入境人数会有波动,但是这些事件整体对于年度数据的影响很小。
国内外学者们针对入境旅游人数预测所采用的方法也不尽相同。
在国外,学者们所采用的模型与国内学者所采用的模型差别较大。例如,Yuan (2020)采用旅游社交网络,并且开发带有遗传算法的最小二乘支持向量回归,以预测每月游客人数 [12] 。Feng等(2019)基于谷歌趋势数据(网络搜索数据和大数据技术)对外国人的入境旅游人数进行预测,并将随机森林(RF)模型应用于预测,获得了更佳的预测精度 [13] 。Nguyen等(2013)采用三种不同方法即人工神经网络(ANN)、指数平滑和Box-Jenkins方法预测每月前往克罗地亚的入境游客流量。Yoga和Yudiarta (2021)使用偶数灰色预测模型EGM(1,1,α,θ)来预测印度尼西亚著名旅游景点巴厘岛的游客数量 [14] ,并量化了2020年大流行造成的大致经济损失 [1] 。Wu和Cao (2016)结合支持向量回归(SVR)和FOV方法提出了一种新的方法,即SFOASVR来预测月游客流量 [15] 。Jiang等(2020)提出了一种结合模糊时间序列(FTS)和原子搜索优化(ASO)算法的入境旅游需求预测混合预测框架,对入境旅游人数进行预测 [16] 。
在国内,主流的研究方法主要分为以下三类:第一类是采用人工神经网络模型进行预测。王洋(2018),蒋芳和金梅(2016)均采用BP神经网络预测模型分别对成都市和甘肃省的入境旅游人数进行预测分析 [17] [18] ;汪琳(2018)对比使用BP神经网络、RBF神经网络、SVM神经网络、GA-SVM神经网络这四种人工神经网络模型对2017到2019年的入境旅游人数进行预测,结果发现GA-SVM神经网络模型是最优模型 [19] ;汪高元和姚璇(2017)采用单因素神经网络法对安徽市旅游市场的需求方面进行预测和分析 [20] 。第二类是以ARIMA为基础模型进行预测分析。例如,胡涵清等(2020),陈鹏,吴玲和宋徽(2012)均构建了ARIMA模型,并分别对北京和安徽的入境旅游人数进行了预测分析 [21] [22] ;孙颖(2021),李军言和李越(2019)均采用月度数据来建立季节性ARIMA模型对中国入境旅游人数进行预测分析,张庆春等(2014)、黄远敏和庞相宝(2015)也做了类似研究 [23] [24] [25] [26] 。第三类是结合使用多个模型对入境人数进行预测。比如刘传意(2022)结合引力模型和ARIMA模型对江西省的入境旅游市场进行了分析并且对江西的旅游人数进行了预测 [3] ;王洋(2019)通过多种模型组合对成都市的入境旅游人数进行了预测分析 [27] 。除此之外,还有少部分学者采用GM(1,1)模型、Logistic模型、多元统计回归模型、CAR模型等等 [28] [29] [30] [31] 。
国内外学者对于预测入境人数运用了很多种或简单或复杂的方法,部分学者采用神经网络和灰色预测的方法,这些方法对人数的预测有很好的适用性。但是,ARIMA模型只需要内生变量而不需要借助其他外生变量,并且考虑了历史的数据的影响,因此大部分学者偏向于选择时间序列模型来对入境人数进行预测。此外,国外大部分学者在预测入境人数时都采用两种或两种以上的方法,比较研究精确度最终确定误差最小的研究方法。而基本每个学者在采用的多种方法中都包含时间序列ARIMA模型,并与其他方法比较,研究表明ARIMA模型的精确度更高,更适合预测入境人数发展趋势 [2] [32] 。因此,本文选取ARIMA模型,对中国的入境旅游人数进行预测分析。
3. 模型介绍及现状分析
3.1. ARIMA模型介绍
如果样本序列
经单位根检验结果为单整序列,即序列中包含单位根,则表明该序列中包含随机趋势。残差自回归模型仅能提取确定性趋势,无法消除随机趋势。Box和Jenkins提出的ARIMA模型为单整序列建模提供了可行的思路。具体地,
阶单整序列经过
阶差分得到平稳时间序列后,再构建模型,记作
模型。
,其中AR是自回归、MA为移动平均,
分别为自回归项、移动平均项和时间序列成为平稳时所需要做的差分次数。
如果一个时间序列
的
次差分可将其平稳化,用
表示,若
适合于
模型,则原序列
适合的模型为
模型,本文的模型即为后者。
模型的表达式为:
(1)
或
(2)
其中,
,
。
3.2. 中国入境旅游总人数的现状及趋势
1990年以来,中国入境旅游总人数(包含港澳台)的变化趋势如图1所示。从图中可以看出中国入境总人数总体呈上升趋势在2003年、2008~2009年、2012~2014年均出现一定程度的下降。究其原因发现,非典疫情和金融危机导致了入境游客大量减少。外国人入境旅游总人数(不包含港澳台)与中国入境总人数的变动趋势相似,总体上也呈现上升的趋势。但外国人入境游客数量与总入境旅游人数不同的是,外国人入境旅游人数在1998年也出现了小幅下降,下降的可能原因是1997年发生的东南亚金融危机。
4. 中国入境旅游人数预测分析
4.1. 符号说明及数据来源
本文当中所使用的符号说明如表1所示。本文的数据来源于国家统计局官网,2020年的数据来源于《中国入境旅游发展报告2021》。

Figure 1. Trend chart of the number of inbound tourists in China
图1. 中国入境旅游人数趋势图
4.2. 序列的平稳化检验
本文首先利用R软件对中国的外国人入境总人数(不包含港澳台同胞)进行预测分析。图2中的第一幅图是中国1990年~2020年入境人数的时序图,序列呈现明显上升趋势,通过时序图可初步判断序列
为非平稳序列。因此,对序列
进行差分,图2中的第二幅图是对序列
进行一阶差分后的
时序图。然后对序列
进行ADF检验和纯随机性检验,检验发现
序列为非平稳序列,检验结果如表2所示。故继续进行二阶差分。序列
的时序图和检验结果如图2中第三幅图和表2所示,结果显示
为平稳非白噪声序列。

Table 2. ADF test and pure randomness test results
表2. ADF检验和纯随机性检验结果
4.3. 模型识别与参数估计
本文通过利用R软件对
序列的自相关系数和偏相关系数进行计算,计算结果如图3所示。并根据自相关图和偏自相关图对模型进行定阶,初步选择三个模型进行估计,参数估计结果如表3所示。

Figure 3. Autocorrelation coefficient and partial autocorrelation coefficient graph
图3. 自相关系数和偏自相关系数图
4.4. 模型检验
为确定该模型可用,分别对拟合模型进行参数显著性检验和模型显著性检验。如图4,图5,图6所示,由于三个模型参数的估计值都大于它的2倍标准差,所以参数显著非零。其次,残差序列的白噪声检验结果显著,表示残差中不存在有用信息。因此,这三个模型显著成立。

Figure 4. Model ARIMA(1,2,0) verification results
图4. ARIMA(1,2,0)模型检验结果

Figure 5. Model ARIMA(1,2,1) verification results
图5. ARIMA(1,2,1)模型检验结果

Figure 6. Model ARIMA(1,2,0) verification results
图6. ARIMA(1,2,0)模型检验结果
由于序列
具有明显的波动聚集的特性,因此还需进一步检验其异方差性。对上述模型进行异方差的LM检验,检验结果如下表4所示。该检验结果表明,不拒绝模型的残差序列不存在异方差的原假设,进而表明序列
不具有异方差性。

Table 4. Heteroscedasticity test results
表4. 异方差性检验结果
4.5. 模型预测
根据AIC准则,最终确定当
,
,
时为最优模型。据此,建立模型ARIMA(0,2,1)。根据模型的参数估计可以得到以下方程:
(3)
如图7所示,利用该模型进行3期预测,并绘制拟合与预测效果图。本文通过模型预测在2021年中国的外国人入境人口总数将达到2406~3211万人次,在2022年将达到2315~3472万人次。根据中国旅游研究院(文化和旅游部数据中心)的预测,2021年全年,中国将接待入境游客3198万人次。国旅游研究院发布《中国入境旅游发展年度报告(2022—2023)》,结合全球国际旅游加速恢复背景,全面评估了入境旅游市场运行、旅游业数字化转型和城市的国际旅游影响力。报告表明,伴随着入境旅游复苏和回暖的政策窗口逐步打开,2022年入境旅游接待规模将超过2000万人次,有序恢复将是未来入境旅游发展的主基调。与本文对2021年和2022年的预测区间相符。模型预测结果良好,本研究预测中国的入境旅游人数在2023年可能达到2259~3698万人次之间,在2024年将达到3064万人次,在2025年达到3149万人次。详细预测结果及预测区间如表5所示。
5. 结论与建议
中国国际影响力逐年扩大,综合国力不断增强,旅游业的产值在中国的国民经济总产值中的比重不断提高。旅游业整体上体现出蓬勃发展的态势,每年吸引了大量外国游客来中国参观游玩。但是,新冠肺炎疫情的爆发对外国人入境旅游人数造成了极大的影响。本文利用R软件以1990年~2020年为样本时期,构建ARIMA(0,2,1)模型对中国2021年~2025年外国人入境旅游人数进行了预测得出以下结论:
第一,1990年以来,中国的外国人入境旅游人数的变化趋势总体呈上升趋势。但是由于1998年东南亚发生的金融危机、2003年发生的非典疫情、2008年发生的次贷危机都对中国的入境旅游人数产生了影响,均使得在入境人数一定程度上出现了小幅下降。
第二,通过分析建立了ARIMA(0,2,1)模型对中国2021~2025年的入境人数进行预测。通过预测结果得知,预测在2021年中国的外国人入境人口总数将达到2809万人次,在2022年将达到2894万人次,在2023年达到2979万人次,在2024年将达到3064万人次,在2025年达到3149万人次。
第三,新冠肺炎疫情的全球大爆发给中国旅游业造成了巨大的损失。当前国外的疫情形势依然很严峻,中国旅游业更应注重国内旅游业的发展,可以大力推广“周边游”、“微旅游”、做好自驾游专业服务,降低新冠肺炎对中国旅游业的影响。
致谢
衷心感谢老师和同学在本文创作过程中的悉心指导和帮助。从本次论文的选题到数据的搜集,从模型的建立到结果的解释,在每个过程中给予了我非常大的指导与帮助。再次衷心感谢每一位老师和同学在此次创作过程中对我的认真帮助!