我国快递业务收入的时间序列分析——基于ARIMA模型
Time Series Analysis of China’s Express Business Revenue—Based on ARIMA Model
DOI: 10.12677/ECL.2024.131056, PDF, HTML, XML, 下载: 34  浏览: 121 
作者: 韩薇薇:上海工程技术大学管理学院,上海
关键词: 快递业务收入时间序列分析ARIMA模型Express Business Revenue Time Series Analysis ARIMA Model
摘要: 本研究选取2008年1月~2023年11月全国快递业务收入的月度数据为样本,采用时间序列检验方法对其进行了相关分析,然后根据数据特征建立了ARIMA乘法模型来拟合此时间序列。接着,我们用拟合模型来预测2022年3月和4月的全国快递业务收入,通过分析2022年3月和2022年4月全国快递业务收入预测值和真实值的差值,得出突发事件对我国快递行业有着短期负向冲击作用的结论。其次,我们用2008年~2019年的数据对2020年的全国快递业务收入做了预测并且分析预测值和实际值之间的差距以判断2020年初突发事件对全国快递业务收入的影响。最后,我们用2008年~2022年的数据对2023年的数据做出预测,对比实际值和预测值的差距我们发现:快递收入很快恢复至突发事件发生之前水平并有所增长。这对于电商快递行业在遭遇不可抗力因素导致的业务影响时,如何在抵抗短期负面影响的同时也兼顾到未来长期发展具有一定的借鉴意义。
Abstract: In this study, we selected the monthly data of national express delivery business revenue from January 2008 to November 2023 as a sample, used the time series test method to analyse its correlation, and then built an ARIMA multiplication model based on the data characteristics to fit this time series. Then, we use the fitted model to predict the national express business revenue in March and April 2022, by analysing the difference between the predicted value and the real value of the national express business revenue in March 2022 and April 2022, we conclude that emergencies have a short-term negative impact on China’s express industry. Secondly, we use the data from 2008~2019 to forecast the national express business revenue in 2020 and analyse the difference between the forecast value and the actual value to judge the impact of the unexpected events on the national express business revenue in early 2020. Finally, we use the data from 2008~2022 to make a forecast for 2023, and compare the difference between the actual value and the forecast value, we find that the express delivery revenue quickly returns to the previous level and grows. This is of some significance to the e-commerce express industry in the event of force majeure factors caused by the business impact, how to resist the short-term negative impact while also taking into account the future long-term development.
文章引用:韩薇薇. 我国快递业务收入的时间序列分析——基于ARIMA模型[J]. 电子商务评论, 2024, 13(1): 466-474. https://doi.org/10.12677/ECL.2024.131056

1. 引言

2020年初开始,由于受到突发公共卫生事件的影响,全国乃至全球的经济皆受到严重冲击,同时由于交通管制、封闭管理,物流行业如快递业务受到了很大的冲击,针对此类突发事件,快递业务的收入变化值得关注。

由于2022年3月开始,病毒卷土重来,尤其是上海因受到影响而导致正常的生产生活无法继续,而上海作为全国甚至全球的经济贸易中心,此次事件对于全国的快递业务收入应该有较大影响。国家邮政局数据显示,2022年3月,全国快递服务企业业务量完成85.4亿件,同比下降3.1%,同比上年同期增速(47.4%)由正转负,环比2022年1~2月增速(19.6%)由正转负;业务收入完成818.5亿元,同比下降4.2%,同比上年同期增速(27.7%)由正转负,环比2022年1~2月增速(13.8%)由正转负。所以,我们通过历史数据来用拟合模型预测2022年3月和4月的全国快递业务收入。通过分析2022年3月和2022年4月全国快递业务收入预测值和真实值的差值,关注突发事件对我国快递行业是否如猜测那样具有冲击作用,接着,我们用2008年~2022年的数据对2023年的数据做出预测,观测在事件之后我国快递业务收入会呈现怎样的发展趋势。

ARIMA模型(自回归积分滑动平均模型),其基本模型包括自回归过程(AR),滑动平均过程(MA),自回归积分移动平均过程(ARMA),所谓ARIMA模型,就是将原本非平稳的时间序列通过差分等一系列方法,转化为平稳的时间序列 [1] 。ARIMA模型认为依照时间顺序进行排列的所有观测值之间都具有自相关性 [2] 。这种自相关性延续了变量的发展趋势,若将这种自相关性用定量的方法描述,就可以依据时间序列的过去值来预测其将来值。

2. 数据选取

本文选取了2008年1月~2023年11月全国快递业务收入的月度数据(单位:亿元),具体数据来源于国泰安数据。快递业务收入每月数据的时序图如图1所示,以月份(Time)为x轴,每月对应的快递业务收入为y轴,单位为亿美元。

Figure 1. Monthly data time series of national express business revenue

图1. 全国快递业务收入的月度数据时序图

从时序图中可以看出2008年~2023年我国快递业务收入呈现出稳步增长的趋势,且有一定的周期性。所以我们认为,该数据有长期递增趋势,又存在季节效应趋势。由于该时间序列非平稳,我们对数据进行了1阶12步差分以提取线性增长趋势和时间的影响,差分后的时序图如图2所示。

Figure 2. Monthly data time-series of the sequence plot of the sequence of total national express business revenues after 1st order 12-step

图2. 全国快递业务收入总额序列1阶12步差分后序列图的月度数据时序图

可以看到差分后的序列在一定范围内上下波动,趋势性消除,但是可能很明显地看到2020年1月和2021年之后快递业务收入的波动程度较大,猜测是由于受到2020年初和持续反复的公共卫生事件的影响。总的来说,在1阶12步差分之后,该时间序列数据可看作类似平稳。接下来,我们就可以对差分后的序列进行检验分析,选择合适的模型拟合该数据。

3. 建模过程及结果分析

3.1. 平稳性检验和白噪声检验

本研究对选取的全国快递业务收入序列进行ADF平稳性检验(检验结果如表1所示)。可以看出,如果序列的结构考虑无漂移项自回归结构、有漂移项自回归结构和带趋势的回归结构的话,ADF统计量的p值均小于显著性水平(α = 0.05),因此可以判断该序列为平稳序列。

同时,对模型进行纯随机性检验,检验结果如表2所示,6阶p值为6.09E − 06,12阶p值为6.09E − 06,p值均远远小于0.05,则该序列为非白噪声序列。通过上述检验可知,差分之后的全国快递业务收入为平稳非白噪声序列。

Table 1. ADF test

表1. ADF检验

Table 2. Results of the pure randomness test

表2. 纯随机性检验结果

3.2. 模型估计与选择

3.2.1. 模型估计

根据1阶12步差分后的序列绘制自相关图和偏自相关图,如下图3图4所示。考察差分后序列的自相关图和偏自相关图的性质,自相关图显示延迟12阶之后的自相关系数仍然大于两倍标准差,说明差分后的序列蕴含非常显著的季节效应,延迟1阶的自相关系数也大于2倍标准差,说明差分后的序列还具有短期相关性。观察偏自相关图也可得到一致结论。因为该序列的短期相关性与季节效应有复杂的关联性,不能简单提取,故尝试拟合ARIMA乘法模型。

首先考虑1阶12步差分后,序列12阶以内的自相关图和偏自相关图的特征,以确定短期相关模型。12阶以内的自相关系数1阶截尾,偏自相关系数拖尾,尝试使用ARMA(0,1)模型提取短期自相关信息。

再考虑季节自相关特征,自相关图显示,延迟12阶、36阶自相关系数均显著非零,以周期为长度的单位自相关系数呈现拖尾特征。偏自相关图显示,延迟36阶的偏自相关系数落入两倍标准差内,可认为自相关系数2周期截尾。为了寻找最优的拟合模型,用以12步为周期长度的ARMA(2,0)12模型、或者ARMA(1,0)12提取差分后序列的季节自相关信息,进行试验。综上,可供选择的模型组合有ARIMA(0,1,1) (2,1,0)12或者ARIMA(0,1,1) (1,1,0)12

Figure 3. Sequence autocorrelation diagram

图3. 序列自相关图

Figure 4. Sequence biased autocorrelation plot

图4. 序列偏自相关图

3.2.2. 模型优化

由于以上我们无法确定用ARMA(1,0)还是ARMA(2,0)来提取季节相关性,所以我们根据极大似然定阶方法中的AIC信息准则以及BIC信息准则来确定阶数,l两种模型对应的AIC值和BIC值如下表3所示,通过对比不同的p、q值下的AIC值,选择使AIC最小时的p、q值。经过比较,当p = 2且q = 1时,AIC值较小。综上选择ARIMA(0,1,1) (2,1,0)12乘法模型拟合此序列 [3] 。

Table 3. Comparison table of model results

表3. 模型结果对比表

3.3. 模型检验

采用Q统计量对上面建立的ARIMA模型的有效性进行检验。从图5中可以看到,残差相关图显示自相关函数基本在95%的置信区域内,且P值显著大于0.05,表明残差是纯随机性的,残差序列为白噪声,表示ARIMA(0,1,1) (2,1,0)12模型构建有效。

Figure 5. Significance test of the fitted model of national express business revenue series

图5. 全国快递业务收入序列拟合模型显著性检验图

3.4. 模型预测分析及比较

用RStudio软件生成模型的拟合图(如图6所示),虚线为时间序列的观察值,实线为拟合值,我们可以看出该模型的拟合值与历史数据较为贴合,整体来说拟合效果较好。

Figure 6. Predictive effectiveness of the fitted model

图6. 拟合模型的预测效果图

其次,用拟合的有效模型ARIMA(0,1,1) (2,1,0)12对2022年3月之后的月度数据进行预测,预测的数据如表4所示。

Table 4. Data predicted with the fitted model

表4. 用拟合模型预测的数据

利用该模型对2022年3月~2022年4月快递业务收入进行预测,将利用ARIMA模型的预测值作为未受突发事件影响的快递业务收入序列的理论值,预测值与实际值之差即为受突发公共卫生事件影响而变化的数值 [4] 。通过分析这些数值,可以看到从2022年3月和2022年4月快递业务收入真实值与预测值的差值是负的(见表5),表明从2022年3月陆续开始快递业务收到了较强的负面冲击,尤其是在2022年4月当外部环境发生了巨大变化时,这种负面冲击显得尤其强烈。

Table 5. Comparison of the results of the model predictions with the true values for 2022

表5. 2022年的模型预测结果与真实值对比结果表

除此之外,我们用2008年~2019年的数据来估计2020年初发生的突发公共卫生事件对全国快递业务收入的影响,来对比两次相似突发事件的发生对快递行业的影响有什么不同之处。下表6是2020年全国快递业务收入的真实值和预测值之间的比较以及误差分析。可以看到,2020年2月快递业务遭受的负面影响较大,实际值比预测值减少了一倍左右,已经远远地超过了95%的置信区间内。虽然快递业务有了大幅度的下滑,但是这种影响并不是持续性的,快递业务很快地恢复了,在接下来地几个月中快递业务收入地实际值和预测值差别不大,除了个别几个月之外,实际值均落在95%的置信区间内。

由此,我们可以推测出,2022年初的突发事件对全国快递业务收入地影响也只是短暂的,待外部情况缓和,快递业务会很快恢复,并且由于社会对快递业务的需求不会降低,可能较之前年度还会有大幅增长的趋势。

Table 6. Comparison of the results of the model predictions with the real values for the year 2020

表6. 2020年的模型预测结果与真实值对比结果表

为了验证以上猜想,本文用2008年~2022年的数据来估计2023年后快递业务收入的预测值,再将预测值与真实值对比,从表7可以看出,在2023年1月至11月只有三个月全国快递业务收入的真实值低于预测值,其余月份的快递收入的真实值都要比预测值大,根据以上数据可以看出突发消极事件对快递业务的影响是短期的,在此之后由于生活方式和新的需求快递业务收入不降反增。

Table 7. Comparison of the results of the model predictions with the real values for the year 2023

表7. 2023年的模型预测结果与真实值对比结果表

4. 结论

本文对我国2008年1月~2023年11月全国快递业务收入总额的数据进行分析,建立了ARIMA(0,1,1) (2,1,0)12乘法模型,拟合值的结果显示模型的拟合效果较好,并运用该模型对2022年3月和4月的快递业务收入总额进行预测,通过预测值与实际值的比较,突发公共卫生事件对我国快递行业的短期影响较大。原因是很多线上卖家或者买家由于政策原因,不能发货与收货。特别是有些行业需要上门服务的,比如需要配送安装的家具,没办法完成最后一公里。

同时,我们比较了2022年初和2020年初突发事件发生之后全国快递业务收入的变化趋势,预估突发事件对快递业务收入是否有长期影响。通过对2020年快递业务收入的实际值和预测值做比较可以看出,2020年突发事件对快递业务的负面影响是短期的,其次通过2023年快递业务收入的实际值和预测值做比较可以看出,突发事件对快递业务收入的影响在长期来看,不仅没有降低,反而增加了。因为在初期,此类突发事件特有的不确定性与急剧扩散性使得消费者信心遭受冲击,交通运输严重受阻,使得消费意愿大幅减弱,突发事件进入缓解与消退阶段后,消费者情绪逐渐恢复,预期指数回落至稳态水平 [5] ,市场预期随之转好。长期来说突发公共卫生事件是提高了电商的成交比例,当用户养成了线上购物的习惯时,有效获取大量新用户之后,将直接拉动快递行业发展,自营电商平台各项优势将提前显现。

我们可以看到不确定因素会对线上购物、电商平台和快递行业造成短期影响,但是长期来看只要采取有效措施就能将挑战转变为机遇。电商和快递行业要加速线上数字化转型,把电商与物流结合起来,形成现代化的物流体系,借助“互联网+”农业和“数字乡村”战略的实施,加快现代农产品流通体系建设 [6] 。注重发展本地业务,如可以为线下商超提供运输,为社区居民提供民生配送,为上网课的学生提供课本配送等;同时把握资本更多向线上消费和线上办公倾斜的投资趋势 [7] ,把握住机会来促进企业的技术进步和企业组织方式的变革。

参考文献

[1] 李明书, 刘仁云, 胡姝祺, 闫明水. 基于时间序列分析的长春市物流研究及预测[J]. 科技创新与应用, 2020(32): 34-36.
[2] 王燕. 应用时间序列分析[M]. 北京: 中国人民大学出版社, 2008.
[3] 白同元, 许萍, 陈韵洁. 我国进出口总额的时间序列分析[J]. 现代商贸工业, 2021, 42(29): 27-29.
[4] 任敏, 王晨铭, 严鸿雁. 新冠肺炎疫情对我国医药行业股价影响——基于ARIMA模型的实证分析[J]. 北方经贸, 2022(2): 93-96.
[5] 杨子晖, 陈雨恬, 张平淼. 重大突发公共事件下的宏观经济冲击、金融风险传导与治理应对[J]. 管理世界, 2020, 36(5): 13-35+7.
[6] 王可山, 郝裕, 秦如月. 农业高质量发展、交易制度变迁与网购农产品消费促进——兼论新冠肺炎疫情对生鲜电商发展的影响[J]. 经济与管理研究, 2020, 41(4): 21-31.
[7] 智艳, 罗长远. 新冠肺炎疫情对中国经济的影响及其思考[J]. 学习与探索, 2020(4): 99-105.