1. 引言
如今对外贸易对经济全球化起到了关键的作用。自改革开放以来,我国对外贸易得到了很大程度的发展。由于经济发展程度和经济结构的差异,我国不同省份对对外贸易的依赖程度也不同。作为我国中部省份,山西省虽然地域广阔、资源丰富,但对外贸易上有着不具备区位优势、贸易规模小、增速低和进出口产品单一等问题。在经过十几年的发展后,外贸结构逐渐优化,呈现出渐进式发展的趋势。近年来,“一带一路”给山西省的贸易转型打开了新的大门,该省致力于创新开放对外平台和贸易渠道,积极拓宽国际市场。
进出口总额数据体现着一国或一个省份对外贸易的客观发展规律,通过运用一定的数学方法和理论模型分析就可以掌握进出口额变化发展规律,将有助于对对外贸易的未来发展进行预测、规划与风险管理等活动,促进经济向好发展。本文以山西省2000至2021年进出口总额的264期月度数据为研究对象,通过建立、统计检验和拟合乘法SARIMA模型对其进行时间序列分析,并分析比较该模型和Holt-Winters指数模型的预测效果。最后得出结论,山西省月度进出口总额具有逐年递增的趋势和季节性,并且模型拟合效果好。通过预测,为进一步制定贸易政策和优化贸易结构提供了理论依据。
2. 文献综述
通过梳理文献发现,历年来运用不同研究方法分析预测对外贸易进出口总额的文献不在少数。王红(2006) [1] 借助逐步回归理论,通过三次逐步回归拟合出最佳的进出口总额预测模型。李菊梅(2008) [2] 建立ARMA模型拟合我国的年度进出口总额数据,得出结论该模型更适合进行短期预测。程兰芳(2010) [3] 进一步运用ARIMA模型拟合和预测我国的服务贸易进出口数据, 并得出了95%的概率意义下的短期区间预测效果。张玥(2021) [4] 利用随机森林和支持向量机两种算法来构建回归模型,通过对GDP、CPI、企业商品价格指数和社会消费品零售总额等八个变量进行回归来预测我国进出口总额,结果表明支持向量机对于小样本数据的预测更优。
同时也有不少学者研究对外贸易的影响因素。谭亮(2010) [5] 采用协整理论证实对外直接投资与进口、出口存在短期替代效应和长期互补效应,并建立了误差修正模型。胡登(2018) [6] 基于多元线性回归模型分析影响进出口总额的因素,得出生产总值对进出口总额的重要作用以及财政收入于进出口总额的微弱反相关关系。俞力宁(2022) [7] 通过建立双对数线性回归模型得出地区国民生产总值和居民消费价格指数是影响对外贸易总额的重要因素。李岚(2022) [8] 基于格兰杰因果检验法发现汇率变动能抑制贸易、促进贸易出口,并且汇率变动对进口额表现为单向的因果关系。
最后,也有不少学者借助时间序列ARIMA模型进行不同领域的分析和预测。赵喜仓(2010) [9] 通过对不同的SARIMA模型进行参数估计和AIC准则比较后发现ARIMA(2,1,1) (1,1,1)4能较好地拟合我国季度GDP数据。戴玉泉(2019) [10] 基于ARIMA(p,d,q)模型对江西省2017年至2019年的CPI指数进行分析与预测,表明ARIMA(0,3,1)模型预测效果较好,并给出了一些建议。强添刚等学者(2021) [11] 通过构建SARIMA模型和GA-BP神经网络的组合模型来预测地铁进站客流量,表明复合预测模型在长期预测过程中的平均精度高于单个模型。
3. 理论模型
3.1. 两个基本模型AR(p)和MA(q)模型
p阶自回归模型的结构如下,简记为AR(p):
三个限制条件如下:
,
,
,
,
q阶移动平均模型的结构如下,简记为MA(q):
两个限制条件如下:
,
,
,
3.2. SARIMA模型
ARIMA(p,d,q)模型可以看作差分运算和AR(p)、MA(q)的组合,其中d是指对数据进行差分的阶数,这表明经过适当阶数的差分后时间序列会变得平稳。针对无季节效应的非平稳序列时,使用ARIMA模型拟合数据的效果较好。但当时间序列中出现明显的季节性变化时,ARIMA模型将不再能很好的拟合数据。因此需要运用SARIMA模型较好的预测有季节效应的非平稳时间序列。SARIMA模型分为季节乘法和季节相加两种,能够提取序列的长期趋势、季节效应和随机波动之间的相互关系。
季节性时间序列模型ARIMA(p,d,q)(P,D,Q)S表示为:
其中:S是周期长度,P、Q均为季节性的阶数。
表示p阶自回归多项式,
表示q阶移动平均多项式。
,
。
和
表示季节性的系数多项式。
3.3. SARIMA模型的建模流程
第一,对序列绘制时序图,直观观察序列是否平稳。第二,对于存在季节性的时间序列数据,需要提取季节趋势,确定周期长度S。通过恰当阶数的差分,使序列从非平稳转变为平稳,并进行差分后ADF平稳性检验和白噪声检验。第三,结合自相关图和偏自相关图,基于短期相关性得到阶数p、q,基于季节自相关特征得到阶数P、Q。第四,将可能的p、q、d和P、Q、D的取值代入SARIMA模型,进行模型显著性检验。第五,基于拟合模型对序列进行预测。
4. 基于SARIMA模型的时间序列分析
4.1. 数据预处理
本文从中经网统计数据库收集了264期从2000年1月份至2021年12月份的山西省进出口总额月度数据,单位为千万美元。本文所使用的数据处理分析软件为Rstudio。首先对序列数据绘制时序图,见图1。山西省的进出口总额呈现逐年稳步递增的趋势,2021年增长幅度最大,表明“十四五”对外贸易规划取得良好开端以及“一带一路”在该省发挥的积极成效。
通过对其进行进一步的因素分解,可以看出这个序列受到三个因素的影响:长期趋势(trend)、季节效应(seasonal)和随机波动(random),说明山西省进出口总额序列是一个季节性的非平稳时间序列,见图2。
4.2. 构建SARIMA模型
从因素分解图看出,山西省进出口总额数据表现出明显的以年度为周期的特征。因此,对进出口总额时间序列进行1阶差分提取趋势效应,12步差分提取季节效应,得到1阶12步差分后的序列时序图,见图3。差分后数据围绕一定数值上下波动,序列已经没有明显的递增趋势和以年为周期的波动。
4.2.1. 平稳性检验和纯随机性检验
1) ADF检验
原假设:序列非平稳。

Figure 3. Sequence diagram after 1st-order 12-step difference
图3. 1阶12步差分后序列图
备择假设:序列平稳。假设条件用参数
表达,即为
,
差分后序列的ADF统计量的P值为0.01,小于显著性水平0.05,因此拒绝原假设,认为经过1阶12步差分后的山西省进出口总额序列平稳。
2) 纯随机性检验
LB统计量的P值远小于显著性水平0.05,所以差分后的山西省进出口总额序列不是白噪声序列。
通过上述检验,可以确定差分后的山西省进出口总额序列为平稳非白噪声序列,进而建立SARIMA模型。
4.2.2. SARIMA模型定阶
因为对进出口总额序列进行了1阶12步的差分,所以d、D取值都为1。见图4和图5,通过ACF图和PACF图可以看出,1阶自相关系数落在2倍标准差外,偏自相关系数拖尾,所以p = 0,q = 1。接着以12阶为一个周期分析季节趋势,12阶(1周期)自相关系数大于2倍标准差,其余系数接近零数值。延迟1个周期、2个周期的偏自相关系数都大于2倍标准差,考虑拖尾。所以P = 0,Q = 1,S = 12。
经过上述定阶,建立季节乘法模型为SARIMA(0,1,1)(0,1,1)12。

Figure 5. PACF plot after differencing
图5. 差分后PACF图
4.3. SARIMA模型检验
对拟合的模型进行显著性检验。见表1,参数的估计值均大于2倍标准差,所以参数估计值有效。见图6,残差序列的检验统计量的P值都显著大于0.05,右下图显示近似服从正态分布,说明趋势效应和季节效应提取充分后的残差序列为白噪声序列,拟合的模型SARIMA(0,1,1)(0,1,1)12显著有效。
4.4. 模型拟合口径以及预测
使用条件最小二乘法与极大似然混合估计方法,拟合SARIMA(0,1,1)(0,1,1)12模型的表达式:

Table 1. Parametric significance test
表1. 参数显著性检验
代入参数估计值,得出:
通过拟合的SARIMA(0,1,1)(0,1,1)12,对2022年的月度山西省进出口总额数据进行预测。由图7可知,拟合效果良好。

Figure 7. SARIMA model prediction effect chart
图7. SARIMA模型预测效果图
5. Holt-Winters三参数指数平滑法
除了运用SARIMA模型预测带有季节效应的时间序列外,还可以采用Holt-Winters指数法。R基于最优拟合原则计算出平滑系数:
,
,
通过Holt-Winters 三参数指数平滑加法迭代公式,得到三参数的最后迭代值为:
,
所以,该序列的向前任意k期的预测值等于:
,
由Holt-Winters三参数指数平滑预测效果图看出,拟合效果较好,见图8。

Figure 8. Holt-Winters three-parameter exponential smoothing
图8. Holt-Winters三参数指数平滑法
两种模型预测结果对比
采用两种模型对山西省2022年下半年的进出口总额进行预测,并与上半年实际进出口总额对比,结果如下,见表2:

Table 2. System resulting data of standard experiment
表2. 标准试验系统结果数据
通过对比发现,SARIMA模型的预测效果与Holt-Winters三参数指数平滑法的预测效果大体一致,但与实际值相比,有些年份的预测值会有些偏离,可能受到当月宏观环境的影响。
SARIMA模型和Holt-Winters 三参数指数平滑法均可以对山西省的进出口总额进行拟合和预测。对于SARIMA模型来说,更适合拟合和预测线性的时间序列,不需要考虑外界的因素,通过序列内部的关系进行自回归,找出合适的p和q值,就可以灵活的拟合数据。而Holt-Winters 三参数指数平滑法利用三个平滑系数来有效预测未来的趋势,但却难以找到最佳的平滑系数值,且只适合预测2~3期的数据。由于山西省进出总额还会受到外界宏观因素的影响而出现某一期的跳跃,就会导致偏差变大。因此,通过调整p和q的取值,SARIMA模型能更好地拟合序列。
6. 研究结论
本文使用SARIMA(0,1,1)(0,1,1)12模型拟合山西省2000年至2021年的进出口总额数据,结果显示山西省的进出口总额呈现出稳步增长的长期趋势和周期性波动。同时使用该模型和Holt-Winters三参数指数平滑法分别预测山西省2022年下半年的进出口总额,结果显示两种方法的拟合效果大体一致,在未来半年将会保持稳步增长态势。但由于受到宏观环境的影响,会与实际值之间存在误差。
通过序列趋势可知,2021年山西省的进出口总额相较2020年有了很大的提升,“十四五”对外贸易规划取得了良好的开端,同时“一带一路”在该省发挥的成效显现。2021年,山西省外贸企业数量增加,进出口业务达历史新高,民营企业活力增强。从贸易结构看,制造业贸易和一般贸易进出口额明显增加,外商投资企业发挥主导作用。同年,全省增加了对“一带一路”沿线国家的进出口业务。
2022年进出口贸易总额的实际值略低于预测值,是因为疫情的反复对经济增长有一定的抑制作用。据太原海关统计,2022年上半年全省货物贸易同比下降了18.8%。面对该省进出口贸易总额的下降,为应对疫情对贸易的冲击,山西省金融机构通过加大信贷投放、降低汇率风险和创新跨境金融服务等措施保障外贸行业的资金需求,促进该省外贸进出口业务的恢复。后半年预测值保持稳定,意味着该省需要保持现有的外贸状态,并不断优化外贸结构,充分挖掘外贸企业的潜力和地域资源,实现新的突破。因此,一方面山西省要积极推进“一带一路”建设,拓宽贸易渠道,创新对外贸易产品,提升产品核心技术。另一方面要寻求发展服务型贸易,提高服务贸易占比,将产业升级、服务型贸易与数字化融合,推动高质量发展。最后,山西省应该继续聚焦于“十四五”外贸目标,培育新型外贸主体,对现有外贸业务转型升级,同时提升对外开放平台功能、积极开拓国际市场,进一步推动外贸经济的转型发展。