云南进出口贸易额时序分析与预测
Time Series Analysis and Prediction of Import and Export Trade Volume of Yunnan Province
DOI: 10.12677/sa.2025.149271, PDF, HTML, XML,    科研立项经费支持
作者: 王松剑, 王 青:昆明学院数学学院,云南 昆明
关键词: 时间序列分析ARIMA模型干预分析进出口贸易额Time Series Analysis ARIMA Model Intervention Analysis Import-Export Trade Volume
摘要: 本文基于1980年至2023年云南省进出口贸易年度数据,构建了经典的时间序列ARIMA模型进行分析与预测。研究结果显示单一的ARIMA模型在拟合云南进出口贸易数据趋势方面表现不佳,且预测精度较差。有鉴于此,本文通过引入外生干预事件,构建干预分析模型对云南进出口贸易数据进行分析与预测。研究表明,干预分析模型可以较好地拟合云南进出口贸易数据的发展趋势,且干预分析模型的预测性能相较于ARIMA模型有大幅改善。
Abstract: This study analyzes Yunnan Province’s import-export trade volume data from 1980 to 2023 employing the classical time-series ARIMA model for analysis and forecasting. The results show that the standalone ARIMA model performs inadequately in fitting the trends of Yunnan’s import and export trade data and exhibits poor prediction accuracy. In light of this, the study introduces exogenous intervention events to construct an intervention analysis model for analyzing and forecasting Yunnan’s import and export trade volume data. The research demonstrates that the intervention analysis model can effectively capture the developmental trends of Yunnan’s import-export volume data, and its predictive performance shows significant improvement compared to the ARIMA model.
文章引用:王松剑, 王青. 云南进出口贸易额时序分析与预测[J]. 统计学与应用, 2025, 14(9): 228-237. https://doi.org/10.12677/sa.2025.149271

1. 引言

云南省位于中国西南边陲,边境线总长4060公里,与缅甸、老挝、越南三国接壤,是连接东南亚的核心战略通道。云南省特殊的地理位置使其诸多农产品贸易一直持续发展,特别是2013年“一带一路”倡议的提出,为云南省与邻国的贸易带来了发展机遇,云南省与周边国家的合作日益紧密,进出口贸易规模持续扩大,结构不断优化,但受疫情、国际局势波动、区域竞争加剧及内部产业转型等因素影响,其贸易发展呈现出显著的时序动态特征。因此,对云南省进出口贸易数据进行时间序列分析用于预测趋势、评估政策影响及识别风险很有必要。

国内学者针对进出口贸易数据提出了许多分析方法和建模方法。例如,李菊梅等(2008)基于全国1984年至2004年的进出口总额[1],段鹏(2009)基于全国1990年至2007年商品进出口的月度数据[2],分别应用ARIMA和SARIMA模型并进行预测。白霜(2014)使用主成分分析提取公因子的方法,建立PSO优化混合RVM模型对深圳的进出口额进行预测[3]。武娇艳和李方(2015)采用ARIMA(1,1,1)模型对全国2004年至2014年进出口增长的月度数据进行分析研究[4]。陈蔚(2015)建立ARIMA模型并结合非线性BP神经网络模型对我国贸易进出口额进行预测[5]。舒服华(2018)提出小波灰色DGM模型对全国2007年至2017年的进出口数据进行预测[6]。此外,国内学者对云南省进出口贸易也有相关的研究。例如,熊彬和严海霞(2012)使用云南省与南盟国家2000年至2010年的贸易数据,对云南省进出口贸易潜力进行预测[7]。李志刚(2018)对云南省进出口贸易对经济增长贡献进行了测算研究[8]。陆文航(2021)对云南省2014年1月至2020年9月的贸易出口额数据进行了时序分析和预测[9]。谢佳春等(2025)建立了SARIMA模型和Holt-Winters三参数指数平滑模型对云南省进出口贸易进行预测[10]。更多关于时间序列分析方法参见王燕(2022) [11]

综上所述,现有的针对进出口贸易数据文献研究者们多是基于经典的ARIMA模型或者改进的ARIMA模型进行分析和预测。然而,进出口贸易容易受到一些外部因素,例如国家政策、疫情、国际局势波动、区域竞争加剧等因素影响,从而可能导致构建的ARIMA模型在拟合进出口贸易数据趋势方面表现不佳且预测精度较差。因此,本文选取1980~2023年云南进出口贸易总额数据,并考虑到云南在“一带一路”中的关键地理位置,将2013年“一带一路”倡议的实施作为一个外生干预事件,构建干预分析模型对云南进出口贸易总额进行分析并对未来十年的进出口额进行预测。

2. 方法

2.1. ARIMA模型

ARIMA模型在对外贸易的分析研究中有较为广泛的应用。ARIMA模型,又称为求和自回归移动平均(autoregressive integrated moving average)模型,简记为ARIMA ( p,d,q ) 模型, p 为自回归项数, q 为移动平均项数, d 为使原序列成为平稳序列所做的差分阶数,其基本形式为:

Φ( B ) d x t =Θ( B ) ε t

其中 ε t 为零均值白噪声序列, d = ( 1B ) d Φ( B )=1 φ 1 B φ p B p 为平稳可逆ARMA ( p,q ) 模型的自回归系数多项式, Θ(B)=1 θ 1 B θ q B q 为平稳可逆ARMA ( p,q ) 模型的移动平均系数多项式,为滞后算子。特别地,当 d=0 时,ARIMA ( p,d,q ) 模型实际上就是ARMA ( p,q ) 模型。

2.2. 干预模型

时间序列常常受到某些外部事件的影响,诸如假期、罢工、促销或者政策的改变等。影响时间序列的特殊外部事件或态势称为干预,干预既可以由自然产生,也可以由人为施加。评估外部事件对序列产生的影响称为干预分析(intervention analysis)。

干预事件根据作用机制可以分为三种类型:

(1) 阶梯干预。干预事件发生后,它对响应序列一直有影响而且影响力度基本保持不变。很多政策法规性干预都属于这种情况,因为政策法规一旦颁布,就会持续起作用。比如20世纪60年代,全球平均每个季度会发生20多起劫机事件。从1973年第1季度开始,机场陆续安装了金属探测器,要求乘客登机之前先接受金属探测器检测,金属探测器检测直到今天仍在使用,所以可以认为这个检测的影响一直存在。阶梯干预变量通常设置为: s t =1 ,若 tT ;否则 s t =0

(2) 脉冲干预。干预事件发生后,只有当期影响。比如,某地区某年冬天特别寒冷,生物学家把这个冬天作为干预变量,进行动物种群数量研究。如果认为极端天气只会影响当年的动物种群数量,这就是一个脉冲干预。脉冲干预变量通常设置为: p t =1 ,若 t=T ;否则 p t =0

(3) 其他类型的干预。干预有各种类型,但基本上其他类型的干预都可以用阶梯干预和脉冲干预的传递函数或组合来生成,比如,某产品在媒体上做了为期1个月的广告宣传。广告宣传对销售所起的作用随着时间的推移持续递减。这时干预变量可以用阶梯干预的传递函数(AR结构)表达为: z t = s t /Φ ( B )

再比如,上面提到的对动物种群数量的研究,如果认为极端天气不仅会影响动物的种群数量,对未来(短期)几年的动物种群数量也有影响,这时干预变量可以用脉冲干预的传递函数(MA结构)表达为: z t =Θ( B ) p t

对于单一干预的情况,干预模型的一般形式为: x t = m t + X t ,其中 m t 为均值函数的变化; X t 为未受干预影响的基础时间序列。序列 { X t } 既可能是平稳的,也可能是非平稳的;既可能是季节性的,也可能是非季节性的。对于 m t 的建模大多借助阶梯干预或者脉冲干预来实现。在干预导致均值函数发生了永久性偏移的情况下,如果影响是即时的,那么偏移可建模为: m t =ω s t ,其中 ω 为干预影响强度的未知参数。如果干预经过 l 个时间单位的延迟后作用才显现,并且 l 已知,那么偏移可建模为: m t =ω s tl

如果干预只是逐渐地影响均值函数,其全部影响作用只有经历很长时期方能充分体现出来,那么偏移可建模为: m t =δ m t1 +ω s t1 ,其中 0<δ<1 ,其初始条件为 m 0 =0 。在干预导致均值函数发生了短期偏移的情况下,如果干预只在 t=T 时影响均值函数,那么偏移可建模为: m t =ω p t 。如果干预逐渐地消失,那么偏移可建模为: m t =δ m t1 +ω p t1

3. 数据分析

3.1. 时序分析

本文从云南省统计年鉴官网上查找到了1980年至2023年云南进出口贸易总额的数据,见表1 (单位:亿美元)。本节对1980年至2023年云南进出口贸易总额时序数据构建ARIMA模型步骤如下:

Table 1. Yunnan Province’s total import-export trade volume data

1. 云南省进出口贸易总额数据

年份

总额

年份

总额

年份

总额

年份

总额

1980

1.10

1991

5.51

2002

22.26

2013

258.29

1981

1.35

1992

6.71

2003

26.77

2014

296.22

1982

1.36

1993

8.40

2004

37.48

2015

245.27

1983

1.47

1994

13.44

2005

47.38

2016

199.99

1984

1.51

1995

18.96

2006

62.32

2017

233.94

1985

2.10

1996

19.22

2007

87.80

2018

298.95

1986

2.65

1997

19.37

2008

95.99

2019

336.92

1987

3.42

1998

19.03

2009

80.19

2020

389.46

1988

4.44

1999

16.60

2010

133.68

2021

486.59

1989

5.48

2000

18.13

2011

160.53

2022

500.42

1990

5.48

2001

19.89

2012

210.05

2023

367.75

Figure 1. Timing series of import-export trade volume of Yunnan Province and series diagram after first-order difference

1. 云南进出口贸易总额时序图和1阶差分后时序图

(1) 考察云南进出口贸易总额序列的平稳性和纯随机性。时序图(见图1左)显示该序列有明显的上升趋势,该序列是非平稳的,无季节效应。接下来检验该序列的纯随机性。白噪声检验显示,延迟6阶的LB统计量的P值只有 2.2× 10 16 ,小于显著性水平0.05,所以显著拒绝序列为纯随机序列的原假设,认为该序列为非白噪声序列。

(2) 差分平稳。云南进出口贸易总额序列1阶差分时序图(见图1右)显示差分后序列呈现出平稳的波动特征。进一步使用ADF检验。检验结果(见表2)显示,三种类型的统计量的平均P值小于显著性水平 ( α=0.05 ) ,所以可以认为该序列显著平稳。

(3) 对1阶差分后序列进行延迟6阶和12阶的纯随机性检验。检验结果显示,延迟6阶的LB统计量的P值为0.1086,延迟12阶的LB统计量的P值为0.0232,小于显著性水平0.05,所以显著拒绝序列为纯随机序列的原假设,所以可以确认1阶差分后序列为平稳非白噪声序列。

(4) 模型定阶。考察1阶差分后序列的自相关图和偏自相关图(见图2)。从图2可以看出,自相关图显示8阶截尾特征,偏自相关图显示2阶截尾特征。根据自相关图和偏自相关图的特征,若将自相关函数视为拖尾,偏自相关函数2阶截尾,则可拟合ARIMA(2,0,0)模型;若自相关函数8阶截尾,偏自相关函数拖尾,则可拟合ARIMA(0,0,8)模型;将二者视为拖尾则可拟合ARIMA(2,0,8)模型。综上所述,准备拟合的云南进出口贸易总额模型为:

模型1: x t =( 1 θ 1 B θ 2 B 2 ) ε t

模型2: x t =( 1 φ 1 B φ 8 B 8 ) ε t

模型3: x t = 1 θ 1 B θ 2 B 2 1 φ 1 B φ 8 B 8 ε t

其中 ε t 为零均值白噪声序列。

Table 2. The ADF test after first-order difference

2. 1阶差分后序列ADF检验

类型

延迟阶数

统计量值

p值

类型一

0

−2.89

0.010

1

−4.40

0.010

2

−2.97

0.010

3

−3.10

0.010

类型二

0

−2.87

0.061

1

−4.71

0.010

2

−3.29

0.024

3

−3.57

0.013

类型三

0

−2.56

0.343

1

−4.84

0.010

2

−3.46

0.061

3

−4.09

0.016

Figure 2. Autocorrelation (left) and partial autocorrelation (right) of difference sequences

2. 差分后序列自相关(左)和偏自相关(右)图

(5) 模型参数估计。使用极大似然估计方法,分别得到三个模型的参数估计结果(见表3)。

根据参数估计结果,拟合模型为:

模型1: x t =( 10.786B+0.577 B 2 ) ε t , ε t ~N( 0,822.7 )

模型2: x t =( 10.459B+0.355 B 2 +0.183 B 3 0.372 B 4 +0.357 B 5 0+0.273 B 6        0.795 B 7 0.701 B 8 ) ε t , ε t N( 0,404.2 )

模型3: x t = 11.275B+0.853 B 2 1+0.719B+0.030 B 2 0.365 B 3 0.016 B 8 ε t , ε t ~N( 0,382.8 )

拟合模型1的AIC为406.22,对数似然值为−201.11;拟合模型2的AIC为399.76,对数似然值为−191.88;拟合模型3的AIC为400.14,对数似然值为−190.17。通过比较,最终选择的拟合模型为模型3。

(6) 拟合模型3的显著性检验。对干预模型残差序列进行白噪声检验,LB检验结果(见表4)显示残差序列为白噪声序列,所以拟合模型显著成立。

Table 3. The results of parameter estimation of ARIMA models

3. ARIMA模型的参数估计结果

类型

参数

估计值

标准误差

模型1

θ 1

0.786

0.177

θ 2

−0.577

0.167

模型2

ϕ 1

0.459

0.180

ϕ 2

−0.355

0.183

ϕ 3

−0.183

0.210

ϕ 4

0.372

0.167

ϕ 5

−0.357

0.209

ϕ 6

−0.273

0.204

ϕ 7

0.795

0.207

ϕ 8

0.701

0.182

模型3

ϕ 1

−0.719

0.279

ϕ 2

−0.030

0.222

ϕ 3

0.365

0.222

ϕ 4

0.403

0.203

ϕ 5

−0.650

0.245

ϕ 6

0.155

0.276

ϕ 7

0.578

0.202

ϕ 8

0.016

0.292

θ 1

1.275

0.171

θ 2

−0.853

0.162

Table 4. Significance test results of model 3

4. 模型3的显著性检验结果

延迟阶数

LB统计量值

p值

6

2.529

0.865

12

7.519

0.822

18

10.291

0.922

24

10.737

0.991

30

11.015

0.999

(7) 序列预测。基于拟合模型3,未来10年云南进出口贸易总额预测值和95%的置信区间(见表5)。从表5可以看出,云南省2024年进出口贸易总额预测值为196.85亿美元,而2024年云南省进出口贸易总额真实值为349.65亿美元,差距太大,从而可以看出单一用ARIMA模型对其发展趋势进行拟合效果不佳。因此,下节将对“一带一路”政策下云南进出口贸易总额数据进行干预分析和预测。

Table 5. Forecast values of model 3

5. 模型3的预测结果

预测时期

预测值

标准差

95%置信下限

95%置信上限

2024

196.85

20.42

156.83

236.88

2025

255.03

23.96

208.06

302.00

2026

248.63

24.07

201.46

295.80

2027

285.33

25.09

236.17

334.50

2028

374.96

25.10

325.76

424.15

2029

383.14

25.43

333.29

432.99

2030

358.77

25.75

308.30

409.24

2031

407.34

27.24

353.94

460.73

2032

425.53

31.26

364.26

486.80

2033

339.85

33.45

274.28

405.41

3.2. 干预分析

干预模型是进行政策效果评估或分析特殊事件影响的有用模型。干预模型的关键是将干预事件以虚拟变量的形式引入响应序列分析。本节旨在分析“一带一路”政策的执行对云南进出口贸易有没有起到作用;如果起了作用,作用有多大。在本节中,干预变量是“一带一路”政策的执行。这是一个定性变量,它没有数值,只有两个属性:(1) 2013年前没有执行;(2) 2013年后执行了。记 x 1t 是“一带一路”政策执行变量,且 x 1t =0 ,若 t<2013 年;否则 x 1t =1

下面是构建干预分析模型的步骤:

(1) 考察云南进出口贸易总额序列的时序图(见图1左)、互相关图(见图3),研究干预变量对序列的干预机制,构健一般干预模型。

互相关图显示干预变量0阶滞后时互相关系数最大。基于时序图和互相关图特征,假定干预变量对序列的干预只是水平影响且无延迟,引入干预变量建立回归模型,我们准备拟合的干预模型为:

x t = β 0 + β 1 x 1t + 1 θ 1 B θ 2 B 2 1 φ 1 B φ 8 B 8 ε t

其中 β 0 β 1 为干预系数, ε t 为零均值白噪声序列。

Figure 3. Cross-correlation between import and export trade series and the intervention series

3. 云南进出口贸易总额序列和干预序列的互相关图

(2) 模型参数估计。本节使用极大似然估计方法,得到上述干预模型的参数估计结果(见表6)。

Table 6. The results of parameter estimation of intervention model

6. 干预模型的参数估计结果

参数

估计值

标准误差

ϕ 1

−0.7162

0.3606

ϕ 2

0.0759

0.2582

ϕ 3

0.0072

0.4436

ϕ 4

0.7314

0.3742

ϕ 5

−0.7421

0.3268

ϕ 6

0.0175

0.3731

ϕ 7

0.5741

0.2978

ϕ 8

0.1239

0.4450

θ 1

1.3019

0.1954

θ 2

−0.8547

0.1663

β 1

28.4688

21.0445

根据参数估计结果,拟合的干预模型为:

模型4: x t = x t1 +28.469 x 1t + 11.302B+0.855 B 2 1+0.716B0.076 B 2 0.007 B 3 0.124 B 8 ε t , ε t ~N( 0,348.8 )

(3) 拟合模型的显著性检验。对干预模型残差序列进行白噪声检验,LB检验结果(见表7)显示残差序列为白噪声序列,所以拟合模型显著成立。进一步分析该模型的干预系数,根据 β 1 =28.469 ,而且该系数t检验显著非零的特征,可以认为“一带一路”政策执行和实施有效增加了云南进出口贸易总额。这说明“一带一路”政策对云南进出口贸易是显著有效的。又因为 mean( x t | t<2013 )=35.154 ,即在2013年之前,云南省进出口贸易总额平均为35.154亿美元,而因为“一带一路”政策执行和实施,云南省进出口贸易总额平均增加了28.469亿美元,所以“一带一路”政策执行和实施使得云南省进出口贸易总额比“一带一路”政策执行前上升了81%左右,即 28.469/ 35.154 ×100%=80.98%

(4) 序列预测。给出未来干预变量的取值,基于拟合的干预模型4,我们可以对云南进出口贸易总额做短期预测。假定未来10年政策不变,未来10年云南进出口贸易总额预测值和95%的置信区间如表8所示。从表8可以看出,进行干预分析后云南省2024年进出口贸易总额预测值为285.91亿美元,与实际349.65亿美元差距不大,从而可以看出对“一带一路”政策下云南进出口贸易总额数据进行干预分析后,模型预测效能有了较大的提高,而且随着预测时间变长,预测误差越来越大,预测区间呈现喇叭形,这是时间序列预测的典型特点。

Table 7. Significance test results of model 4

7. 模型4的显著性检验结果

延迟阶数

LB统计量值

p值

6

5.006

0.543

12

9.490

0.661

18

12.959

0.794

24

13.286

0.961

30

13.468

0.996

Table 8. Forecast values of model 4

8. 模型4的预测结果

预测时期

预测值

标准差

95%置信下限

95%置信上限

2024

285.91

19.84

247.02

324.81

2025

307.01

23.28

261.40

352.63

2026

381.88

23.27

336.27

427.50

2027

459.91

25.34

410.24

509.58

2028

570.57

25.24

521.11

620.04

2029

664.28

25.55

614.22

714.36

2030

681.40

26.16

630.12

732.68

2031

633.86

26.90

581.14

686.58

2032

573.08

30.87

512.58

633.58

2033

550.32

34.04

483.59

617.04

4. 结论

本文旨在对“一带一路”倡议政策背景下云南省的进出口贸易额进行时序分析与预测。本文利用1980年至2023年云南省的进出口贸易的年度数据,首先构建了经典的时间序列ARIMA模型进行分析。研究发现,单一的ARIMA模型在拟合云南贸易数据趋势方面表现不佳,且预测精度较差。其次,鉴于云南在“一带一路”建设中的关键地理位置,本文将“一带一路”政策的实施作为一个外生干预事件,构建干预分析模型对云南进出口贸易数据进行重新建模和分析。研究表明,干预分析模型可以较好地拟合云南进出口贸易数据的发展趋势,且干预分析模型的预测性能相较于ARIMA模型有大幅改善。干预分析量化评估了“一带一路”倡议政策对云南贸易增长的拉动效应,对云南省进出口贸易未来的动态发展趋势进行合理的预估,为地方政府优化开放型经济政策提供了决策依据。

基金项目

地方高校联合专项–面上项目(202001BA070001-045);昆明学院引进人才科研项目(YJL2009)。

参考文献

[1] 李菊梅, 樊亮, 崔俊峰. 用时间序列分析方法预测我国的进出口总额[J]. 重庆工学院学报(自然科学版), 2008, 22(12): 136-138.
[2] 段鹏. 我国商品进出口: 基于SARIMA模型的预测[J]. 华中师范大学学报(人文社会科学版), 2009, 48(1): 60-66.
[3] 白霜. 基于PSO优化混合RVM模型的进出口贸易预测算法[J]. 计算机与现代化, 2014(8): 110-118.
[4] 武娇艳, 李方. 进出口增长时间序列模型建立与预测[J]. 合作经济与科技, 2015(1): 74-75.
[5] 陈蔚. 基于线性ARIMA与非线性BP神经网络组合模型的进出口贸易预测[J]. 统计与决策, 2015(22): 47-49.
[6] 舒服华. 基于小波DGM(2,1)模型的我国进出口贸易额预测[J]. 保定学院学报, 2018, 31(3): 17-23.
[7] 熊彬, 严海霞. 基于引力模型的云南与南盟国家贸易关系研究[J]. 南亚研究季刊, 2012(4): 76-82.
[8] 李志刚. 云南省进出口贸易与经济增长关系研究[D]: [硕士学位论文]. 昆明: 云南师范大学, 2018.
[9] 陆文航. 云南省贸易出口额时序分析及预测[J]. 统计学与应用, 2021, 10(5): 855-863.
[10] 谢佳春, 何俊霖, 鲁晶. 云南省进出口贸易预测——基于时间序列模型优化分析[J]. 时代经贸, 2025, 22(7): 19-21.
[11] 王燕. 应用时间序列分析[M]. 第6版. 北京: 中国人民大学出版社, 2022.