湖南省经济发展水平测度与动态预测研究
Research on the Measurement and Dynamic Prediction of Economic Development Level in Hunan Province
摘要: 湖南省位于中国中部地区,是重要的经济枢纽,其经济发展状况对于区域协调发展战略意义重大,本研究以2003到2022年湖南省的经济数据为依托,采用因子分析,霍尔特线性趋势模型以及线性核支持向量回归等方法,全面评定湖南省的经济发展水平,并对其未来走向作出预测。在因子分析环节,构建起含9项主要经济指标的考量体系,从中得到“经济发展综合因子”和“经济活力与外资利用因子”,从而达成对经济发展水平的有效量化。预测部分就综合得分时间序列数据而言,分别用霍尔特线性趋势模型,线性核支持向量回归模型来执行预测,两种预测的结果都表明湖南省经济将会持续增长,建议有关部门采取推动产业结构高阶化等策略。
Abstract: Hunan Province, situated in central China, serves as a pivotal economic hub whose development status holds strategic significance for regional coordination. This study leverages economic data from Hunan Province (2003~2022) to comprehensively assess its economic development level and forecast future trends through factor analysis, Holt’s linear trend model, and linear kernel support vector regression. A nine-indicator evaluation system was constructed in the factor analysis phase, extracting two principal components: the “comprehensive economic development factor” and the “economic vitality and foreign capital utilization factor”, achieving effective quantification of development levels. For forecasting the integrated score time series, both Holt’s model and linear kernel SVR were employed, with results consistently demonstrating sustained economic growth in Hunan Province. The study recommends policy measures such as promoting high-end industrial restructuring to optimize development trajectories.
文章引用:左嘉琪, 贺文洁, 王雪铮, 谢强, 李晓非. 湖南省经济发展水平测度与动态预测研究[J]. 统计学与应用, 2025, 14(12): 385-397. https://doi.org/10.12677/sa.2025.1412373

1. 因子分析

1.1. 模型的构建

使用因子分析法探讨湖南省经济发展情况时,本文选取第一、二、三产业产值、人均可支配收入、人均消费支出、地方一般公共预算收入、出口总额、进口总额、实际使用外资金额作为指标构建模型。

通过上述指标构建湖南省经济发展水平因子分析的指标体系[1]

1.2. 数据来源

本研究数据来源于《湖南省统计年鉴》《中国统计年鉴》。包括了2003年至2022年的多个经济指标,如表1表2,包括第一产业、第二产业、第三产业、进出口额等。

Table 1. Economic indicators of Hunan Province (1)

1. 湖南省经济指标(1)

年份

第一产业(亿元)

第二产业(亿元)

第三产业(亿元)

人均可支配收入(元)

人均消费支出(元)

2003

869.68

1772.29

2017.98

7674.2

6082.6

2004

1022.45

2135.55

2384.62

8617.5

6884.6

2005

1078.34

2490.17

2801.36

9524

7505

2006

1244.63

3030.72

3156.2

10504.7

8169.3

2007

1563.81

3867.42

3854.22

12293.5

8990.7

2008

1761.78

4870.03

4675.56

13821.2

9945.5

2009

1795.8

5494.66

5482.34

15084.3

10828.2

2010

2073.19

7034.7

6466.43

16565.7

11825.3

2011

2420

8883.59

7611.37

18844.1

13402.9

2012

2567.85

9926.66

8712.72

22172.8

14609

2013

2589.18

10913.8

10042.26

24352

16867.3

2014

2671.01

11825.12

11385.15

26570.2

18334.7

2015

2747.91

12665.72

13124.97

28838.1

19501.4

2016

2915.58

12941.99

14995.88

31283.9

21420

2017

2998.4

13459.82

17369.89

33947.9

23162.6

2018

3084.18

13904.11

19341.39

36698.3

25064.2

2019

3647.23

15401.7

20845.21

39841.9

26924

2020

4240.73

15949.19

21352.65

41697.5

26796.4

2021

4323.04

17852.53

23537.88

44866.1

28293.8

2022

4602.73

19182.58

24885.06

47301.2

29580.1

Table 2. Economic indicators of Hunan Province (2)

2. 湖南省经济指标(2)

年份

地方一般公共预算收入(亿元)

出口总额(万美元)

进口总额(万美元)

实际使用外资金额(万美元)

2003

268.65

214,626

158,990

148,907

2004

320.63

309,778

233,996

141,806

2005

395.27

374,667

225,818

207,235

2006

477.93

509,401

225,858

259,335

2007

606.55

652,342

316,645

327,051

2008

722.71

840,950

415,634

400,515

2009

847.62

549,189

465,912

459,787

2010

1081.69

795,487

673,399

518,441

2011

1517.07

989,747

910,259

615,031

2012

1782.16

1,259,965

934,117

728,034

2013

2030.88

1,482,083

1,034,356

870,482

2014

2262.79

2,002,348

1,100,380

1,026,585

2015

2515.43

1,917,288

1,019,392

1,156,441

2016

2697.88

1,817,002

870,968

1,285,209

2017

2757.82

2,317,175

1,286,776

1,447,489

2018

2860.84

3,057,434

1,595,550

1,619,134

2019

3007.15

4,453,465

1,834,729

1,810,127

2020

3008.66

4,782,488

2,285,353

2,099,782

2021

3250.69

6,523,609

2,747,877

241,490

2022

3101.76

7,699,229

2,844,124

352,761

1.3. 模型的检验

通过KMO和巴特利特球形度检验,评估数据的适用性。表3的检验结果显示,KMO值为0.838,超出0.6的临界标准,表明变量间共同度高;巴特利特球形度检验近似卡方值达532.982 (自由度36),其显著性水平远低于0.05,表明变量间存在显著相关性,数据适用于因子分析。

Table 3. KMO and Bartlett’s test

3. KMO和巴特利特检验

KMO和巴特利特检验

KMO取样适切性量数。

0.838

巴特利特球形度检验

近似卡方

532.982

自由度

36

显著性

.000

1.4. 公因子提取

根据总方差解释表(表4)与碎石图(图1),提取两个公因子。从表4看出,两因子累积贡献率达98.146%。其中,第一公因子贡献率为72.698%,第二公因子为25.448%,说明这两大因子能够全面反映原始数据的主要信息。

Figure 1. Scree plot

1. 碎石图

Table 4. Total variance explained

4. 总方差解释

总方差解释

成分

初始特征值

提取载荷平方和

旋转载荷平方和

总计

方差百分比

累积%

总计

方差百分比

累积%

总计

方差百分比

累积%

1

8.044

89.379

89.379

8.044

89.379

89.379

6.543

72.698

72.698

2

0.789

8.767

98.146

0.789

8.767

98.146

2.290

25.448

98.146

3

0.103

1.145

99.291

4

0.045

0.497

99.788

5

0.011

0.117

99.905

6

0.006

0.067

99.972

7

0.002

0.018

99.990

8

0.001

0.006

99.996

9

0.000

0.004

100.000

提取方法:主成分分析法。

1.5. 因子旋转与因子解释

采用最大方差正交旋转法得到旋转后的成分矩阵(表5),对两个公因子进行解释。

Table 5. Rotated component matrix

5. 旋转后的成分矩阵

旋转后的成分矩阵a

成分

1

2

第一产业(亿元)

0.912

0.381

第二产业(亿元)

0.876

0.458

第三产业(亿元)

0.895

0.433

人均可支配收入(元)

0.895

0.444

人均消费支出(元)

0.869

0.490

地方一般公共预算收入(亿元)

0.804

0.569

出口总额(万美元)

0.980

0.097

进口总额(万美元)

0.965

0.219

实际使用外资金额(万美元)

0.224

0.964

根据表5,本文提取了两个具有代表性的因子,以合理地反映经济发展的多维度特征。具体如下:

因子1 (经济发展综合因子):包括了第一、二、三产业产值及进出口额,反映了湖南省的产业结构和对外贸易水平,体现了湖南省经济发展总体体量。

因子2 (经济活力与外资利用因子):包括人均可支配收入、人均消费支出、地方一般公共预算收入及实际使用外资金额,反映了居民生活水平和经济活力,体现外资贡献度,反映政府对经济发展的支持程度[2]

1.6. 因子得分的计算

由SPSS分析得到表6

Table 6. Component score coefficient matrix

6. 成分得分系数矩阵

成分得分系数矩阵

成分

1

2

第一产业(亿元)

0.152

−0.029

第二产业(亿元)

0.104

0.066

第三产业(亿元)

0.122

0.032

人均可支配收入(元)

0.117

0.044

人均消费支出(元)

0.087

0.103

地方一般公共预算收入(亿元)

0.027

0.214

出口总额(万美元)

0.308

−0.353

进口总额(万美元)

0.247

−0.221

实际使用外资金额(万美元)

−0.366

0.890

提取方法:主成分分析法。旋转方法:凯撒正态化最大方差法。组件得分。

由得分系数矩阵我们可以得出因子表达式如下:

F 1 =0.152×Z x 1 +0.104×Z x 2 +0.122×Z x 3 +0.117×Z x 4 +0.087×Z x 5 +0.027×Z x 6 +0.308×Z x 7 +0.247×Z x 8 0.366×Z x 9 (1-1)

F 2 =0.029×Z x 1 +0.066×Z x 2 +0.032×Z x 3 +0.044×Z x 4 +0.103×Z x 5 +0.214×Z x 6 0.353×Z x 7 0.221×Z x 8 +0.89×Z x 9 (1-2)

F= ( 72.698× F 1 )/ 98.146 + ( 25.448× F 2 )/ 98.146 (1-3)

( x 1 :第一产业(亿元), x 2 :第二产业(亿元), x 3 :第三产业(亿元), x 4 :人均可支配收入(元), x 5 :人均消费支出(元), x 6 :地方一般公共预算收入(亿元), x 7 :出口总额(万美元), x 8 :进口总额(万美元), x 9 :实际使用外资金额(万美元))。

通过计算可得F1得分,F2得分以及综合得分如下[3] (表7表8):

Table 7. F1 scores and F2 scores

7. F1得分,F2得分

年份

F1得分

F2得分

年份

F1得分

F2得分

2003

−0.98213

−0.96647

2013

−0.13007

0.29802

2004

−0.88945

−0.98725

2014

−0.03901

0.51223

2005

−0.88467

−0.86851

2015

−0.06123

0.82814

2006

−0.84024

−0.7818

2016

−0.09315

1.15106

2007

−0.73482

−0.68295

2017

0.10806

1.25465

2008

−0.63662

−0.58125

2018

0.30226

1.36945

2009

−0.64634

−0.40865

2019

0.64023

1.43087

2010

−0.47181

−0.33905

2020

0.76138

1.6831

2011

−0.28274

−0.16029

2021

2.41555

−1.37729

2012

−0.19837

0.04827

2022

2.66315

−1.42228

Table 8. Comprehensive scores

8. 综合得分

年份

综合得分

年份

综合得分

2003

−0.98

2013

−0.02

2004

−0.91

2014

0.1

2005

−0.88

2015

0.17

2006

−0.83

2016

0.23

2007

−0.72

2017

0.41

2008

−0.62

2018

0.58

2009

−0.58

2019

0.85

2010

−0.44

2020

1

2011

−0.25

2021

1.43

2012

−0.13

2022

1.6

表8综合得分可以看出,湖南省经济发展水平逐年提升,尤其是2018年到2021年,湖南省的经济水平处于高速发展期。

2. 霍尔特线性趋势模型预测

2.1. 模型构建

1) 数据与模型准备

本研究针对表8的数据进行建模预测。由时序图(图2)可以看出数据呈现明显线性趋势,适用于霍尔特线性趋势模型。通过R语言的ts函数将得分数据转换为时间序列数据data_ts (起始时间2003年,频率1)。

Figure 2. Time series plot of raw data

2. 原始数据时序图

2) 模型构建

霍尔特线性趋势模型是本预测过程的核心。其基本公式为

水平方程:

L t =α y t +( 1α )( L t1 + b t1 ) (2-1)

(其中 L t 表示在 t 时刻时间序列的水平估计值,是时间序列在 t 时刻的观测值, α 是水平的平滑参数 0α1 )。

趋势方程:

b t =β( L t L t1 )+( 1β ) b t1 (2-2)

(其中 b t 表示在 t 时刻时间序列的趋势(斜率)估计值, β 是趋势的平滑参数( 0β1 ))。

预测方程:

Y t+h = L t + b t ×h (2-3)

(其中 Y h+t 是在未来 h 期的预测值, L t 是当前水平, b t 是当前趋势)。

通过R语言中holt函数构建模型,如model ← holt (data_ts, h = 7) (h = 7表示预测未来7期)。在模型构建过程中,首先需要对水平 L t 和趋势 b t 进行初始化。假设初始水平 L t 和初始趋势 b t 的值,然后对于每一个时间点 t ,按照水平方程计算水平值,按照趋势方程计算趋势值。通过model_state ← model$state获取水平 L t 与趋势 b t 的参数,模型在拟合过程中基于数据得到合适的 L t b t 值,从而依据公式得到 Y h+t 的值。

2.2. 模型检验结果

根据图3得出,残差以零为中心随机散布,无明显的规律或趋势性,表明模型拟合效果良好。

Figure 3. Residuals

3. 残差

根据图4得出,随着滞后期数的增加,自相关系数快速下降并趋于零,表明无显著自相关。

Figure 4. Residual autocorrelation plot

4. 残差自相关图

在进行Ljung-Box检验时,通过Box.test函数进行检验,设置滞后阶数lag = 10,类型为“Ljung-Box”。得到P值为0.684927大于0.05,残差序列表现出随机性,模型具有一定的合理性。

2.3. 预测结果

未来5年的预测得分,分别为1.914973、2.193798、2.472623、2.751448、3.030273。

为了更直观地展示预测结果,通过R语言绘制可视化图(图5)。蓝色散点为实际值,红色折线为拟合值,绿色虚线为预测值。

Figure 5. Visualization of forecast results from the Holt’s linear trend model

5. 霍尔特线性趋势模型预测结果可视化图

2.4. 小结

预测结果表明未来五年湖南省的经济发展水平稳步提高,这一预测结果与过去二十年湖南省的经济发展趋势吻合,说明湖南省的主要产业,对外贸易等方面在未来还有巨大的发展空间。

3. 线性核支持向量回归模型预测

3.1. 模型构建与预测

本研究针对表8的数据进行建模预测。数据呈现明显的线性上升趋势,与其他预测模型相比,线性核支持向量回归模型更适用于小样本、线性数据,可以初步判断该数据更适用于线性核支持向量回归模型[4]

基于线性核支持向量回归构建预测模型,其核心参数配置如下:

核函数:线性核 K( x i , x j )= x i T x j ,捕捉线性增长模式;

正则化参数: C=1 ,平衡模型复杂度与泛化能力;

不敏感阈值: ε=0.1 ,允许预测值与实际值存在轻微偏差。

使用R语言中svm函数构建支持向量回归模型,通过predict函数得到预测值,并将预测值添加到数据框中的新列predicted中。模型根据已学习到的历史数据规律对未来五年的综合得分进行预测,预测结果显示得分持续增长(表9图6)。

Table 9. Prediction results of support vector regression

9. 支持向量回归预测结果

年份

预测值

年增长率

2023

1.248794

2024

1.368140

9.557%

2025

1.487487

8.723%

2026

1.606834

8.023%

2027

1.726181

7.427%

Figure 6. Visualization of prediction results from support vector regression

6. 支持向量回归预测结果可视化图

3.2. 残差分析

残差分布特征(图7)显示:

Figure 7. Residual plot

7. 残差图

波动范围:[−0.1979398,0.470553],标准差0.1795333,表明预测误差集中,大部分误差都在这个较小的范围内波动。

分布对称性:中位数−0.06630656,接近零值线,说明残差分布无显著偏态,即预测值在实际值上下的偏差较为均匀。

随机性检验:残差随年份无周期性或趋势性变化,符合模型假设,这意味着模型的预测误差是随机的,不存在系统性的偏差。

3.3. 评价指标

1) 均方误差(MSE)

先计算预测值与实际值的残差,再根据公式

MSE= 1 n i=1 n ( y i y ^ i ) 2 (3-1)

( n 为数据点数量, y i 是实际值, y ^ i 是预测值)。

在R语言计算,MSE为0.0306287。说明预测误差平方的均值很小,模型对数据的拟合效果很好。

2) 平均绝对误差(MAE):依据公式

MAE= 1 n i=1 n | y i y ^ i | (3-2)

( n 为数据点数量, y i 是实际值, y ^ i 是预测值)。

在R语言计算,MAE为0.1336206。说明预测值与实际值的绝对误差仅为0.1336206个单位,模型的预测精度较高。

3) 近似决定系数(R2)

在R语言计算,近似R2值为0.948。说明模型可解释94.8%的数据变异,拟合程度高。

通过上述检验可知,该支持向量回归模型在预测综合得分方面具有很高的准确性和可靠性。说明模型能够很好地拟合历史数据并且对未来数据有较好的预测能力。

3.4. 小结

线性核支持向量回归模型对湖南省经济发展水平的预测呈现出线性的增长趋势,具有合理的MSE、MAE,较高的R2,能够很好地对过去进行拟合,对未来进行预测,具有一定的准确性和可靠性。

本文在拟合湖南省经济发展水平预测时,霍尔特线性趋势模型未来7年的综合得分由1.91线性上升至3.59,残差波动范围在−0.12~0.15,Ljung-Box检验P值为0.685,有较高的可靠性。

从以上对比可以看出,两种预测模型各具优势,霍尔特线性趋势模型的预测值较大,线性核支持向量回归预测值相对较小,但显示未来几年的综合得分会逐年上涨。这表明在未来10年湖南省有巨大的经济提升空间。

4. 结论与建议

4.1. 结论

通过因子分析,经济发展综合因子反映湖南省经济规模扩张与全球化参与度。2003~2022年,湖南省进出口总额从37.6亿美元增至705.2亿美元,年均增长15.8%,外贸依存度从8.3%提升至14.6%。第三产业占比从38.2%升至49.7%,产业结构实现“二三一”向“三二一”转型。说明湖南省整体产业发展稳步提升。经济活力与外资利用因子体现政府对经济发展的投入力度以及对外招商引资的重视程度。2022年湖南省实际利用外资23.8亿美元,中部六省排名第三;地方财政收入突破3000亿元,但财政自给率仅45.3%,低于全国平均水平12个百分点。说明湖南省在财政和外资利用方面还有很大的提升空间。

霍尔特线性趋势模型预测结果与线性核支持向量回归预测结果有所不同,两种预测结果都表明湖南省未来的经济发展水平呈现上升趋势,前者预测值更高,后者更加稳健。这一结论说明湖南省在主要产业、对外贸易、财政投入和对外招商引资等方面有着巨大的潜力。

4.2. 建议

一是产业结构优化。聚焦工程机械、轨道交通装备两大核心产业,引导外资与本土企业共建“数字化工厂”推动产业向“智能装备 + 服务”转型。围绕新能源、电子信息、新材料领域布局“新兴产业先导群”,联合高校建设专业实验室,推进科研成果本地转化。

二是创新驱动发展。政府应加大科技创新投入,激发创新潜能;设立专项人才资金,专注于吸引与培育高层次的创新人才。此外,联合省内高校开设核心产业定向班,缓解技能型、创新型人才短缺问题。设立专利一站式服务平台,保护创新主体合法权益。

三是区域协调发展。加强长株潭城市带辐射作用,引导配套产业向周边城市转移,推动共同发展。推进农村基础设施升级,如农业用品补贴、公路改造、5G网络全覆盖等降低农业生产与农产品运输成本,支撑农村电商发展。

四是对外开放合作。出台优惠政策吸引外资投入,设立招商引资专项资金,对引进重大项目的,予以奖励。加强投资环境的建设,推动国际产能合作,支持企业参加国际展会,拓展高端市场。鼓励企业建设海外生产基地,拓展国际市场。

基金项目

河南省高等学校重点科研项目25B110027。

NOTES

*通讯作者。

参考文献

[1] 郜付敏, 王佳慧, 马琳琳. 郑州市经济发展特征的因子分析[J]. 市场论坛, 2024(7): 22-27.
[2] Kapoor, S., Anil, K. and Misra, A. (2010) Dividend Policy Determinants of Indian FMCG Sector: A Factorial Analysis. Journal of Modern Accounting and Auditing, 6, 22-35.
[3] 唐贤芳, 吕亚荣, 刘旭剑. 基于因子分析的陕西省各市经济发展状况实证分析[J]. 价值工程, 2023, 42(23): 4-6.
[4] 黄龙山. 基于SVM算法的电力物资采购价格预测研究[J]. 中国新技术新产品, 2023(21): 126-129.