1. 因子分析
1.1. 模型的构建
使用因子分析法探讨湖南省经济发展情况时,本文选取第一、二、三产业产值、人均可支配收入、人均消费支出、地方一般公共预算收入、出口总额、进口总额、实际使用外资金额作为指标构建模型。
通过上述指标构建湖南省经济发展水平因子分析的指标体系[1]。
1.2. 数据来源
本研究数据来源于《湖南省统计年鉴》《中国统计年鉴》。包括了2003年至2022年的多个经济指标,如表1、表2,包括第一产业、第二产业、第三产业、进出口额等。
Table 1. Economic indicators of Hunan Province (1)
表1. 湖南省经济指标(1)
年份 |
第一产业(亿元) |
第二产业(亿元) |
第三产业(亿元) |
人均可支配收入(元) |
人均消费支出(元) |
2003 |
869.68 |
1772.29 |
2017.98 |
7674.2 |
6082.6 |
2004 |
1022.45 |
2135.55 |
2384.62 |
8617.5 |
6884.6 |
2005 |
1078.34 |
2490.17 |
2801.36 |
9524 |
7505 |
2006 |
1244.63 |
3030.72 |
3156.2 |
10504.7 |
8169.3 |
2007 |
1563.81 |
3867.42 |
3854.22 |
12293.5 |
8990.7 |
2008 |
1761.78 |
4870.03 |
4675.56 |
13821.2 |
9945.5 |
2009 |
1795.8 |
5494.66 |
5482.34 |
15084.3 |
10828.2 |
2010 |
2073.19 |
7034.7 |
6466.43 |
16565.7 |
11825.3 |
2011 |
2420 |
8883.59 |
7611.37 |
18844.1 |
13402.9 |
2012 |
2567.85 |
9926.66 |
8712.72 |
22172.8 |
14609 |
2013 |
2589.18 |
10913.8 |
10042.26 |
24352 |
16867.3 |
2014 |
2671.01 |
11825.12 |
11385.15 |
26570.2 |
18334.7 |
2015 |
2747.91 |
12665.72 |
13124.97 |
28838.1 |
19501.4 |
2016 |
2915.58 |
12941.99 |
14995.88 |
31283.9 |
21420 |
2017 |
2998.4 |
13459.82 |
17369.89 |
33947.9 |
23162.6 |
2018 |
3084.18 |
13904.11 |
19341.39 |
36698.3 |
25064.2 |
2019 |
3647.23 |
15401.7 |
20845.21 |
39841.9 |
26924 |
2020 |
4240.73 |
15949.19 |
21352.65 |
41697.5 |
26796.4 |
2021 |
4323.04 |
17852.53 |
23537.88 |
44866.1 |
28293.8 |
2022 |
4602.73 |
19182.58 |
24885.06 |
47301.2 |
29580.1 |
Table 2. Economic indicators of Hunan Province (2)
表2. 湖南省经济指标(2)
年份 |
地方一般公共预算收入(亿元) |
出口总额(万美元) |
进口总额(万美元) |
实际使用外资金额(万美元) |
2003 |
268.65 |
214,626 |
158,990 |
148,907 |
2004 |
320.63 |
309,778 |
233,996 |
141,806 |
2005 |
395.27 |
374,667 |
225,818 |
207,235 |
2006 |
477.93 |
509,401 |
225,858 |
259,335 |
2007 |
606.55 |
652,342 |
316,645 |
327,051 |
2008 |
722.71 |
840,950 |
415,634 |
400,515 |
2009 |
847.62 |
549,189 |
465,912 |
459,787 |
2010 |
1081.69 |
795,487 |
673,399 |
518,441 |
2011 |
1517.07 |
989,747 |
910,259 |
615,031 |
2012 |
1782.16 |
1,259,965 |
934,117 |
728,034 |
2013 |
2030.88 |
1,482,083 |
1,034,356 |
870,482 |
2014 |
2262.79 |
2,002,348 |
1,100,380 |
1,026,585 |
2015 |
2515.43 |
1,917,288 |
1,019,392 |
1,156,441 |
2016 |
2697.88 |
1,817,002 |
870,968 |
1,285,209 |
2017 |
2757.82 |
2,317,175 |
1,286,776 |
1,447,489 |
2018 |
2860.84 |
3,057,434 |
1,595,550 |
1,619,134 |
2019 |
3007.15 |
4,453,465 |
1,834,729 |
1,810,127 |
2020 |
3008.66 |
4,782,488 |
2,285,353 |
2,099,782 |
2021 |
3250.69 |
6,523,609 |
2,747,877 |
241,490 |
2022 |
3101.76 |
7,699,229 |
2,844,124 |
352,761 |
1.3. 模型的检验
通过KMO和巴特利特球形度检验,评估数据的适用性。表3的检验结果显示,KMO值为0.838,超出0.6的临界标准,表明变量间共同度高;巴特利特球形度检验近似卡方值达532.982 (自由度36),其显著性水平远低于0.05,表明变量间存在显著相关性,数据适用于因子分析。
Table 3. KMO and Bartlett’s test
表3. KMO和巴特利特检验
KMO和巴特利特检验 |
KMO取样适切性量数。 |
0.838 |
巴特利特球形度检验 |
近似卡方 |
532.982 |
自由度 |
36 |
显著性 |
.000 |
1.4. 公因子提取
根据总方差解释表(表4)与碎石图(图1),提取两个公因子。从表4看出,两因子累积贡献率达98.146%。其中,第一公因子贡献率为72.698%,第二公因子为25.448%,说明这两大因子能够全面反映原始数据的主要信息。
Figure 1. Scree plot
图1. 碎石图
Table 4. Total variance explained
表4. 总方差解释
总方差解释 |
成分 |
初始特征值 |
提取载荷平方和 |
旋转载荷平方和 |
总计 |
方差百分比 |
累积% |
总计 |
方差百分比 |
累积% |
总计 |
方差百分比 |
累积% |
1 |
8.044 |
89.379 |
89.379 |
8.044 |
89.379 |
89.379 |
6.543 |
72.698 |
72.698 |
2 |
0.789 |
8.767 |
98.146 |
0.789 |
8.767 |
98.146 |
2.290 |
25.448 |
98.146 |
3 |
0.103 |
1.145 |
99.291 |
|
|
|
|
|
|
4 |
0.045 |
0.497 |
99.788 |
|
|
|
|
|
|
5 |
0.011 |
0.117 |
99.905 |
|
|
|
|
|
|
6 |
0.006 |
0.067 |
99.972 |
|
|
|
|
|
|
7 |
0.002 |
0.018 |
99.990 |
|
|
|
|
|
|
8 |
0.001 |
0.006 |
99.996 |
|
|
|
|
|
|
9 |
0.000 |
0.004 |
100.000 |
|
|
|
|
|
|
提取方法:主成分分析法。
1.5. 因子旋转与因子解释
采用最大方差正交旋转法得到旋转后的成分矩阵(表5),对两个公因子进行解释。
Table 5. Rotated component matrix
表5. 旋转后的成分矩阵
旋转后的成分矩阵a |
|
成分 |
1 |
2 |
第一产业(亿元) |
0.912 |
0.381 |
第二产业(亿元) |
0.876 |
0.458 |
第三产业(亿元) |
0.895 |
0.433 |
人均可支配收入(元) |
0.895 |
0.444 |
人均消费支出(元) |
0.869 |
0.490 |
地方一般公共预算收入(亿元) |
0.804 |
0.569 |
出口总额(万美元) |
0.980 |
0.097 |
进口总额(万美元) |
0.965 |
0.219 |
实际使用外资金额(万美元) |
0.224 |
0.964 |
根据表5,本文提取了两个具有代表性的因子,以合理地反映经济发展的多维度特征。具体如下:
因子1 (经济发展综合因子):包括了第一、二、三产业产值及进出口额,反映了湖南省的产业结构和对外贸易水平,体现了湖南省经济发展总体体量。
因子2 (经济活力与外资利用因子):包括人均可支配收入、人均消费支出、地方一般公共预算收入及实际使用外资金额,反映了居民生活水平和经济活力,体现外资贡献度,反映政府对经济发展的支持程度[2]。
1.6. 因子得分的计算
由SPSS分析得到表6。
Table 6. Component score coefficient matrix
表6. 成分得分系数矩阵
成分得分系数矩阵 |
|
成分 |
1 |
2 |
第一产业(亿元) |
0.152 |
−0.029 |
第二产业(亿元) |
0.104 |
0.066 |
第三产业(亿元) |
0.122 |
0.032 |
人均可支配收入(元) |
0.117 |
0.044 |
人均消费支出(元) |
0.087 |
0.103 |
地方一般公共预算收入(亿元) |
0.027 |
0.214 |
出口总额(万美元) |
0.308 |
−0.353 |
进口总额(万美元) |
0.247 |
−0.221 |
实际使用外资金额(万美元) |
−0.366 |
0.890 |
提取方法:主成分分析法。旋转方法:凯撒正态化最大方差法。组件得分。
由得分系数矩阵我们可以得出因子表达式如下:
(1-1)
(1-2)
(1-3)
(
:第一产业(亿元),
:第二产业(亿元),
:第三产业(亿元),
:人均可支配收入(元),
:人均消费支出(元),
:地方一般公共预算收入(亿元),
:出口总额(万美元),
:进口总额(万美元),
:实际使用外资金额(万美元))。
通过计算可得F1得分,F2得分以及综合得分如下[3] (表7和表8):
Table 7. F1 scores and F2 scores
表7. F1得分,F2得分
年份 |
F1得分 |
F2得分 |
年份 |
F1得分 |
F2得分 |
2003 |
−0.98213 |
−0.96647 |
2013 |
−0.13007 |
0.29802 |
2004 |
−0.88945 |
−0.98725 |
2014 |
−0.03901 |
0.51223 |
2005 |
−0.88467 |
−0.86851 |
2015 |
−0.06123 |
0.82814 |
2006 |
−0.84024 |
−0.7818 |
2016 |
−0.09315 |
1.15106 |
2007 |
−0.73482 |
−0.68295 |
2017 |
0.10806 |
1.25465 |
2008 |
−0.63662 |
−0.58125 |
2018 |
0.30226 |
1.36945 |
2009 |
−0.64634 |
−0.40865 |
2019 |
0.64023 |
1.43087 |
2010 |
−0.47181 |
−0.33905 |
2020 |
0.76138 |
1.6831 |
2011 |
−0.28274 |
−0.16029 |
2021 |
2.41555 |
−1.37729 |
2012 |
−0.19837 |
0.04827 |
2022 |
2.66315 |
−1.42228 |
Table 8. Comprehensive scores
表8. 综合得分
年份 |
综合得分 |
年份 |
综合得分 |
2003 |
−0.98 |
2013 |
−0.02 |
2004 |
−0.91 |
2014 |
0.1 |
2005 |
−0.88 |
2015 |
0.17 |
2006 |
−0.83 |
2016 |
0.23 |
2007 |
−0.72 |
2017 |
0.41 |
2008 |
−0.62 |
2018 |
0.58 |
2009 |
−0.58 |
2019 |
0.85 |
2010 |
−0.44 |
2020 |
1 |
2011 |
−0.25 |
2021 |
1.43 |
2012 |
−0.13 |
2022 |
1.6 |
从表8综合得分可以看出,湖南省经济发展水平逐年提升,尤其是2018年到2021年,湖南省的经济水平处于高速发展期。
2. 霍尔特线性趋势模型预测
2.1. 模型构建
1) 数据与模型准备
本研究针对表8的数据进行建模预测。由时序图(图2)可以看出数据呈现明显线性趋势,适用于霍尔特线性趋势模型。通过R语言的ts函数将得分数据转换为时间序列数据data_ts (起始时间2003年,频率1)。
Figure 2. Time series plot of raw data
图2. 原始数据时序图
2) 模型构建
霍尔特线性趋势模型是本预测过程的核心。其基本公式为
水平方程:
(2-1)
(其中
表示在
时刻时间序列的水平估计值,是时间序列在
时刻的观测值,
是水平的平滑参数
)。
趋势方程:
(2-2)
(其中
表示在
时刻时间序列的趋势(斜率)估计值,
是趋势的平滑参数(
))。
预测方程:
(2-3)
(其中
是在未来
期的预测值,
是当前水平,
是当前趋势)。
通过R语言中holt函数构建模型,如model ← holt (data_ts, h = 7) (h = 7表示预测未来7期)。在模型构建过程中,首先需要对水平
和趋势
进行初始化。假设初始水平
和初始趋势
的值,然后对于每一个时间点
,按照水平方程计算水平值,按照趋势方程计算趋势值。通过model_state ← model$state获取水平
与趋势
的参数,模型在拟合过程中基于数据得到合适的
和
值,从而依据公式得到
的值。
2.2. 模型检验结果
根据图3得出,残差以零为中心随机散布,无明显的规律或趋势性,表明模型拟合效果良好。
Figure 3. Residuals
图3. 残差
根据图4得出,随着滞后期数的增加,自相关系数快速下降并趋于零,表明无显著自相关。
Figure 4. Residual autocorrelation plot
图4. 残差自相关图
在进行Ljung-Box检验时,通过Box.test函数进行检验,设置滞后阶数lag = 10,类型为“Ljung-Box”。得到P值为0.684927大于0.05,残差序列表现出随机性,模型具有一定的合理性。
2.3. 预测结果
未来5年的预测得分,分别为1.914973、2.193798、2.472623、2.751448、3.030273。
为了更直观地展示预测结果,通过R语言绘制可视化图(图5)。蓝色散点为实际值,红色折线为拟合值,绿色虚线为预测值。
Figure 5. Visualization of forecast results from the Holt’s linear trend model
图5. 霍尔特线性趋势模型预测结果可视化图
2.4. 小结
预测结果表明未来五年湖南省的经济发展水平稳步提高,这一预测结果与过去二十年湖南省的经济发展趋势吻合,说明湖南省的主要产业,对外贸易等方面在未来还有巨大的发展空间。
3. 线性核支持向量回归模型预测
3.1. 模型构建与预测
本研究针对表8的数据进行建模预测。数据呈现明显的线性上升趋势,与其他预测模型相比,线性核支持向量回归模型更适用于小样本、线性数据,可以初步判断该数据更适用于线性核支持向量回归模型[4]。
基于线性核支持向量回归构建预测模型,其核心参数配置如下:
核函数:线性核
,捕捉线性增长模式;
正则化参数:
,平衡模型复杂度与泛化能力;
不敏感阈值:
,允许预测值与实际值存在轻微偏差。
使用R语言中svm函数构建支持向量回归模型,通过predict函数得到预测值,并将预测值添加到数据框中的新列predicted中。模型根据已学习到的历史数据规律对未来五年的综合得分进行预测,预测结果显示得分持续增长(表9,图6)。
Table 9. Prediction results of support vector regression
表9. 支持向量回归预测结果
年份 |
预测值 |
年增长率 |
2023 |
1.248794 |
|
2024 |
1.368140 |
9.557% |
2025 |
1.487487 |
8.723% |
2026 |
1.606834 |
8.023% |
2027 |
1.726181 |
7.427% |
Figure 6. Visualization of prediction results from support vector regression
图6. 支持向量回归预测结果可视化图
3.2. 残差分析
残差分布特征(图7)显示:
Figure 7. Residual plot
图7. 残差图
波动范围:[−0.1979398,0.470553],标准差0.1795333,表明预测误差集中,大部分误差都在这个较小的范围内波动。
分布对称性:中位数−0.06630656,接近零值线,说明残差分布无显著偏态,即预测值在实际值上下的偏差较为均匀。
随机性检验:残差随年份无周期性或趋势性变化,符合模型假设,这意味着模型的预测误差是随机的,不存在系统性的偏差。
3.3. 评价指标
1) 均方误差(MSE)
先计算预测值与实际值的残差,再根据公式
(3-1)
(
为数据点数量,
是实际值,
是预测值)。
在R语言计算,MSE为0.0306287。说明预测误差平方的均值很小,模型对数据的拟合效果很好。
2) 平均绝对误差(MAE):依据公式
(3-2)
(
为数据点数量,
是实际值,
是预测值)。
在R语言计算,MAE为0.1336206。说明预测值与实际值的绝对误差仅为0.1336206个单位,模型的预测精度较高。
3) 近似决定系数(R2)
在R语言计算,近似R2值为0.948。说明模型可解释94.8%的数据变异,拟合程度高。
通过上述检验可知,该支持向量回归模型在预测综合得分方面具有很高的准确性和可靠性。说明模型能够很好地拟合历史数据并且对未来数据有较好的预测能力。
3.4. 小结
线性核支持向量回归模型对湖南省经济发展水平的预测呈现出线性的增长趋势,具有合理的MSE、MAE,较高的R2,能够很好地对过去进行拟合,对未来进行预测,具有一定的准确性和可靠性。
本文在拟合湖南省经济发展水平预测时,霍尔特线性趋势模型未来7年的综合得分由1.91线性上升至3.59,残差波动范围在−0.12~0.15,Ljung-Box检验P值为0.685,有较高的可靠性。
从以上对比可以看出,两种预测模型各具优势,霍尔特线性趋势模型的预测值较大,线性核支持向量回归预测值相对较小,但显示未来几年的综合得分会逐年上涨。这表明在未来10年湖南省有巨大的经济提升空间。
4. 结论与建议
4.1. 结论
通过因子分析,经济发展综合因子反映湖南省经济规模扩张与全球化参与度。2003~2022年,湖南省进出口总额从37.6亿美元增至705.2亿美元,年均增长15.8%,外贸依存度从8.3%提升至14.6%。第三产业占比从38.2%升至49.7%,产业结构实现“二三一”向“三二一”转型。说明湖南省整体产业发展稳步提升。经济活力与外资利用因子体现政府对经济发展的投入力度以及对外招商引资的重视程度。2022年湖南省实际利用外资23.8亿美元,中部六省排名第三;地方财政收入突破3000亿元,但财政自给率仅45.3%,低于全国平均水平12个百分点。说明湖南省在财政和外资利用方面还有很大的提升空间。
霍尔特线性趋势模型预测结果与线性核支持向量回归预测结果有所不同,两种预测结果都表明湖南省未来的经济发展水平呈现上升趋势,前者预测值更高,后者更加稳健。这一结论说明湖南省在主要产业、对外贸易、财政投入和对外招商引资等方面有着巨大的潜力。
4.2. 建议
一是产业结构优化。聚焦工程机械、轨道交通装备两大核心产业,引导外资与本土企业共建“数字化工厂”推动产业向“智能装备 + 服务”转型。围绕新能源、电子信息、新材料领域布局“新兴产业先导群”,联合高校建设专业实验室,推进科研成果本地转化。
二是创新驱动发展。政府应加大科技创新投入,激发创新潜能;设立专项人才资金,专注于吸引与培育高层次的创新人才。此外,联合省内高校开设核心产业定向班,缓解技能型、创新型人才短缺问题。设立专利一站式服务平台,保护创新主体合法权益。
三是区域协调发展。加强长株潭城市带辐射作用,引导配套产业向周边城市转移,推动共同发展。推进农村基础设施升级,如农业用品补贴、公路改造、5G网络全覆盖等降低农业生产与农产品运输成本,支撑农村电商发展。
四是对外开放合作。出台优惠政策吸引外资投入,设立招商引资专项资金,对引进重大项目的,予以奖励。加强投资环境的建设,推动国际产能合作,支持企业参加国际展会,拓展高端市场。鼓励企业建设海外生产基地,拓展国际市场。
基金项目
河南省高等学校重点科研项目25B110027。
NOTES
*通讯作者。