基于主成分分析的乌什县综合实力对比分析
Comparative Analysis of the Comprehensive Strength of Wushi County Based on Principal Component Analysis
DOI: 10.12677/sa.2025.141028, PDF, HTML, XML,    科研立项经费支持
作者: 秦安省, 谢成滨, 张佳玲, 韩 柳*:新疆理工学院理学院,新疆 阿克苏
关键词: 主成分分析法综合实力乌什县Principal Component Analysis Method Comprehensive Strength Wushi County
摘要: 本文利用多元统计分析的主成分分析原理,对乌什县综合实力进行对比分析。通过选取乌什县2010~2019年综合实力指标,得到乌什县综合实力的排名及分析结果,并指出乌什县经济发展的差距和不平衡的原因,进而给出了相应的政策参考。
Abstract: This paper uses the principal component analysis principle of multivariate statistical analysis to conduct a comparative analysis of the comprehensive strength of Wushi County. By selecting the comprehensive strength indicators of Wushi County from 2010 to 2019, the ranking and analysis results of the comprehensive strength of Wushi County are obtained, and the reasons for the gap and imbalance in the economic development of Wushi County are pointed out, and then the corresponding policy references are given.
文章引用:秦安省, 谢成滨, 张佳玲, 韩柳. 基于主成分分析的乌什县综合实力对比分析[J]. 统计学与应用, 2025, 14(1): 291-297. https://doi.org/10.12677/sa.2025.141028

1. 引言

乌什县地处新疆阿克苏地区,拥有独特的地理区位、丰富的自然资源和深厚的历史文化底蕴,作为新疆阿克苏地区的重要县域,其经济发展对于地区稳定和人民生活水平的提升起着至关重要的作用。对乌什县进行综合实力对比研究分析,有助于准确把握其发展现状、优势与不足,为制定科学合理的发展战略提供有力依据。通过主成分分析对乌什县的综合实力进行对比分析,可以深入了解其经济发展的优势与不足,主成分分析作为一种有效的多元统计方法,可以将多个相关变量转化为少数几个综合指标从而更直观地反映地区的经济实力差异,为制定科学合理的经济发展策略提供有力依据。

2. 数据来源及研究方法

2.1. 综合实力指标体系的构建

综合实力通常涉及一个地区多个方面,是一个地区总体发展能力和水平的体现,本文根据2010~2019年新疆阿克苏乌什县统计年鉴,选取阿克苏地区乌什县的7个指标。主要包括了指标 X 1 :地区生产总值(万元), X 2 :地区财政收入(亿元), X 3 :社会固定资产投资(万元), X 4 :牧渔业(万元), X 5 :建筑业(万元), X 6 :年末人口总数(万人), X 7 :人均收入(元)。

2.2. 主成分分析方法

主成分分析法[1]就是利用降维的思想,在缺少很少的信息的前提下把多个指标转化为几个综合指标的多元统计方法。转化生成的综合指标[2]称之为主成分,其中每个主成分都是原始变量的线性组合[3],且各个主成分之间互不相关,这就使得主成分比原始变量具有某些更优越的性能。其原理和步骤如下:

假设有n个样本,每个样本有p个指标: x 1 , x 2 ,, x p ,得到原始数据观测矩阵:

X n×p =( x 11 x 12 x 1p x 21 x 22 x 2p x n1 x n2 x np )

综合指标为 F 1 , F 2 ,, F m ( mp ) ,即

{ F 1 = a 11 x 1 + a 21 x 2 ++ a p1 x p F 2 = a 12 x 1 + a 22 x 2 ++ a p2 x p F m = a 1m x 1 + a 2m x 2 ++ a pm x p

(1) 由于本文所选指标各自有着不同的含义,为了提升这些指标的聚合度,我们对其进行了标准化处理,具体的标准化形式为:

x ij = ( x ij x ¯ i )/ σ i ( i=1,2,,n;j=1,2,,p )

(2) 计算相关系数矩阵 R n×n ,其中:

r ij = 1 n k=1 n ( x ki x ¯ i ) ( x kj x ¯ j )/ σ i σ j

(3) 计算 R n×n 的特征值和特征向量。通过计算 RλI=0 ,得出特征值 λ i ,且使 λ 1 λ 2 λ n ,同时可得对应的特征向量 μ 1 , μ 2 ,, μ n 。他们标准正交。

(4) 计算主成分

F j = j=1 p i=1 n u ij x ij

(5) 综合分析。为了有效概括并保留数据的绝大部分信息,我们通常选择利用前m个主成分来替代原始数据的总方差。这一决策的依据在于累计贡献率的评估标准,具体而言,当累计贡献率达到或超过80%时,即可确定合适的m值。随后,我们将针对这前m个主成分进行深入的综合分析。

(6) 计算综合得分,第i个地区第k个主成分得分:

s ik = j=1 p u jk x ij , k=1,2,,m;i=1,2,,n

i个地区的综合得分[4] [5]

SOCR E i = k=1 m e k s ik ; i=1,2,,n

3. 实证分析

3.1. 数据的检验

通过采用SPSS软件进行检验,如表1所示,本文得出的KMO值大于0.5,同时Bartlett球形度检验的显著性水平(Sig值)为0.000,这一结果表明数据适宜进行主成分分析。

Table 1. KMO and Bartlett test

1. KMO和巴特利特检验

KMO取样适切性量数

0.683

巴特利特球形度检验

近似卡方

56.920

自由度

21

显著性

0.000

结果显示,近似卡方值为56.920,自由度为21,显著性水平 p0.000 表明相关显著偏离单位矩阵,变量之间具有显著相关性,KMO取样适切性量数用于评估样本数据适合进行因子分析或主成分分析的程度KMO值为0.683,表示数据适合进行主成分分析。因此,本文采用主成分分析法进行研究。

3.2. 原始数据标准化处理

对选取的各项经济指标数据进行标准化处理[6],消除量纲差异,使不同指标具有可比性。通过SPSS软件,对数据进行标准化处理,如表2

Table 2. Standardized data on comprehensive strength of Wushi County from 2010 to 2019

2. 乌什县2010~2019年综合实力标准化数据

年份

X1

X2

X3

X4

X5

X6

X7

2011

−1.13486

−1.28214

−1.62652

−1.55889

−0.64279

−1.94251

−1.44541

2012

−1.05939

−0.47076

−0.97325

−1.12140

−0.33906

0.32393

−0.97481

2013

−0.15127

−0.29725

−0.62649

0.65399

0.29328

−1.37296

−0.58060

2014

1.05295

−0.81692

−0.31327

1.39460

1.46021

−0.16251

−0.33660

2015

0.89970

−0.41307

0.21407

0.81351

0.70886

0.86133

−0.32429

2016

0.96209

−0.24107

0.74114

0.82729

0.65197

0.44122

0.22566

2017

1.06620

0.50267

1.66883

0.01976

0.65475

0.91072

0.68522

2018

−1.17059

1.09602

0.21545

−0.69309

−1.47452

0.50034

1.15073

2019

−0.46482

1.92252

0.70003

−0.33577

−1.31270

0.44044

1.60011

3.3. 计算指标的相关性矩阵

计算标准化后数据的相关系数矩阵[7],以了解各指标之间的相关性(表3)。

Table 3. Correlation matrix

3. 相关性矩阵

X1

X2

X3

X4

X5

X6

X7

相关性

X1

1.000

−0.138

0.594

0.855

0.860

0.410

0.121

X2

−0.138

1.000

0.642

−0.092

−0.570

0.534

0.940

X3

0.594

0.642

1.000

0.402

0.153

0.775

0.797

X4

0.855

−0.092

0.402

1.000

0.775

0.266

0.137

X5

0.860

−0.570

0.153

0.775

1.000

0.085

−0.354

X6

0.410

0.534

0.775

0.266

0.085

1.000

0.634

X7

0.121

0.940

0.797

0.137

−0.354

0.634

1.000

3.4. 计算特征值及贡献率

表4可知,第一个主成分的累积贡献率[8]为49.219%,第二个主成分的累积贡献率为89.776%,可以代表绝大部分信息,我们选择第一个变量和第二个变量作为主成分代表原来的7个变量。

表5可知,第一主成分在地区生产总值,地区财政收入,社会固定资产投资,牧渔业,年末人口总数,人均收入上有着较大负荷,分别为0.644、0.620、0.955、0.578、0.827、0.794,记为y1成分,第二主成分在地区生产总值,牧渔业建筑业上有着较大负荷,分别为0.728、0.696、0.959,记为y2成分。

3.5. 计算得分系数

用成分矩阵中的主成分矩阵向量除以主成分相对的特征值[9]的算术平方根[10]得到2个主成分中指标所对应的系数。(表6)

主成分表达式子:

y 1 =0.357 x 1 +0.334 x 2 +0.514 x 3 +0.311 x 4 +0.132 x 5 +0.445 x 6 +0.427 x 7

y 2 =0.432 x 1 0.444 x 2 0.058 x 3 +0.343 x 4 +0.146 x 5 0.085 x 6 0.332 x 7

Table 4. Total variance explained

4. 总方差解释

成分

初始特征值

提取载荷平方和

总计

方差百分比

累积%

总计

方差百分比

累积%

1

3.445

49.219

49.219

3.445

49.219

49.219

2

2.839

40.557

89.776

2.839

40.557

89.776

3

0.447

6.389

96.166

4

0.204

2.916

99.082

5

0.031

0.440

99.522

6

0.018

0.251

99.772

7

0.016

0.228

100.000

Table 5. Ingredient matrix

5. 成分矩阵

成分

1

2

X3

0.955

−0.098

X6

0.827

−0.144

X7

0.794

−0.560

X5

0.246

0.959

X2

0.620

−0.749

X1

0.664

0.728

X4

0.578

0.696

Table 6. Component score coefficient matrix

6. 成分得分系数矩阵

成分

1

2

X1

0.193

0.256

X2

0.180

−0.264

X3

0.277

−0.035

X4

0.168

0.245

X5

0.071

0.338

X6

0.240

−0.051

X7

0.230

−0.197

3.6. 计算综合得分及排序

综合得分公式: y=0.4219 y 1 +0.40557 y 2

Table 7. Comprehensive scores and rankings

7. 综合得分及排序

年份

y1

排名

y2

排名

y

排名

2011

−3.73

9

0.19

5

−1.76

9

2012

−1.71

8

−0.33

7

−0.97

8

2013

−1.10

7

0.68

4

−0.26

6

2014

0.34

6

1.65

1

0.84

3

2015

0.88

4

0.98

2

0.83

4

2016

1.28

3

0.75

3

0.93

2

2017

2.20

1

−0.06

6

1.06

1

2018

0.37

5

−1.88

8

−0.58

7

2019

1.46

2

−1.97

9

−0.08

5

4. 结果分析及发展建议

表7中我们可以看出乌什县的综合得分在2011年至2017年整体呈现上升趋势,但在2018和2019年呈现下降的趋势,且综合得分为负。第一主成分的得分总体呈现上升趋势,但在2018年和2019年时候呈现下降,而第二主成分的得分直接为负,说明在这两年牧渔业和建筑业受影响较大且工业相对薄弱。

优势:乌什县的特色牧渔业资源丰富,在某些产品生产方面具有一定的规模优势和品牌效应。乌什县的旅游资源开发潜力较大,可通过发展旅游业带动相关产业发展,促进经济增长。

劣势:乌什县的建筑业基础相对薄弱,规模以上建筑业企业数量较少,产业集聚效应不明显。乌什县的财政收入相对较低,对经济发展的支撑能力有限。居民收入水平与发达县域相比还有一定差距,城乡收入差距也较为明显。

发展建议

(1) 产业发展方面:致力于强化乌什县的特色牧渔业的发展,增加对其产业化的投资力度,以提升乌什县的牧渔产品的附加价值,并拓宽市场销售的渠道。同时,加速乌什县的建筑业的蓬勃发展,主动引进并培育优质的建筑业企业,以优化产业布局,增强建筑业对经济增长的驱动力。此外,我们将大力推动乌什县的现代服务业的繁荣,特别是旅游、物流及金融等关键领域,旨在全面提升服务业的整体发展水平。

(2) 财政支持方面:不断提升实力,积极争取外界投资以及上级财政支持,加大对基础设施建设、产业发展等方面的投入。

(3) 优化财政支出结构,提高财政资金使用效率。加强税收征管,拓宽财政收入渠道。

(4) 居民增收方面:加大对乌什县农村地区的扶持力度,提高农民收入水平。加强职业技能培训,提高劳动者素质,增加就业机会,提高居民工资性收入。鼓励创业创新,营造良好的创业环境,促进居民经营性收入增长。

5. 结论

本文旨在为新疆乌什县量身打造一套科学合理、切实可行的经济发展策略。在深入借鉴并融合相关经济理论与研究成果的基础上,我们精心构建了一套全面评估乌什县综合实力的指标体系。该体系旨在多层次地衡量乌什县在多个领域的表现与潜力。

随后,我们运用主成分分析法这一科学方法,对乌什县2010年至2019年间的综合实力进行了系统而深入地对比分析。这一方法不仅揭示了乌什县在过去十年间的发展轨迹,还客观反映了其在综合发展方面所取得的成就与面临的挑战。通过数据的深入挖掘与细致比对,我们能够清晰地看到乌什县在经济增长、产业结构优化、社会事业发展等方面的亮点与不足。

基于上述分析结果,我们提出了一系列具有针对性和前瞻性的发展建议。这些建议旨在帮助乌什县充分发挥其独特的自然资源优势、地理区位优势和民族文化优势,同时积极弥补在基础设施建设、人才储备、科技创新等方面的短板。通过精准施策、创新驱动和绿色发展,乌什县有望进一步提升经济实力,增强综合竞争力,实现经济的持续健康发展。

此外,本文所采用的分析方法及其所得出的结论,也为其他地区进行经济实力评估和发展策略制定提供了有益的参考和借鉴。它表明,通过构建科学合理的评价指标体系,并运用先进的数据分析技术,我们可以更加客观、准确地把握一个地区的综合发展态势,从而为其量身定制出更加符合实际、更具操作性的发展策略。这不仅有助于推动乌什县等地区的经济社会发展,也为我国其他地区的可持续发展提供了有益的启示和借鉴。

基金项目

新疆理工学院校级大学生创新训练计划项目(XJ202413558043)。

NOTES

*通讯作者。

参考文献

[1] 龙宇华. 基于影响因子分析的股票选择量化模型的构建策略及实证研究[J]. 中国市场, 2024(30): 21-24.
[2] 易平涛, 于海婷, 李伟伟, 等. 基于综合评价的多指标情境化预测方法与应用[J/OL]. 控制与决策, 1-9.
https://doi.org/10.13195/j.kzyjc.2024.0282, 2025-01-21.
[3] 吴江, 聂晓兵, 杨硕, 贺强, 马坤伟, 陈途. 基于主成分分析模型对富硒竹笋品质的关键成分综合评价[J]. 农产品质量与安全, 2024(5): 25-32.
[4] 张远驰, 胡进, 陈宇, 何冠良. 基于改进广义线性组合的稳健波束形成算法[J]. 舰船科学技术, 2024, 46(18): 122-127.
[5] 潘慧舟, 唐佩丹. 探讨商业生态下快递纸盒标准化处理模式的构建[J]. 造纸信息, 2024(8): 134-136.
[6] 邓贞宙, 赵旭, 易金梅. 相关系数矩阵——非线性可逆网络模型在氧化镥价格预测上的应用[J]. 牡丹江师范学院学报(自然科学版), 2024(3): 1-5.
[7] 谷成龙. 美元国际地位的偏相关性分析及其走势预测模型选择[D]: [硕士学位论文]. 南京: 南京邮电大学, 2023.
[8] 李邯, 周家奇, 刘艳芬, 等. 基于Lab特征值的美国红枫叶片呈色模式分析[J/OL]. 分子植物育种, 1-17.
https://kns.cnki.net/kcms2/article/abstract?v=fAsipVvIRrha956s4uiVy1R8io_T-YLZQOj8hnmh3ncTqyKsoAsNla5nodEtU2VX-i1Ujc-Z9-qGks6iXqMVZY-vrGoXbit7JpJYj9Ji0z74jZAehNQy8_hpRF5F6poAMykI1umR2p25qGC9ChMJpf_f1zCUZpVUY4odMtXHmFAjnXJ1mvaRlc2G_aF3DdHq&uniplatform=NZKPT&language=CHS, 2025-01-21.
[9] 高晗, 蔡国伟, 杨德友, 王丽馨, 杨浩. 基于累积贡献率和可解释人工智能的静态电压稳定裕度估计特征量筛选方法[J]. 电力自动化设备, 2023, 43(4): 168-176.
[10] 用直观教学法促进初中生数感发展——以算数平方根的教学设计为例[C]//全国数学教育研究会, 中国高教学会高等师范教育研究会数学教育会. 全国数学教育研究会2016年国际学术年会论文集. [出版者不详], 2016: 6.