基于因子分析法的全国各地区医疗卫生水平的分析
Analysis of Medical and Health Level in Different Regions of China Based on Factor Analysis
摘要: 自党的十八大以来,党和国家越来越重视人民的卫生健康工作,要求深化医疗健康体制改革,均衡医疗资源,提升人民的卫生健康指数,从而提升人民的生活质量,本文应用因子分析方法探讨全国各地区医疗卫生水平的影响因素,得出了全国各地区医疗卫生水平与医疗卫生资源和经济水平密切相关,且根据全国各地区医疗卫生水平的排名情况,我们发现我国的医疗健康发展仍旧不平衡,还需要各地区重视医疗卫生水平,丰富医疗卫生资源以及重视经济的协同发展。
Abstract: Since the 18th National Congress of the CPC, the Party and the state have attached more and more importance to the people’s health work, requiring deepening the reform of the medical and health system, balancing medical resources, and improving the people’s health index, so as to improve the quality of life of the people. This paper applies the factor analysis method to explore the factors affecting the medical and health level in various regions of the country. It is concluded that the medical and health level of all regions of the country is closely related to the medical and health resources and economic level. Moreover, according to the medical and health level ranking of all regions of the country, we found that the medical and health development in our country is still unbalanced. We also need all regions to attach great importance to the medical and health level, enrich the medical and health resources and attach great importance to the coordinated development of the economy.
文章引用:张琪, 牟唯嫣. 基于因子分析法的全国各地区医疗卫生水平的分析[J]. 统计学与应用, 2024, 13(5): 1836-1846. https://doi.org/10.12677/sa.2024.135179

1. 引言

医疗健康水平是我们衡量一个地区健康状况和医疗水平的重要参考标准,我们国家各个地区间医疗卫生水平存在差异,受到很多因素的影响,分析各地区的医疗卫生情况,有利于政策和制度的精准实施,提升国民的健康卫生水平。本文第一部分介绍了因子分析法的相关应用,第二部分介绍了数据分析前的数据处理和数据分析,第三部分对收集到的数据进行了因子分析处理,得出了各地区的得分情况,对得分情况进行了分析得出了结论。

2. 因子分析法

因子分析法的思想是将收集到的数据进行分组,选择方差累计百分比较高的组别,从每个组别中选出几个解释程度高的变量作为该组别的定义,如果不易看出,可以对组别进行旋转,从而给出相关的定义。

目前我们对因子分析法已经有了比较深入的研究,例如基于因子分析法的农村公路交通安全影响评价及对策研究识别出影响农村公路交通安全的各类因素[1];基于因子分析法的住院医师岗位胜任力综合评估研究为住院医师规范化培训提供了参考和方法学依据[2];基于因子分析法的白酒上市公司财务绩效研究对白酒公司的财务进行了得分排序[3];基于因子分析法的黑龙江省上市企业财务风险评价与控制研究对样本数据进行了降维处理分析得出结果[4];基于因子分析法的物流上市公司财务绩效评价分析了物流行业各因子的得分情况给出了相关建议[5]等,综合上述分析,没有应用了因子分析法对全国医疗卫生水平进行研究,故而本文采取了因子分析法对于我们所收集到的数据进行分析和评价,从而对全国医疗卫生水平的影响因素和发展状况进行研究并给出结论和分析。

3. 变量和原始数据

3.1. 解释各变量

表1,本文选取的变量有:分地区年末人口数(万人)、分地区居民人均可支配收入(元)、卫生机构数(个)、卫生人员(人)、卫生健康支出(亿元)、分地区医疗卫生机构入院人次数(万人次)、分地区医疗卫生机构出院人次数(万人次)、分地区医疗卫生机构住院病人手术人次数(万人次)。

Table 1. Variable indicators

1. 变量指标

自变量

名称

自变量

名称

x1

分地区居民人均可支配收入(元)

x5

分地区医疗卫生机构入院人次数(万人次)

x2

分地区年末人口数(万人)

x6

分地区医疗卫生机构出院人次数(万人次)

x3

卫生机构数(个)

x7

分地区医疗卫生机构住院病人手术人次数(万人次)

x4

卫生人员(人)

x8

卫生健康支出(亿元)

3.2. 数据来源

表2,本文选取的数据是2021年各地区的数据,分地区年末人口数(万人)、分地区居民人均可支配收入(元)、卫生机构数(个)、卫生人员(人)、卫生健康支出(亿元)、分地区医疗卫生机构入院人次数(万人次)、分地区医疗卫生机构出院人次数(万人次)、分地区医疗卫生机构住院病人手术人次数(万人次)。数据的来源为《中国统计年鉴2021》。

Table 2. Raw data by region

2. 各地区原始数据

地区

分地区居民人均可支配收入(元)

分地区年末人口数(万人)

卫生机构数(个)

卫生人员(人)

分地区医疗卫生机构入院人次数 (万人次)

分地区医疗卫生机构出院人次数 (万人次)

分地区医疗卫生机构住院病人手术人次数(万 人次)

卫生健康支出(亿元)

北京

75002.2

2189

10,699

361,004

367.7

349.8

163.3

632.67

天津

47449.4

1373

6076

152,473

162.7

162.6

94.4

182.58

河北

29,383

7448

88,162

710,338

1025

1019.9

263.2

853.49

山西

27425.9

3480

41,007

362,910

445.8

434.8

144.7

416.78

内蒙古

34108.4

2400

24,948

261,660

311.8

310.9

82.5

362.73

辽宁

35111.7

4229

33,051

417,681

614.2

610.3

191.8

399.25

吉林

27769.8

2375

25,344

276,724

348.4

346.1

87.3

279.72

黑龙江

27,159

3125

20,578

314,884

442.1

440.2

141.6

392.28

上海

78026.6

2489

6308

281,031

448.1

447.2

401.7

633.12

江苏

47498.3

8505

36,448

853,428

1415.7

1415.6

532.9

1183.71

浙江

57540.5

6540

35,120

694,800

1081.2

1083

424.2

908.04

安徽

30904.3

6113

29,554

519,418

949.3

947.3

306.8

732

福建

40659.3

4187

28,693

366,095

561

560.2

203.9

533.63

江西

30609.9

4517

36,764

381,722

861.6

857.9

222.1

643.27

山东

35705.1

10,170

85,715

1,055,683

1823.2

1817.1

564.9

1092.72

续表

河南

26811.2

9883

78,536

969,594

1914.9

1908.9

463.2

1018.59

湖北

30829.3

5830

36,529

564,148

1214.7

1212

396.7

706.33

湖南

31992.7

6622

55,677

619,810

1510

1505.8

349.3

739.92

广东

44993.3

12,684

57,964

1,058,702

1729.3

1730

963.4

1857.1

广西

26726.7

5037

34,112

493,178

1067.6

1064

241

613.75

海南

30456.8

1020

6277

99,580

128.2

128.3

49.1

194.17

重庆

33802.6

3212

21,361

308,519

730.5

729.8

193.1

427.72

四川

29080.1

8372

80,249

865,416

1863

1856.7

584.4

1044.14

贵州

23996.2

3852

29,292

384,145

844.9

839.4

212.1

542.07

云南

25666.2

4690

26,885

470,049

993.9

992

275.5

725.99

西藏

24949.9

366

6907

42,311

32.2

32.3

8.3

115.26

陕西

28,568

3954

34,971

445,858

728.4

727.9

270.3

565.72

甘肃

22,066

2490

25,759

247,666

445.1

444.2

88.6

390.38

青海

25919.5

594

6408

66,755

98.2

97.3

23.4

176.33

宁夏

27904.5

725

4571

73,110

108.1

107.9

31.8

110.72

新疆

26,075

2589

16,970

256,671

465.1

462.7

127.7

445.02

3.3. 标准化处理数据

对数据进行标准化处理,标准化处理数据(见表3)的优势有:

(1) 消除量纲影响:不同量纲的数值浮动范围差异较大,如果有两个变量数值浮动范围差异很大,那么这两个变量就不能参与数值分析与建模,标准化处理可以使得所有变量数值同级,提升数据分析和建模的预测效果。

(2) 增强稳定性:提升数据分析和建模的预测稳定性,降低异常点的影响。

(3) 提高效率:标准化处理数据可以提高计算机的运行效率,使得所有数据都变成了0附近的数值,能更快地处理运行数据,更快地建模分析。

(4) 方便对比不同变量:方便提升后期建议和分析的准确性,更好的对比不同变量的影响。

Table 3. Standardized raw data

3. 标准化原始数据

地区

分地区居民人均可支配收入(元)

分地区年末人口数(万人)

卫生机构数(个)

卫生人员(人)

分地区医疗卫生机构入院人次数 (万人次)

分地区医疗卫生机构出院人次数 (万人次)

分地区医疗卫生机构住院病人手术人次数(万 人次)

卫生健康支出(亿元)

北京

2.932

−0.771

−0.947

−0.316

−0.770

−0.797

−0.473

0.060

天津

0.914

−1.038

−1.141

−1.048

−1.136

−1.132

−0.805

−1.152

续表

河北

−0.410

0.947

2.305

0.912

0.407

0.403

0.009

0.655

山西

−0.553

−0.350

0.325

−0.309

−0.630

−0.645

−0.563

−0.521

内蒙古

−0.063

−0.703

−0.349

−0.665

−0.870

−0.867

−0.863

−0.667

辽宁

0.010

−0.105

−0.009

−0.116

−0.329

−0.331

−0.336

−0.568

吉林

−0.528

−0.711

−0.332

−0.612

−0.804

−0.804

−0.840

−0.890

黑龙江

−0.572

−0.466

−0.532

−0.478

−0.636

−0.635

−0.578

−0.587

上海

3.153

−0.673

−1.131

−0.597

−0.626

−0.623

0.677

0.061

江苏

0.917

1.292

0.134

1.415

1.106

1.112

1.310

1.544

浙江

1.653

0.650

0.078

0.857

0.507

0.516

0.785

0.802

安徽

−0.298

0.511

−0.155

0.241

0.271

0.273

0.219

0.328

福建

0.416

−0.119

−0.192

−0.298

−0.424

−0.420

−0.277

−0.206

江西

−0.320

−0.011

0.147

−0.243

0.114

0.113

−0.190

0.089

山东

0.054

1.836

2.202

2.126

1.835

1.831

1.464

1.299

河南

−0.598

1.742

1.901

1.823

1.999

1.995

0.973

1.100

湖北

−0.304

0.418

0.137

0.398

0.746

0.747

0.653

0.259

湖南

−0.218

0.677

0.941

0.594

1.274

1.273

0.424

0.349

广东

0.734

2.657

1.037

2.136

1.667

1.675

3.386

3.358

广西

−0.604

0.159

0.036

0.149

0.483

0.482

−0.098

0.009

海南

−0.331

−1.153

−1.133

−1.234

−1.198

−1.194

−1.024

−1.121

重庆

−0.086

−0.437

−0.499

−0.500

−0.120

−0.117

−0.329

−0.492

四川

−0.432

1.249

1.973

1.457

1.906

1.902

1.558

1.168

贵州

−0.804

−0.228

−0.166

−0.234

0.084

0.080

−0.238

−0.184

云南

−0.682

0.046

−0.267

0.068

0.351

0.353

0.068

0.312

西藏

−0.734

−1.367

−1.106

−1.436

−1.370

−1.366

−1.221

−1.333

陕西

−0.469

−0.195

0.072

−0.017

−0.124

−0.120

0.043

−0.120

甘肃

−0.945

−0.673

−0.315

−0.714

−0.631

−0.628

−0.833

−0.592

青海

−0.663

−1.293

−1.127

−1.350

−1.252

−1.249

−1.148

−1.169

宁夏

−0.518

−1.250

−1.204

−1.327

−1.234

−1.230

−1.107

−1.346

新疆

−0.652

−0.641

−0.684

−0.682

−0.595

−0.595

−0.645

−0.445

4. 相关性分析

表4中可以看到,各个变量间的相关系数大多在0.9附近,且大多取值大于0.3。因此,我们可以认为各个变量间存在有一定的相关关系,使用因子分析法是比较合适的。同时,我们使用SPSS软件中的KMO函数与巴特利特函数,对数据进行KMO检验与巴特利特检验。我们得到KMO值为0.76,巴特利特检验的p值 < 9.23E−120,即p值 < 0.01,这两个检验条件更印证了我们的数据可以进行因子分析。

Table 4. Correlation matrix

4. 相关性矩阵

相关性

x1

x2

x3

x4

x5

x6

x7

x8

x1

1

0.051

−0.186

0.108

−0.019

−0.02

0.284

0.254

x2

0.051

1

0.852

0.985

0.949

0.949

0.919

0.946

x3

−0.186

0.852

1

0.867

0.853

0.852

0.658

0.703

x4

0.108

0.985

0.867

1

0.955

0.955

0.902

0.93

x5

−0.019

0.949

0.853

0.955

1

1

0.866

0.871

x6

−0.02

0.949

0.852

0.955

1

1

0.867

0.871

x7

0.284

0.919

0.658

0.902

0.866

0.867

1

0.965

x8

0.254

0.946

0.703

0.93

0.871

0.871

0.965

1

5. 确定公因子个数

本文通过比较碎石图和方差贡献率来确定公因子的个数,一般我们认为碎石图的特征值大于1是保留因子数量的标准,特征值大于1的因子可以有效提取出数据中的主要信息,对数据进行降维,保留了数据的变异性,我们通过观察碎石图(图1)可以看到,第一个特征值和第二个特征值较大且都大于1,对应的曲线非常陡峭,除此之外的曲线都较为平缓,这表明前两个因子已经可以代表大多数信息。因此我们认为选择两个主成分公因子是比较合适的。

Figure 1. Lithotripsy

1. 碎石图

通过观察表5的方差贡献率及累计贡献率来进行判断。一般我们认为累计贡献率达到85%及以上就可以固定主成分因子个数,不必再添加公因子,从表5中可得知,有两个因子时,累计贡献率已经达到94.567% > 85%,因此选择两个主成分公因子是比较合适的。

综合以上两种方法,本文认为对数据进行因子分析选择两个公因子是比较合理的。

Table 5. Variance contribution rate

5. 方差贡献率

总方差解释

成分

初始特征值

提取载荷平方和

总计

方差百分比

累积%

总计

方差百分比

累积%

1

6.365

79.566

79.566

6.365

79.566

79.566

2

1.201

15.011

94.576

1.201

15.011

94.576

3

0.240

3.000

97.576

4

0.125

1.561

99.137

5

0.040

0.499

99.635

6

0.021

0.267

99.902

7

0.008

0.097

100.000

8

1.273E−5

0.000

100.000

6. 对公因子进行解释

在本文中,我们使用主轴因式分解法和主成分分析法进行因子分析。直接使用SPSS软件中的princomp函数进行因子分析法的计算,可以得到在两种方法对应的因子荷载和累计贡献率,见表6。我们发现应用主轴因式分解法选取两个公因子时的累计贡献率为89.175,而应用主成分分析法的累计贡献率为94.576,两者对比可得,应用主成分分析法来进行因子分析效果好于主轴因式分解法,所以,本文应用主成分分析法来进行因子分析。对应的因子载荷及累计贡献率见表6

Table 6. Component matrix

6. 成分矩阵

变量

主轴因式分解法的因子荷载

主成分分析法的因子荷载

F1

F2

F1

F2

x1

0.08

0.692

0.087

0.973

x2

0.991

−0.024

0.99

−0.024

x3

0.844

−0.363

0.862

−0.337

x4

0.99

0.004

0.99

0.01

x5

0.971

−0.138

0.973

−0.115

续表

x6

0.971

−0.138

0.973

−0.115

x7

0.928

0.311

0.931

0.257

x8

0.944

0.264

0.946

0.217

累计贡献率

78.979

89.175

79.566

94.576

表6主成分法对应的因子成分矩阵可以看到,八个变量中许多变量在成分一中的载荷都很大,在成分二中载荷较小,为了便于观察,对因子进行旋转,扩大载荷中较大的数值,缩小载荷中较小的数值,能够更好地进行解释,可以得到表7中的数据。

表7中,取两个公因子中因子载荷相对较大的变量来提升因子分析的效果,尽可能使每个变量在一个公因子中仅出现一次。我们认为:分地区年末人口数(万人)、卫生机构数(个)、卫生人员(人)、分地区医疗卫生机构入院人次数(万人次)、分地区医疗卫生机构出院人次数(万人次)、分地区医疗卫生机构住院病人手术人次数(万人次)、卫生健康支出(亿元)中支出载荷较大,可以认为是医疗卫生资源因子;公共因子2在分地区居民人均可支配收入(元)中比重较大,可以认为是经济水平因子。

Table 7. Rotating component matrix

7. 旋转成分矩阵

变量

主成分分析法的因子荷载

F1

F2

x1

0.023

0.977

x2

0.989

0.04

x3

0.882

−0.281

x4

0.987

0.075

x5

0.979

−0.051

x6

0.979

−0.052

x7

0.912

0.317

x8

0.93

0.278

7. 计算因子得分,构造评价模型

我们的目标是对全国各个地区的医疗卫生水平进行分析评价,通过各个地区的得分情况来进行分析,对比公因子的方差贡献率占累计方差贡献率的比重作为计算综合得分的权重系数,两个主成分作为变量,得到综合得分的公式为:

Score=( 79.556/94.567 )F1+( 15.011/94.567 )F2  =0.8413F1+0.1587F2

由此我们可以得出表8中的数据,根据表8我们可得以下分析:

因子F1代表了该地区的医疗卫生资源水平,由F1的得分情况可知,广东、山东、四川、河南、江苏得分情况排前五位,广东排第一位,江苏排第五位,且广东的得分将近为江苏的2倍,我们可以发现广东的卫生资源水平要远远优于大部分其他省份,而且我们发现排名靠前的省份人口数也靠前,但北京、上海等认为医疗卫生资源水平较高的省份排名却靠后,这说明得分F1受到了人口数目的影响,人口数较多的省份其医疗卫生资源水平也较高,同时,传统意义上认为的医疗水平较高的省份其医疗卫生资源水平未必较高。

因子F2代表了该地区的经济水平,由F2的得分情况可知,上海、北京、浙江、广东、江苏得分情况排前五位,上海排第一位,江苏排第五位,且上海的得分是江苏的3倍多,同样的,这说明上海的经济水平要远高于其他省份,这与我们的认知相符,我们还发现贵州、四川、甘肃、河北、河南得分情况为后五名,我认为是选取的变量不能完全代表当地省份的经济状况,导致出现了误差。

从综合得分情况来看,医疗卫生资源水平的得分显著高于经济水平得分,说明综合得分主要是由医疗卫生资源水平的得分来影响,其次才是经济水平得分,我们还发现广东、山东、河南、四川、江苏得分情况排前五位,我们发现,广东和江苏在因子F1得分和因子F2得分以及综合得分都占据了前五位,这说明广东和江苏地区的医疗卫生资源水平与经济水平都较高,所以才造就了医疗卫生水平较高。同时我们还发现得分情况大于0分的省份有12个,小于0分的省份有19个,我们可以看出我国的医疗卫生水平极度不平衡,同时我们发现F1排名和F2排名有着较大的差距,这说明各个地区没有将经济和医疗卫生资源的发展结合起来,没有做到同步发展。

Table 8. Scores by province

8. 各省份得分情况

省份

综合得分

排名

省份

F1得分

排名

省份

F2得分

排名

广东

2.22

1

广东

2.40

1

上海

3.16

1

山东

1.52

2

山东

1.88

2

北京

2.71

2

河南

1.29

3

河南

1.72

3

浙江

1.53

3

四川

1.28

4

四川

1.67

4

广东

1.28

4

江苏

1.18

5

江苏

1.21

5

江苏

1.04

5

浙江

0.61

6

湖南

0.83

6

天津

0.91

6

湖南

0.54

7

河北

0.82

7

福建

0.38

7

河北

0.8

8

浙江

0.66

8

重庆

−0.06

8

湖北

0.38

9

湖北

0.50

9

内蒙古

−0.08

9

安徽

0.19

10

安徽

0.26

10

辽宁

−0.10

10

上海

0.05

11

广西

0.18

11

海南

−0.13

11

广西

0.04

12

云南

0.14

12

安徽

−0.15

12

云南

−0.06

13

江西

0.00

13

湖北

−0.25

13

北京

−0.13

14

陕西

−0.08

14

宁夏

−0.31

14

江西

−0.23

15

贵州

−0.14

15

江西

−0.35

15

续表

陕西

−0.24

16

辽宁

−0.27

16

陕西

−0.39

16

福建

−0.18

17

福建

−0.29

17

山东

−0.40

17

贵州

−0.32

18

重庆

−0.37

18

黑龙江

−0.42

18

辽宁

0.17

19

上海

−0.39

19

青海

−0.42

19

重庆

−0.45

20

山西

−0.42

20

新疆

−0.43

20

山西

−0.04

21

北京

−0.56

21

云南

−0.47

21

黑龙江

−0.56

22

黑龙江

−0.59

22

西藏

−0.51

22

新疆

−0.62

23

新疆

−0.65

23

吉林

−0.51

23

内蒙古

−0.7

24

甘肃

−0.67

24

湖南

−0.54

24

甘肃

−0.65

25

内蒙古

−0.75

25

广西

−0.61

25

吉林

−0.72

26

吉林

−0.76

26

山西

−0.63

26

天津

−0.78

27

天津

−1.10

27

贵州

−0.70

27

海南

−1.04

28

海南

−1.21

28

四川

−0.74

28

宁夏

−1.16

29

青海

−1.30

29

甘肃

−0.83

29

青海

−1.15

30

宁夏

−1.31

30

河北

−0.95

30

西藏

−1.25

31

西藏

−1.39

31

河南

−1.01

31

8. 结论与分析

综合上述分析可知,我们国家的医疗卫生水平发展不平衡,人口较多的省份如广东、山东、河南在医疗卫生资源排名中表现较好,这可能是因为这些地区需要更多的医疗资源来满足庞大的人口需求。而一些经济发展比较落后的地区,比如河南,医疗卫生资源却较多,这说明河南省对于医疗卫生资源的关注和投入较大,这可能与资源的分配效率和利用有关。同时,我们可以看出我国各地区在医疗卫生和经济水平上的差异显著,这种不平衡可能会影响到社会的和谐与发展,需要我们加强管控和调节,而且我们发现有许多地区得分为负分,进一步说明各个地区的医疗卫生水平极度不平衡,需要各地区高度重视医疗卫生水平,丰富医疗卫生资源以及重视经济的协同发展,同时在政策和制度变更时需要考虑各个地区的地域特色和差异,利用医疗卫生资源水平和经济水平来分析哪些地区需要加强关注和政策的倾斜,从而更好地带动各地区医疗卫生水平的进步,提升国民的医疗健康水平和生活状态。

本文还需要更全面的指标来强化各地区的医疗卫生水平评判标准,减少误差,同时本文的数据还是不够全面,对于一些特殊地区的医疗卫生水平还需进一步探究。

参考文献

[1] 洪宇. 基于因子分析法的农村公路交通安全影响评价及对策研究[J]. 黑龙江交通科技, 2023, 46(9): 153-155.
[2] 袁筱祺, 夏葳, 何双双. 基于因子分析法的住院医师岗位胜任力综合评估研究[J]. 上海医药, 2023, 44(17): 57-60+81.
[3] 刘祉君. 基于因子分析法的白酒上市公司财务绩效研究[J]. 全国流通经济, 2023(17): 169-172.
[4] 张明兴, 杨悦. 基于因子分析法的黑龙江省上市企业财务风险评价与控制研究[J]. 现代审计与会计, 2023(9): 25-27.
[5] 徐崇烜. 基于因子分析法的物流上市公司财务绩效评价[J]. 物流技术, 2023, 42(7): 59-64+115.