基于因子分析法的全国各地区医疗卫生水平的分析

doi:10.12677/sa.2024.135179

期刊菜单

基于因子分析法的全国各地区医疗卫生水平的分析
Analysis of Medical and Health Level in Different Regions of China Based on Factor Analysis

DOI: 10.12677/sa.2024.135179, PDF, HTML, XML,
作者: 张琪, 牟唯嫣：北京建筑大学理学院，北京
关键词: 应用因子分析；医疗卫生水平；排名情况；Application Factor Analysis； Medical and Health Level； Ranking

摘要: 自党的十八大以来，党和国家越来越重视人民的卫生健康工作，要求深化医疗健康体制改革，均衡医疗资源，提升人民的卫生健康指数，从而提升人民的生活质量，本文应用因子分析方法探讨全国各地区医疗卫生水平的影响因素，得出了全国各地区医疗卫生水平与医疗卫生资源和经济水平密切相关，且根据全国各地区医疗卫生水平的排名情况，我们发现我国的医疗健康发展仍旧不平衡，还需要各地区重视医疗卫生水平，丰富医疗卫生资源以及重视经济的协同发展。

Abstract: Since the 18th National Congress of the CPC, the Party and the state have attached more and more importance to the people’s health work, requiring deepening the reform of the medical and health system, balancing medical resources, and improving the people’s health index, so as to improve the quality of life of the people. This paper applies the factor analysis method to explore the factors affecting the medical and health level in various regions of the country. It is concluded that the medical and health level of all regions of the country is closely related to the medical and health resources and economic level. Moreover, according to the medical and health level ranking of all regions of the country, we found that the medical and health development in our country is still unbalanced. We also need all regions to attach great importance to the medical and health level, enrich the medical and health resources and attach great importance to the coordinated development of the economy.

文章引用：张琪, 牟唯嫣. 基于因子分析法的全国各地区医疗卫生水平的分析[J]. 统计学与应用, 2024, 13(5): 1836-1846. https://doi.org/10.12677/sa.2024.135179

1. 引言

医疗健康水平是我们衡量一个地区健康状况和医疗水平的重要参考标准，我们国家各个地区间医疗卫生水平存在差异，受到很多因素的影响，分析各地区的医疗卫生情况，有利于政策和制度的精准实施，提升国民的健康卫生水平。本文第一部分介绍了因子分析法的相关应用，第二部分介绍了数据分析前的数据处理和数据分析，第三部分对收集到的数据进行了因子分析处理，得出了各地区的得分情况，对得分情况进行了分析得出了结论。

2. 因子分析法

因子分析法的思想是将收集到的数据进行分组，选择方差累计百分比较高的组别，从每个组别中选出几个解释程度高的变量作为该组别的定义，如果不易看出，可以对组别进行旋转，从而给出相关的定义。

目前我们对因子分析法已经有了比较深入的研究，例如基于因子分析法的农村公路交通安全影响评价及对策研究识别出影响农村公路交通安全的各类因素[1]；基于因子分析法的住院医师岗位胜任力综合评估研究为住院医师规范化培训提供了参考和方法学依据[2]；基于因子分析法的白酒上市公司财务绩效研究对白酒公司的财务进行了得分排序[3]；基于因子分析法的黑龙江省上市企业财务风险评价与控制研究对样本数据进行了降维处理分析得出结果[4]；基于因子分析法的物流上市公司财务绩效评价分析了物流行业各因子的得分情况给出了相关建议[5]等，综合上述分析，没有应用了因子分析法对全国医疗卫生水平进行研究，故而本文采取了因子分析法对于我们所收集到的数据进行分析和评价，从而对全国医疗卫生水平的影响因素和发展状况进行研究并给出结论和分析。

3. 变量和原始数据

3.1. 解释各变量

见表1，本文选取的变量有：分地区年末人口数(万人)、分地区居民人均可支配收入(元)、卫生机构数(个)、卫生人员(人)、卫生健康支出(亿元)、分地区医疗卫生机构入院人次数(万人次)、分地区医疗卫生机构出院人次数(万人次)、分地区医疗卫生机构住院病人手术人次数(万人次)。

Table 1. Variable indicators

表1. 变量指标

自变量	名称	自变量	名称
x₁	分地区居民人均可支配收入(元)	x₅	分地区医疗卫生机构入院人次数(万人次)
x₂	分地区年末人口数(万人)	x₆	分地区医疗卫生机构出院人次数(万人次)
x₃	卫生机构数(个)	x₇	分地区医疗卫生机构住院病人手术人次数(万人次)
x₄	卫生人员(人)	x₈	卫生健康支出(亿元)

3.2. 数据来源

见表2，本文选取的数据是2021年各地区的数据，分地区年末人口数(万人)、分地区居民人均可支配收入(元)、卫生机构数(个)、卫生人员(人)、卫生健康支出(亿元)、分地区医疗卫生机构入院人次数(万人次)、分地区医疗卫生机构出院人次数(万人次)、分地区医疗卫生机构住院病人手术人次数(万人次)。数据的来源为《中国统计年鉴2021》。

Table 2. Raw data by region

表2. 各地区原始数据

地区	分地区居民人均可支配收入(元)	分地区年末人口数(万人)	卫生机构数(个)	卫生人员(人)	分地区医疗卫生机构入院人次数 (万人次)	分地区医疗卫生机构出院人次数 (万人次)	分地区医疗卫生机构住院病人手术人次数(万人次)	卫生健康支出(亿元)
北京	75002.2	2189	10,699	361,004	367.7	349.8	163.3	632.67
天津	47449.4	1373	6076	152,473	162.7	162.6	94.4	182.58
河北	29,383	7448	88,162	710,338	1025	1019.9	263.2	853.49
山西	27425.9	3480	41,007	362,910	445.8	434.8	144.7	416.78
内蒙古	34108.4	2400	24,948	261,660	311.8	310.9	82.5	362.73
辽宁	35111.7	4229	33,051	417,681	614.2	610.3	191.8	399.25
吉林	27769.8	2375	25,344	276,724	348.4	346.1	87.3	279.72
黑龙江	27,159	3125	20,578	314,884	442.1	440.2	141.6	392.28
上海	78026.6	2489	6308	281,031	448.1	447.2	401.7	633.12
江苏	47498.3	8505	36,448	853,428	1415.7	1415.6	532.9	1183.71
浙江	57540.5	6540	35,120	694,800	1081.2	1083	424.2	908.04
安徽	30904.3	6113	29,554	519,418	949.3	947.3	306.8	732
福建	40659.3	4187	28,693	366,095	561	560.2	203.9	533.63
江西	30609.9	4517	36,764	381,722	861.6	857.9	222.1	643.27
山东	35705.1	10,170	85,715	1,055,683	1823.2	1817.1	564.9	1092.72

续表

河南	26811.2	9883	78,536	969,594	1914.9	1908.9	463.2	1018.59
湖北	30829.3	5830	36,529	564,148	1214.7	1212	396.7	706.33
湖南	31992.7	6622	55,677	619,810	1510	1505.8	349.3	739.92
广东	44993.3	12,684	57,964	1,058,702	1729.3	1730	963.4	1857.1
广西	26726.7	5037	34,112	493,178	1067.6	1064	241	613.75
海南	30456.8	1020	6277	99,580	128.2	128.3	49.1	194.17
重庆	33802.6	3212	21,361	308,519	730.5	729.8	193.1	427.72
四川	29080.1	8372	80,249	865,416	1863	1856.7	584.4	1044.14
贵州	23996.2	3852	29,292	384,145	844.9	839.4	212.1	542.07
云南	25666.2	4690	26,885	470,049	993.9	992	275.5	725.99
西藏	24949.9	366	6907	42,311	32.2	32.3	8.3	115.26
陕西	28,568	3954	34,971	445,858	728.4	727.9	270.3	565.72
甘肃	22,066	2490	25,759	247,666	445.1	444.2	88.6	390.38
青海	25919.5	594	6408	66,755	98.2	97.3	23.4	176.33
宁夏	27904.5	725	4571	73,110	108.1	107.9	31.8	110.72
新疆	26,075	2589	16,970	256,671	465.1	462.7	127.7	445.02

3.3. 标准化处理数据

对数据进行标准化处理，标准化处理数据(见表3)的优势有：

(1) 消除量纲影响：不同量纲的数值浮动范围差异较大，如果有两个变量数值浮动范围差异很大，那么这两个变量就不能参与数值分析与建模，标准化处理可以使得所有变量数值同级，提升数据分析和建模的预测效果。

(2) 增强稳定性：提升数据分析和建模的预测稳定性，降低异常点的影响。

(3) 提高效率：标准化处理数据可以提高计算机的运行效率，使得所有数据都变成了0附近的数值，能更快地处理运行数据，更快地建模分析。

(4) 方便对比不同变量：方便提升后期建议和分析的准确性，更好的对比不同变量的影响。

Table 3. Standardized raw data

表3. 标准化原始数据

地区	分地区居民人均可支配收入(元)	分地区年末人口数(万人)	卫生机构数(个)	卫生人员(人)	分地区医疗卫生机构入院人次数 (万人次)	分地区医疗卫生机构出院人次数 (万人次)	分地区医疗卫生机构住院病人手术人次数(万人次)	卫生健康支出(亿元)
北京	2.932	−0.771	−0.947	−0.316	−0.770	−0.797	−0.473	0.060
天津	0.914	−1.038	−1.141	−1.048	−1.136	−1.132	−0.805	−1.152

续表

河北	−0.410	0.947	2.305	0.912	0.407	0.403	0.009	0.655
山西	−0.553	−0.350	0.325	−0.309	−0.630	−0.645	−0.563	−0.521
内蒙古	−0.063	−0.703	−0.349	−0.665	−0.870	−0.867	−0.863	−0.667
辽宁	0.010	−0.105	−0.009	−0.116	−0.329	−0.331	−0.336	−0.568
吉林	−0.528	−0.711	−0.332	−0.612	−0.804	−0.804	−0.840	−0.890
黑龙江	−0.572	−0.466	−0.532	−0.478	−0.636	−0.635	−0.578	−0.587
上海	3.153	−0.673	−1.131	−0.597	−0.626	−0.623	0.677	0.061
江苏	0.917	1.292	0.134	1.415	1.106	1.112	1.310	1.544
浙江	1.653	0.650	0.078	0.857	0.507	0.516	0.785	0.802
安徽	−0.298	0.511	−0.155	0.241	0.271	0.273	0.219	0.328
福建	0.416	−0.119	−0.192	−0.298	−0.424	−0.420	−0.277	−0.206
江西	−0.320	−0.011	0.147	−0.243	0.114	0.113	−0.190	0.089
山东	0.054	1.836	2.202	2.126	1.835	1.831	1.464	1.299
河南	−0.598	1.742	1.901	1.823	1.999	1.995	0.973	1.100
湖北	−0.304	0.418	0.137	0.398	0.746	0.747	0.653	0.259
湖南	−0.218	0.677	0.941	0.594	1.274	1.273	0.424	0.349
广东	0.734	2.657	1.037	2.136	1.667	1.675	3.386	3.358
广西	−0.604	0.159	0.036	0.149	0.483	0.482	−0.098	0.009
海南	−0.331	−1.153	−1.133	−1.234	−1.198	−1.194	−1.024	−1.121
重庆	−0.086	−0.437	−0.499	−0.500	−0.120	−0.117	−0.329	−0.492
四川	−0.432	1.249	1.973	1.457	1.906	1.902	1.558	1.168
贵州	−0.804	−0.228	−0.166	−0.234	0.084	0.080	−0.238	−0.184
云南	−0.682	0.046	−0.267	0.068	0.351	0.353	0.068	0.312
西藏	−0.734	−1.367	−1.106	−1.436	−1.370	−1.366	−1.221	−1.333
陕西	−0.469	−0.195	0.072	−0.017	−0.124	−0.120	0.043	−0.120
甘肃	−0.945	−0.673	−0.315	−0.714	−0.631	−0.628	−0.833	−0.592
青海	−0.663	−1.293	−1.127	−1.350	−1.252	−1.249	−1.148	−1.169
宁夏	−0.518	−1.250	−1.204	−1.327	−1.234	−1.230	−1.107	−1.346
新疆	−0.652	−0.641	−0.684	−0.682	−0.595	−0.595	−0.645	−0.445

4. 相关性分析

从表4中可以看到，各个变量间的相关系数大多在0.9附近，且大多取值大于0.3。因此，我们可以认为各个变量间存在有一定的相关关系，使用因子分析法是比较合适的。同时，我们使用SPSS软件中的KMO函数与巴特利特函数，对数据进行KMO检验与巴特利特检验。我们得到KMO值为0.76，巴特利特检验的p值 < 9.23E−120，即p值 < 0.01，这两个检验条件更印证了我们的数据可以进行因子分析。

Table 4. Correlation matrix

表4. 相关性矩阵

相关性	x₁	x₂	x₃	x₄	x₅	x₆	x₇	x₈
x₁	1	0.051	−0.186	0.108	−0.019	−0.02	0.284	0.254
x₂	0.051	1	0.852	0.985	0.949	0.949	0.919	0.946
x₃	−0.186	0.852	1	0.867	0.853	0.852	0.658	0.703
x₄	0.108	0.985	0.867	1	0.955	0.955	0.902	0.93
x₅	−0.019	0.949	0.853	0.955	1	1	0.866	0.871
x₆	−0.02	0.949	0.852	0.955	1	1	0.867	0.871
x₇	0.284	0.919	0.658	0.902	0.866	0.867	1	0.965
x₈	0.254	0.946	0.703	0.93	0.871	0.871	0.965	1

5. 确定公因子个数

本文通过比较碎石图和方差贡献率来确定公因子的个数，一般我们认为碎石图的特征值大于1是保留因子数量的标准，特征值大于1的因子可以有效提取出数据中的主要信息，对数据进行降维，保留了数据的变异性，我们通过观察碎石图(图1)可以看到，第一个特征值和第二个特征值较大且都大于1，对应的曲线非常陡峭，除此之外的曲线都较为平缓，这表明前两个因子已经可以代表大多数信息。因此我们认为选择两个主成分公因子是比较合适的。

Figure 1. Lithotripsy

图1. 碎石图

通过观察表5的方差贡献率及累计贡献率来进行判断。一般我们认为累计贡献率达到85%及以上就可以固定主成分因子个数，不必再添加公因子，从表5中可得知，有两个因子时，累计贡献率已经达到94.567% > 85%，因此选择两个主成分公因子是比较合适的。

综合以上两种方法，本文认为对数据进行因子分析选择两个公因子是比较合理的。

Table 5. Variance contribution rate

表5. 方差贡献率

总方差解释
成分	初始特征值			提取载荷平方和
成分	总计	方差百分比	累积%	总计	方差百分比	累积%
1	6.365	79.566	79.566	6.365	79.566	79.566
2	1.201	15.011	94.576	1.201	15.011	94.576
3	0.240	3.000	97.576
4	0.125	1.561	99.137
5	0.040	0.499	99.635
6	0.021	0.267	99.902
7	0.008	0.097	100.000
8	1.273E−5	0.000	100.000

6. 对公因子进行解释

在本文中，我们使用主轴因式分解法和主成分分析法进行因子分析。直接使用SPSS软件中的princomp函数进行因子分析法的计算，可以得到在两种方法对应的因子荷载和累计贡献率，见表6。我们发现应用主轴因式分解法选取两个公因子时的累计贡献率为89.175，而应用主成分分析法的累计贡献率为94.576，两者对比可得，应用主成分分析法来进行因子分析效果好于主轴因式分解法，所以，本文应用主成分分析法来进行因子分析。对应的因子载荷及累计贡献率见表6。

Table 6. Component matrix

表6. 成分矩阵

变量	主轴因式分解法的因子荷载		主成分分析法的因子荷载
变量	F1	F2	F1	F2
x₁	0.08	0.692	0.087	0.973
x₂	0.991	−0.024	0.99	−0.024
x₃	0.844	−0.363	0.862	−0.337
x₄	0.99	0.004	0.99	0.01
x₅	0.971	−0.138	0.973	−0.115

续表

x₆	0.971	−0.138	0.973	−0.115
x₇	0.928	0.311	0.931	0.257
x₈	0.944	0.264	0.946	0.217
累计贡献率	78.979	89.175	79.566	94.576

由表6主成分法对应的因子成分矩阵可以看到，八个变量中许多变量在成分一中的载荷都很大，在成分二中载荷较小，为了便于观察，对因子进行旋转，扩大载荷中较大的数值，缩小载荷中较小的数值，能够更好地进行解释，可以得到表7中的数据。

在表7中，取两个公因子中因子载荷相对较大的变量来提升因子分析的效果，尽可能使每个变量在一个公因子中仅出现一次。我们认为：分地区年末人口数(万人)、卫生机构数(个)、卫生人员(人)、分地区医疗卫生机构入院人次数(万人次)、分地区医疗卫生机构出院人次数(万人次)、分地区医疗卫生机构住院病人手术人次数(万人次)、卫生健康支出(亿元)中支出载荷较大，可以认为是医疗卫生资源因子；公共因子2在分地区居民人均可支配收入(元)中比重较大，可以认为是经济水平因子。

Table 7. Rotating component matrix

表7. 旋转成分矩阵

变量	主成分分析法的因子荷载
变量	F1	F2
x₁	0.023	0.977
x₂	0.989	0.04
x₃	0.882	−0.281
x₄	0.987	0.075
x₅	0.979	−0.051
x₆	0.979	−0.052
x₇	0.912	0.317
x₈	0.93	0.278

7. 计算因子得分，构造评价模型

我们的目标是对全国各个地区的医疗卫生水平进行分析评价，通过各个地区的得分情况来进行分析，对比公因子的方差贡献率占累计方差贡献率的比重作为计算综合得分的权重系数，两个主成分作为变量，得到综合得分的公式为：

$\begin{matrix} Score = (79 .556/94 .567) F1 + (15 .011/94 .567) F2 \\ = 0.8413 * F1 + 0 .1587 * F2 \end{matrix}$

由此我们可以得出表8中的数据，根据表8我们可得以下分析：

因子F1代表了该地区的医疗卫生资源水平，由F1的得分情况可知，广东、山东、四川、河南、江苏得分情况排前五位，广东排第一位，江苏排第五位，且广东的得分将近为江苏的2倍，我们可以发现广东的卫生资源水平要远远优于大部分其他省份，而且我们发现排名靠前的省份人口数也靠前，但北京、上海等认为医疗卫生资源水平较高的省份排名却靠后，这说明得分F1受到了人口数目的影响，人口数较多的省份其医疗卫生资源水平也较高，同时，传统意义上认为的医疗水平较高的省份其医疗卫生资源水平未必较高。

因子F2代表了该地区的经济水平，由F2的得分情况可知，上海、北京、浙江、广东、江苏得分情况排前五位，上海排第一位，江苏排第五位，且上海的得分是江苏的3倍多，同样的，这说明上海的经济水平要远高于其他省份，这与我们的认知相符，我们还发现贵州、四川、甘肃、河北、河南得分情况为后五名，我认为是选取的变量不能完全代表当地省份的经济状况，导致出现了误差。

从综合得分情况来看，医疗卫生资源水平的得分显著高于经济水平得分，说明综合得分主要是由医疗卫生资源水平的得分来影响，其次才是经济水平得分，我们还发现广东、山东、河南、四川、江苏得分情况排前五位，我们发现，广东和江苏在因子F1得分和因子F2得分以及综合得分都占据了前五位，这说明广东和江苏地区的医疗卫生资源水平与经济水平都较高，所以才造就了医疗卫生水平较高。同时我们还发现得分情况大于0分的省份有12个，小于0分的省份有19个，我们可以看出我国的医疗卫生水平极度不平衡，同时我们发现F1排名和F2排名有着较大的差距，这说明各个地区没有将经济和医疗卫生资源的发展结合起来，没有做到同步发展。

Table 8. Scores by province

表8. 各省份得分情况

省份	综合得分	排名	省份	F1得分	排名	省份	F2得分	排名
广东	2.22	1	广东	2.40	1	上海	3.16	1
山东	1.52	2	山东	1.88	2	北京	2.71	2
河南	1.29	3	河南	1.72	3	浙江	1.53	3
四川	1.28	4	四川	1.67	4	广东	1.28	4
江苏	1.18	5	江苏	1.21	5	江苏	1.04	5
浙江	0.61	6	湖南	0.83	6	天津	0.91	6
湖南	0.54	7	河北	0.82	7	福建	0.38	7
河北	0.8	8	浙江	0.66	8	重庆	−0.06	8
湖北	0.38	9	湖北	0.50	9	内蒙古	−0.08	9
安徽	0.19	10	安徽	0.26	10	辽宁	−0.10	10
上海	0.05	11	广西	0.18	11	海南	−0.13	11
广西	0.04	12	云南	0.14	12	安徽	−0.15	12
云南	−0.06	13	江西	0.00	13	湖北	−0.25	13
北京	−0.13	14	陕西	−0.08	14	宁夏	−0.31	14
江西	−0.23	15	贵州	−0.14	15	江西	−0.35	15

续表

陕西	−0.24	16	辽宁	−0.27	16	陕西	−0.39	16
福建	−0.18	17	福建	−0.29	17	山东	−0.40	17
贵州	−0.32	18	重庆	−0.37	18	黑龙江	−0.42	18
辽宁	0.17	19	上海	−0.39	19	青海	−0.42	19
重庆	−0.45	20	山西	−0.42	20	新疆	−0.43	20
山西	−0.04	21	北京	−0.56	21	云南	−0.47	21
黑龙江	−0.56	22	黑龙江	−0.59	22	西藏	−0.51	22
新疆	−0.62	23	新疆	−0.65	23	吉林	−0.51	23
内蒙古	−0.7	24	甘肃	−0.67	24	湖南	−0.54	24
甘肃	−0.65	25	内蒙古	−0.75	25	广西	−0.61	25
吉林	−0.72	26	吉林	−0.76	26	山西	−0.63	26
天津	−0.78	27	天津	−1.10	27	贵州	−0.70	27
海南	−1.04	28	海南	−1.21	28	四川	−0.74	28
宁夏	−1.16	29	青海	−1.30	29	甘肃	−0.83	29
青海	−1.15	30	宁夏	−1.31	30	河北	−0.95	30
西藏	−1.25	31	西藏	−1.39	31	河南	−1.01	31

8. 结论与分析

综合上述分析可知，我们国家的医疗卫生水平发展不平衡，人口较多的省份如广东、山东、河南在医疗卫生资源排名中表现较好，这可能是因为这些地区需要更多的医疗资源来满足庞大的人口需求。而一些经济发展比较落后的地区，比如河南，医疗卫生资源却较多，这说明河南省对于医疗卫生资源的关注和投入较大，这可能与资源的分配效率和利用有关。同时，我们可以看出我国各地区在医疗卫生和经济水平上的差异显著，这种不平衡可能会影响到社会的和谐与发展，需要我们加强管控和调节，而且我们发现有许多地区得分为负分，进一步说明各个地区的医疗卫生水平极度不平衡，需要各地区高度重视医疗卫生水平，丰富医疗卫生资源以及重视经济的协同发展，同时在政策和制度变更时需要考虑各个地区的地域特色和差异，利用医疗卫生资源水平和经济水平来分析哪些地区需要加强关注和政策的倾斜，从而更好地带动各地区医疗卫生水平的进步，提升国民的医疗健康水平和生活状态。

本文还需要更全面的指标来强化各地区的医疗卫生水平评判标准，减少误差，同时本文的数据还是不够全面，对于一些特殊地区的医疗卫生水平还需进一步探究。

参考文献

[1]	洪宇. 基于因子分析法的农村公路交通安全影响评价及对策研究[J]. 黑龙江交通科技, 2023, 46(9): 153-155.
[2]	袁筱祺, 夏葳, 何双双. 基于因子分析法的住院医师岗位胜任力综合评估研究[J]. 上海医药, 2023, 44(17): 57-60+81.
[3]	刘祉君. 基于因子分析法的白酒上市公司财务绩效研究[J]. 全国流通经济, 2023(17): 169-172.
[4]	张明兴, 杨悦. 基于因子分析法的黑龙江省上市企业财务风险评价与控制研究[J]. 现代审计与会计, 2023(9): 25-27.
[5]	徐崇烜. 基于因子分析法的物流上市公司财务绩效评价[J]. 物流技术, 2023, 42(7): 59-64+115.

为你推荐

友情链接