基于我国各地区普通高等教育发展状况分析
Based on the Analysis of the Development Status of General Higher Education in Various Regions of Our Country
DOI: 10.12677/SA.2021.101003, PDF, HTML, XML, 下载: 480  浏览: 1,481 
作者: 吕黄铭:云南财经大学,云南 昆明
关键词: 教育水平聚类分析类平均法Ward方法平等教育Education Level Cluster Analysis Class Average Method Ward Method Equal Education
摘要: 我国经济水平快速发展,但一些地区经济发展水平还是不平衡,特别是教育水平存在明显的差异,本文就30个省份的教育水平进行分析,主要通过类平均法还有Ward方法对数据进行聚类,首先需要找好数据,建立好模型,之后运用SPSS的聚类分析得出结论,来探讨教育发展的情况,通过分析发现我国的教育水平发展十分不均衡。因此,国家还有政府应该采取措施改善教育发展的情况,让每个孩子都有享受平等教育的机会。
Abstract: My country’s economic level is developing rapidly, but the level of economic development in some regions is still unbalanced, and especially there are obvious differences in the level of education. This article analyzes the education level of 30 provinces, mainly using the class average method and the Ward method to cluster the data. First, we need to find good data, establish a good model, and then use the cluster analysis of SPSS to draw a conclusion to discuss the development of education. Through the analysis, it is found that the level of education in my country is developing very unevenly. Therefore, the country and the government should take measures to improve the development of education so that every child has an equal opportunity to enjoy education.
文章引用:吕黄铭. 基于我国各地区普通高等教育发展状况分析[J]. 统计学与应用, 2021, 10(1): 21-30. https://doi.org/10.12677/SA.2021.101003

1. 引言

教育公平是整个社会还有人类赖以发展的基础,只有教育平等,人权才平等,思想境界才能提高,国家才能有文化核心竞争力,才能够创新,屹立于世界。只有坚持教育,让教育平等,才能加速全面建成小康社会。因此,我们必须对不同省份的教育水平做一个分析了解,让中央教育局知道需要制定怎样的教育政策,提供怎样的教育资源,可以帮助同学们快速发展,本文运用聚类分析进行聚类,得出哪些城市的教育水平比较好,哪些城市还需要加强,进而促进教育平等,社会和谐有序地发展。

2. 现状分析

在现在这样一个卧虎藏龙的时代,我认识到一些很多接受教育资源比我好的同学,的确他们在社会这场竞争中就是处于一个优势的状态,你不得不感叹他们的学识还有气质就是比你优秀。其实这归根于区域经济发展不均衡带来的负面影响,作为一个13亿人口的中国大国,在贫富差距如此悬殊,区域经济发展、教育资源分配如此不均衡的情况下,如果不着手从根本上解决区域发展不均衡,教育水平不平等,任由发展下去是会阻碍社会的健康发展,不利于国家的进步。如果经济发展成果不能由全体人民共享,而是集中在少数人少数地区的人民垄断,在经济全球化过程中利益受损的人很可能会做出一些无理还有极端的行为表达自己的不满,近年来欧洲右翼政党纷纷登上政治舞台、“英国脱欧”、“特朗普现象”、“贸易保护主义”等频频出现的根源就在于经济全球化的发展成果被少部分地区还有少部分的集团垄断,“红脖子们”未能共享经济发展的成果,偏远山区还有省份未能享受到平等的教育环境。其实,每一个孩子都应该拥有接受同能优质教育的权力,每一个省份的经济发展,教育的硬件措施都应该平等对待,这也是人类几千年来一直追求的境界“大道之行,天下为公”,而不是像一些西方国家一样用所谓的“快乐教育”和学费高昂的“精英教育”通过种种看得见的看不见的制度和套路实现安排“龙生龙,凤生凤”的阶级固化,只有从解放人民的思想,发展文化,社会才能实现大同。

3. 研究目的和意义

受教育的机会应该是平等的,不应该出现由于经济的差异出现不平等的现象。因此需要迫切了解每个省的教育水平,教育资源情况,国家根据相应的分析制定合理的政策,帮助一些省份地区教育水平的发展、提高。只有坚持教育平等,赋予每个受教育者同等教育的机会,才能促进社会成员的潜能、积极性和创造力,才能提高全员的素质,也不会说出现“老人摔倒该不该扶”,“豆腐渣工程”、“江歌案”等道德缺失,教育缺失的事件。教育兴则国兴,教育强则国强,习近平主席也一直强调教育发展的战略核心地位,教育上来了,自然国家水平就上来了,人民生活水平提高,进入全体富裕,加快全面进入到社会主义现代化社会。

4. 综合评测指标的确定

指标的数据选自《中国统计年鉴》和《中国教育统计年鉴》。其中x1为每百万人口的高等院校数;x2为每10万人口高等院校毕业生数;x3为每10万人口高等院校招生数;x4为每10万人口高等院校在校生数;x5为每10万人口高等院校教职工数;x6为每10万人口高等院校专职教师数;x7为高级职称占专职教师的比例;x8为平均每所高等院校的在校生数;x9为国家财政预算内普通高等经费占国内生产总值的比例;x10为生均教育经费 [1]。

图1,我们先对指标运用因子分析,得出相关系数矩阵,然后根据相关性选择有很强相关性的变量进行聚类,运用类平均法还有Ward方法进行聚类,然后根据聚类结果进行分析得出结论。

Figure 1. Data of general higher education development in different regions of China

图1. 我国各地区普通高等教育发展状况数据

图2,我们可以清楚的看出变量之间都有很强的相关性,所以直接运用变量进行聚类分析,去分析出不同省份的教育水平的情况,并根据结论给出意见。

Figure 2. Correlation coefficient matrix

图2. 相关系数矩阵

5. 聚类分析的基本思想还有方法

5.1. 聚类分析的定义

聚类分析是根据研究对象的特征对它进行分类的方法。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中 [2]。

5.2. 聚类分析的步骤

1) 选择描述事物对象的变量指标;

2) 建立样品系列矩阵查看相关性;

3) 确定数据是否要进行标准化;

4) 确定表示对象距离或者选择相似程度比较高的统计量;

5) 选择适当的聚类方法,进行聚类;

6) 根据聚类结果给出相关结论。

5.3. 计算对象之间的距离

x = ( x 1 , x 2 , , x p ) y = ( y 1 , y 2 , , y p ) 为两个样品,则所定义的距离一般应该满足如下三个条件:

1) 非负性: d ( x , y ) 0 , d ( x , y ) = 0 当且仅当 x = y

2) 对称性: d ( x , y ) = d ( y , x )

3) 三角不等式: d ( x , y ) d ( x , z ) + d ( z , y )

在聚类过程中,相距较近的样品倾向于归于一类,相距比较远的归于一类。常用的距离如下几种表示:

5.3.1. 明考夫斯基距离

x和y之间的明考夫斯基距离定义为:

d ( x , y ) = [ i = 1 p | x i y i | q ] 1 / q

这里 q 1 。明氏距离有以下三种特殊的形式:

q = 1 时, d ( x , y ) = i = 1 p | x i y i | ,称为绝对值距离,常被形象地称作“城市街区”;

q = 2 时, d ( x , y ) = [ i = 1 p | x i y i | 2 ] 1 2 = ( X Y ) ( X Y ) ,这是欧式距离,它是聚类分析中最常用的一种距离;

q = 时, d ( x , y ) = max | x i y i | ,称为切比雪夫距离。

5.3.2. 兰氏距离

当所有的数据皆为正时,可以定义x与y之间的兰氏距离为

d ( x , y ) = i = 1 p | x i y i | x i + y i

该距离与各变量的单位无关,且适用于高度偏斜或者含有异常值的数据。

5.3.3. 马氏距离

x与y之间的马氏距离为

d ( x , y ) = ( X Y ) S 1 ( X Y ) ,其中S为样本协方差矩阵,使用马氏距离的好处是考虑到了各变量之间的相关性,并且与变量的单位无关。

5.4. 聚类的方法还有思想

5.4.1. 类平均法

类平均法有两种定义,一种定义方法是把类与类之间的距离定义为所有样品对之间的平均距离,定义为:

D k l = 1 n k n l i G k , j G l d i j

其中nk和nl分别为类Gk和Gl的个数。

另外一种定义方法是定义类与类之间的平方距离为样品对之间平方距离的平均值,即是:

D k l 2 = 1 n k n l i G k , j G l d i j 2

5.4.2. 离差平方和法

类中各样品到类重心的平方欧式距离之和称为离差平方和。设类Gk和Gl合并成新类Gm,则Gk和Gl和Gm的离差平方和分别是

W k = i G k ( x i x ¯ k ) ( x i x ¯ k )

W l = i G l ( x i x ¯ l ) ( x i x ¯ l )

W m = i G m ( x i x ¯ m ) ( x i x ¯ m )

如果Gk和Gl这两类相距较近,则合并后的离差平方和 W m W k W l 应当较小,否则,应当比较大。于是我们定义Gk和Gl之间的平方距离为:

D k l 2 = W m W k W l

这种系统聚类的方法是Ward方法,实际上这种聚类的效果会比较好。

思想:让n个样品各自成一类,然后每次缩小一个类,每缩小一类,离差平方和就要增大,选择使得L增加最小的两类合并,知道所有的样品归为一类为止 [3]。

6. 结论

案例研究结果

1) 各地区高等教育发展状况存在较大的差异,高校资源的地区分布很不均衡,如果用类平均法把30个地区分为5类,其结果为:

第一类:北京、上海;第二类:天津、陕西、辽宁、吉林、黑龙江、湖北、江苏、四川、山东、甘肃、浙江、福建、云南、海南、青海;第三类:广东;第四类:其他地区;第五类:西藏。

图3结果还有树状图可以看出,北京,上海的高等教育状况与其他地区相比有非常大的不同,主要集中表现在每百万人口的学校数量和每10万人口的学生数量以及国家财政预算内普通高校经费占国内生产总值的比例远远高于其他地区,这与北京上海是我国政治文化中心的情况是类似的,北京,上海的高校数目也是位列全国之首,第二类的天津、陕西、辽宁等城市作为第二类,仅次于北京上海,高等教育水平中上,有比较多的资源,比如现在西安,武汉的高校数目也是比较大的,毕竟之前西安是古代的首都,也是文化的政治中心,第三类是广东,这个跟现在有一点出入,自从改革开放起来,广东的经济快速发展,现在已经成为了一线城市,第四类的地区资源比较匮乏,国家财政还有高校资源相对比较稀缺,是国家教育大力扶植的对象。对于西藏,作为一个非常特殊的民族地区,其高等教育情况和其他地区不同,被单独聚为一类,主要表现在资源比较匮乏,人口相对比较少,经费比较稀缺,高等院校的规模较小,师资力量薄弱,最近不是一直向西藏提供支教,来提升西藏的教育水平。

Figure 3. Clustering results of class average method

图3. 类平均法聚类结果

2) 由图4,我们用ward方法聚成5类,来分析一下高等教育发展的状况。如果用ward方法把我国30个地区分为5类,结果为:

第一类:北京、上海、广东;第二类:天津、黑龙江、云南;第三类:陕西、辽宁、吉林、湖北、江苏、四川、山东、甘肃、湖南、浙江、福建、海南、青海;第四类:新疆、山西、河北、安徽、江西、内蒙古、河南、广西、宁夏、贵州;第五类:西藏。

从以上结果还有树状图可以清晰看出,ward方法聚类的效果的确比其他聚类方法要好,更接近实际的情况。我们分析下,北京、上海、广东位于教育资源最多的三个城市,高校数目也比较多,跟现在政治经济是吻合的,北上广深,人才都挤到这几个城市去,自然教育水平发展也比较好。次于三个城市的有天津、黑龙江、云南,这些也是比较早的文化产地,高等教育情况也是相对比较充足。对于陕西、辽宁等城市,这边高校资源中等,学生数目也比较多,但是经济发展状况不是那么良好,教育环境有待提高,到了后面的西藏依然是自行一类,正是因为西藏作为一个非常特殊的少数民族地区,并且还伴有藏独等现象,这边的教育资源,人口资源,高等院校的规模都相对比较小,导致教育资源稀缺 [4]。

Figure 4. Ward clustering results

图4. Ward方法聚类结果

7. 问题与建议

根据以上的分析可以指导,在我国各省市之间,存在着严重的教育不平等的问题,无论是在硬件措施,教育水平,还是科研成果中,30个省市的教学实力都不均等。针对以上的问题我从学校、政策、社会角度提出以下建议。

1) 在偏远地方,应该多建一些学校,给每个学生提供平等教育的机会,把一些偏远地区学校的师资力量提高上来,支援外教,引进人才,制定一些福利政策,上学有优惠政策,提倡人人读书,学文化。

2) 在政策方面,国家应该加大政策力度,保障义务教育,提高教育的软实力,把一些好的硬件措施,一些珍贵的文献教材引入偏远地区的图书馆,提高学生的阅读水平。

在社会层面,应该积极号召人群给偏远山区捐款捐物,给学生提供最基本的保障,然后鼓励学生学以致用,学会了知识回到这里教书育人,给更多的学生创造更好的教育资源。提升社会公平的意识,在教育发展的过程中,特殊区域有特殊教育政策,只有全民的公平意识得到质的飞跃,才能根本上解决我国的教育不公平的问题 [5]。

参考文献

[1] 司守奎, 孙兆亮. 数学建模算法与应用[M]. 第二版. 北京: 国防工业出版社, 2010.
[2] 王学民. 应用多元统计分析[M]. 第五版. 上海: 上海财经大学出版社, 2017: 167.
[3] 王学民. 应用多元统计分析[M]. 第五版. 上海: 上海财经大学出版社, 2017: 171.
[4] 何嘉鹏, 梁周扬, 曲懿恒. 利用聚类分析研究全国教育的发展状况[J]. 中国集体经济, 2008(7): 123-124.
[5] 晏正春. 我国教育公平的测度分析[J]. 经贸实践, 2018, 242(24): 210-211.