1. 引言
高等教育的目的是培养人才,是国家竞争力的核心和基础。如何评价和完善一个国家的高等教育体系是当前研究的热点问题,而高等教育及其可持续性,是高等教育体系评价的核心。因此,对世界各国的高等教育可持续性进行定量分析评价,既有助于了解国外高等教育体系的发展模式和发展特点,也对国内高等教育健康发展具有实际意义。
就高等教育可持续性的分析评价而言,现有的大多数文章基本是针对于某个国家的高等教育可持续性来进行相关政策影响分析 [1] [2] 及相关书评 [3],缺少对于各个国家高等教育可持续性普适的、定量的评价研究方法,而且就已有的一些评价模型而言,仍存在以下问题:
1) 缺少评价高等教育体系可持续性的完整指标体系,指标体系筛选不够全面。
2) 体系指标的量化方法单一,指标权重计算方法仅基于数据集进行赋权,结果过于依赖数据,忽略其余社会因素的影响;或者赋权时过于主观,缺少客观数据支撑依据。
3) 缺少对于高等教育发展可持续性发展针对性的政策建议。
因此,本篇文章以研究建立一个多维度的高等教育可持续性评价模型为目标,从发展水平(Development)、公平性(Inequality)、稳定性(Stability)、贡献成果(Contribution)累计以及其他(Others)五个维度来对高等教育可持续性进行全面分析,综合熵权法和模糊层次分析法,建立了DISCO模型,从而能够全面、多维度的评价高等教育可持续性,能够更有针对性的给出建此政策。
2. 三级可持续性评价模型的构建方法
本文围绕发展水平(Development)、公平性(Inequality)、稳定性(Stability)、贡献成果(Contribution)累计以及其他(Others)这五个维度,建立三级指标体系,综合熵权法和模糊层次分析法计算指标权重,构建高等教育可持续性评价DISCO模型。
2.1. 评价模型的数据维度组成
为了建立高等教育可持续性评价体系,结合新发展格局下的高等教育结构特征,本文采用分析法 [4],全方位考虑影响高等教育发展可持续性的因素,将其分为以下五个方面:发展水平、公平性、稳定性、贡献度以及其它方面,来多角度、全方位的构建评价模型。
1) 发展水平
高等教育发展水平是一个国家高等教育系统运转的产出,它可以从这个国家高等教育发展的规模、质量和国际化程度来反映 [5]。本文选择从以上三个方面来衡量国家高等教育发展水平,其中,对于高等教育的规模发展 [6],高等教育毛入学率与其具有高度的相关性,李硕豪和李文平(2013)以高等教育毛入学率作为其衡量指标 [7] ;衡量高等教育质量均衡方面,考虑现有的高校质量综合评价排名体系,总体上看, THE世界大学排名指标体系最为全面和均衡 [8],因此本文利用THE大学排名来衡量不同国家高等教育的质量均衡情况;而高等教育国际化体系强调维度之一是研究人员和学生的跨国流动 [9],本文以高校留学生所占比率对应量化高等教育的人员流动情况。
2) 不公平性
Maia Chankseliani [3] 指出,高等教育可持续发展的目标之一便是平等接受高等教育,即高等教育的公平性。同时,高等教育的可持续发展能够推进人类进化、知识生产、创新等。本文综合考虑高等教育公平与性别 [10] 、财富之间的关系,分别从男女入学比率、GINI指数 [11] 两个指标角度来衡量高等教育的公平性,间接衡量该国高等教育可持续性发展水平。
3) 稳定性
高等教育体系的稳定性,指的是在一段时间内的可持续发展的健康状态和活力性能。本文将2020年的疫情停课情况等效为高等教育系统在面对突发情况时的稳定性及抵抗力,并选取高等教育和科研经费占国家财政支出百分比作为指标来衡量高等教育体系的稳定性。
4) 贡献度
高等教育通过培训研究人员的和积累研究成果,对经济、社会和科学技术的许多方面做出了不小的贡献 [5]。高等教育的贡献度是一个国家高等教育系统办学效率的直接体现,有效率的高等教育格局与其可持续发展相适应,因此本文收集分别使用各国诺奖获奖人数、科研人员数目、科技论文数目等指标来量化不同国家对知识科学社会等的贡献度。
5) 其它
一个国家的高等教育规模与经济发展相辅相成,经济发展推动了高等教育规模扩大,而高等教育的发展又促进了经济增长 [6],同时,国家科技水平在硬件设施方面的投入及发展情况也对高等教育可持续发展起着重要的作用。本文分别将人均GDP和电脑普及率作为国家经济水平和国家科技硬件设施条件水品衡量指标。
2.2. 评价模型的指标体系构建
为了建立前面的高等教育可持续性评价体系,本文在对以上五个方面归纳整理、一致性检验的基础上,遵循指标数据的敏感性、可获得性、可扩展性及国际可比性原则,同时结合考虑全球突发紧急情况,进一步遴选指标参数,划分层级,对这些指标做相关分析和一致性检验,筛选出与高等教育竞争力较为相关的指标从而构建出三级15项指标的高等教育可持续性评价指标体系(见表1)。
2.3. 评价模型指标权重计算
本文使用了客观赋权方法熵权法来进行二级三级指标的权重计算,并考虑到社会实际影响因素和熵权法权重计算过于依赖数据的不足,结合模糊层次分析法,对一级指标进行赋权。
2.3.1. 二、三级指标权重计算
作为一种客观赋权方法,熵权法可以最大限度地避免主观因素对结果的影响 [12]。熵权法的衡量标准是指标的变动程度,即变动程度越高,权重值越大。

Table 1. Three level index system for higher education sustainability evaluation
表1. 高等教育可持续性评价三级指标体系
1) 各指标数据规范化
这里采用极值法对各指标数据进行标准化处理,其中,正向指标和负向指标采取不同的方法来进行标准化,以保证数据的非负性。
正向指标:
(1)
负向指标:
(2)
其中
为标准化变量。
为
和
分别为各指标数据的最大值和最小值。
2) 各指标信息熵计算
接下来,本文计算国家i在高等教育指标j下的权重。然后将其看为计算信息熵的概率
。这里n为国家数,k为指标数。
(3)
根据信息论中信息熵的定义,一组数据的信息熵
为
(4)
如果
,则
3) 各指标权重值计算
根据上式(4),计算各指标的信息熵为
。归一化基于式(5),得到各指标的权重
。
(5)
4) 计算结果
在划分二级、三级指标的过程中,本文将政府投入划分为二级指标,包括高等教育投资占GDP比率和科研经费占GDP的比例这两个三级指标;科研人员这个二级指标包括的三级指标有:诺贝尔奖得主数目和科研人员人数(每百万);同时,二级指标研究成果包括的三级指标有:专利申请、科技期刊论文、知识产权使用费和高技术出口。经过以上计算,三级指标权重如表2所示,其余的二级指标只包括一个三级指标,故不再于表2中列出。

Table 2. Some three-level index weights
表2. 部分三级指标权重
在确定三级指标权重后,本文仍根据前述步骤采用熵权法求出二级指标的权重,结果如表3所示。
2.3.2. 一级指标权重计算
模糊层次分析法(FAHP)是一种定性与定量相结合的方法。本文基于FAHP的特点,来弥补熵权法权重计算过于依赖数据的不足,因此采用FAHP-熵权法的综合赋权方法来计算指标权重,构建指标体系。
1) 建立模糊判断矩阵
为了比较任意两个指标相对于评价对象的重要性,本文使用0.1~0.9标度量表 [13] 给出了表4所示的定量量表。
在定以上量量表的基础上,通过文献收集和归纳,本文得到如下模糊判断矩阵R,
2) 构造模糊一致判断矩阵
然后得到模糊一致判断矩阵
,
(6)
(7)
3) 计算各指标权重
在此步骤,本文用式(8)处理模糊一致判断矩阵R,得到权重
。
(8)
4) 计算结果
在得到三级指标和二级指标的权重的基础上,本文使用FAHP得到5个一级指标的权重,如表5所示。
2.4. 评价模型建立
设国家i在指标j下的得分为
,相应的权重为
,则国家 的高等教育体系的得分K为
(9)
为了便于比较,本文将分数K放大100倍,使其分布在0到100的区间内。因此,国家i的高等教育体系的最终分数是
。影响高等教育体系的发展水平(D)、不平等(I)、稳定性(S)、贡献(C)和其他(O)的计算公式如下:
(10)
总的来说,本文所建立的该模型,可以评估任何国家高等教育系统的可持续性。
3. 三级可持续性评价模型的应用
本文基于DISCO评价模型结果,制定评价标准,规定高等教育可持续性健康得分,以此为依据,进行扩展应用;选取一个国家的评价结果,进行针对性的分析,提出相应的建议政策,并预测建议政策的效果。
3.1. 评价标准制定
当评价一个国家的高等教育的可持续性时,既要考虑其在该模型下的得分,本文还需定义一个标准分数来对其进行划分,判断其是否到达标准要求。为了实现目标,本文计算了健康可持续发展的高等教育体系标准分数。健康得分是衡量某一国家高等教育系统是否健康的标准分数,对于第j项指标,去掉十四个国家中该项指标的得分极值,取剩余国家中排名第三的得分为指标j的得分,得到向量
。通过式(10)最终计算出健康标准得分为48.42分。
3.2. 评价模型的应用
本文选取了六个不同地理位置、不同教育模式的典型国家,来对DISCO评价模型的准确性和实际应用性进行验证分析。并选取日本进行针对性分析,提出相应的政策建议,并通过PMC模型量化政策,基于神经网络预测实施效果,验证了政策的有效性、模型的实际应用价值。
3.2.1. 评价模型的应用对象
在该步骤,本文选择了中国、法国、挪威、日本、印度、美国这六个国家来对本文的模型进行应用验证,这六个国家分别来自不同的地理位置、拥有不同的经济体制、教育模式等,能够对本文的模型进行全方位的验证,在最大程度上保证模型的准确性和可用性。
1) 中国
中国对应雷达图为图1(a),在本评估体系中,中国在贡献方面得分较高,发展方面得分较低,这一点从一下国内现状中得以验证:在中国的不少高校中,教师的升职评级与课题科研等直接相关,这就造成许多教师只能将大量的时间精力放在科研方面,而不能够在教学给予足够的重视,这综合体现在中国高等教育环境现状为:在科研论文专利方面比较突出,但是在教学授课方面投入较低,国内高校现状内卷化严重,比较重视论文发表、科研项目等,在教书和方面重视度不够。
同时,政府对教育投入不足、教育公平性较差,其中高职这类学校的学费比北大要高很多,但其学生所接受的教育质量却远不如北大,个人付出的成本高却接受到低质量教育,即高等教育的体制性不公平,这验证了本模型中国高等教育的公平性较差的评价结果。
由于中国仍然是一个发展中大国,对于教育的投资占比较低,经济发展水平和国内硬件教学设施较发达国家有较大的差距,这一点体现在计算机普及率不高及人均GDP较发达国家仍有较大的差距,这一现状对应于本评估体系结果:中国在此方面得分较低。
为了全方位衡量高等教育系统的稳定性,本体系还考虑到了突发状况对于高等教育系统的冲击和影响。在疫情期间,中国采用了线上授课这一方式,将疫情对高校教育的冲击损害尽力降至最低,并保证了教学进度和教学计划正常安排。这说明了中国高等教育系统稳定性高,即在可持续方面得分较高,验证了模型评价结果的正确性。
2) 法国 [14] 和挪威
法国和挪威对应雷达图为图1(b),图1(c),这两个国家均属于欧洲国家,这两个国家经济发展水平较高、政府对教育投资占比较大;同时,计算机普及程度远高于发展中国家;即对应于本评估体系中其在其他方面、可持续方面、公平性方面得分都比较高。
3) 日本
日本对应雷达图为图1(d),日本高等教育目前私立学校比重大、培养模式开始面向大众转化 [15]。同时,较发展中国家,日本的人均GDP高,高等教育接受率高于OECD国家平均水平13个百分点,政府对于教育经费投入为12100美元,高于世界平均水平 [15],说明了日本高等教育在本体系中其他方面和稳定性方面应得分较高,符合模型结果。本文在下述步骤中,选择日本来进行模型应用,针对性提出建议政策。
4) 印度 [16]
印度对应雷达图为图1(e),在本评估体系中,印度在五个指标方面表现均在较低水平。结合其国内现状,分析如下。首先,印度高等教育突出表现为公平性较差:性别歧视问题严重,女性识字率极低;教育资源分配不均,着重扶持信息科技产业,妇女教育等投入甚少;同时,印度政府对于教育投资占比GDP低,不足4%,教学质量较差,教师素质不高缺乏应有的待遇,儿童入学率不足60%,较联合国教科文组织给出的6~14周岁儿童85%的入学率相差甚远;根据世界银行2015年数据统计:印度高等教育毛入学率54.6%,相当于中国20年前的水平;硬件设施的缺乏和师资力量的薄弱导致印度在科研和教学这两方面,更难以到达基本水平。
5) 美国 [17]
美国对应雷达图为图1(f),对比中国高等教育,美国对于科研方面和教学方面有同等的重视程度,并且一直以来以教学为核心地位从未动摇,营造了比较健康的学术环境和教育环境,使得科研和教学这两方面相辅相成、共同发展;反映在在本体系中,美国在贡献方面和发展方面得分均较高,这一现实验证了本评价模型的正确性和符合现实性。对比日本2016年《情报通信白书》和美国统计局2013年美国PC家庭普及率统计数据,可见美国的PC家庭普及率远高于日本,即高于大多数发展中国家和发达国家,同时,作为发达国家,人均GDP水平也较高,这一结果符合本评估体系评估结果,即美国在其它方面得分较高。
3.2.2. 评价模型政策的量化
1) 提出政策建议
基于日本高等教育可持续性评价结果得分,并综合考虑制定的健康可持续标准,本文针对其提出以下两条建议政策,并将其量化来预测建议效果,以验证模型的有效性和可用性。
政策1 (P1):降低公立大学学费;扩大高校国际合作规模;加强招收低收入家庭学生;并提供入学奖学金。
政策2 (P2):加强国家对科研方面的投入;产学合作,在医疗保健、可再生能源、环境技术、信息交流等领域建立国际科研基地;派遣优秀研究生赴海外进修深造。
2) 政策建议量化
本文针对P1和P2这两个政策进行评估,基于PMC指数模型和文本挖掘方法,在NLPIR大数据语义智能分析平台,得到多投入产出表6。
对于一级指标i下的二级指标j,其得分
的值均为0或1,评分标准如表7所示。对于一级指标i,其得分为
(11)
PMC指数计算见式(12)
(12)
在计算PMC指数后,根据得分对政策进行评级,其得分标准见表7。

Table 6. Multiple input-output table
表6. 多投入产出表
基于表7所示得分标准及PMC指数计算结果表8,本文给出了P1和P2对日本高等教育体系的影响因子分别为6.76和7.64,其结果见表9和图2。

Table 8. Scoreof input-output table
表8. 多投入产出表得分
3.2.3. 评价模型的应用效果
本文收集了2008到2018年的数据,对日本高等教育体系的多指标数据进行拟合预测,来评估P1、P2的效果。

Figure 2. PMC Curved Surface of two policies
图2. 两政策PMC曲面图

Table 9. PMC index of two policies
表9. 两政策的PMC指数
通过对日本已有数据的分析,本文发现其已有11个三级指标得分达到所规定的健康标准,因此,本文假设上述政策于2019年开始实施,并选择对其他的5个指标进行拟合预测分析:高校留学生比例、男女入学比率、诺贝尔奖得主数目、计算机普及率及高等教育投资占GDP比率。
本文发现,在没有政策干预的情况下,高校留学生比例、计算机普及率和男女入学比率已经可以达到目标指数得分,因此本文选择剩余两个指标采取政策干预。
在经过拟合后,本文发现,诺贝尔奖得主数目和高等教育投资占GDP比率这两个指标在没有政策干预的情况下很难达到目标得分。因此,在提出政策P1、P2和PMC指数的基础上,本文建立了关于政策影响的拟合回归方程,其拟合图像如图3所示。

(a)(b)
Figure 3. Policy effect fitting image
图3. 政策效果拟合图像
本文预计在政策干预的情况下,日本将于2035达到设定的健康标准总得分。针对其全部指标,日本预计在2060年左右达到本文设定的标准,即所有指标得分全部达到健康标准各指标得分,届时日本高等教育系统的得分为51.46。没有政策干预的情况下,日本高等教育系统的得分为38.81。由此,由于政策干预,日本的高等教育系统得分上升了32.6%。
4. 结论
1) 指标体系
本文综合考虑高等教育可持续性的内涵特征及影响因素,围绕着发展水平、贡献度、公平性、稳定性等五个方面全方位、多层次地对其进行了量化评估计算,筛选建立了完整的高等教育可持续性三级指标评价体系。
2) 指标量化
采取模糊层次分析法和熵权法综合指标量化方法,本模型既保证了有效的数据支撑和客观性,也结合了非量化因素的影响,避免了评估过程中存在指标不确定及模糊的情况,得出了较为客观合理的评价结果。
3) 政策建议
筛选收集实际数据,应用DISCO理论模型,联系国家实际背景,本文对多个国家高等教育可持续性进行定量分析,确定各个国家不同的发展形势,并进行横向、纵向对比评价。实验结果帮助找到各国家高等教育可持续性发展的不足之处,提出针对性的政策建议,并进行及时的调整。同时也验证了政策建议的有效性、合理性和普适性。
4) 指标体系的可扩展性
由于各国家高等教育可持续性特征含义差别不大,组成结构基本一致,且FAHP得到的权重向量具有普遍性,本评价模型指标体系具有可扩展性,随着高等教育可持续评价涵盖内容的不断变化,本指标体系可以根据其实际发展情况进行指标的增减和修改。
综上所述,本文建立了一个定量评估、具有普适性的高等教育可持续评价模型,填补了以往此方面评价模型的缺失,有利于推进对高等教育可持续性的进一步研究。
基金项目
项目名称:中国地质大学(北京)大学生创新创业训练计划项目A;编号:228。
NOTES
*第一作者。
#通讯作者。