1. 引言
国内现有的专业建设评价主要以办学资源、科研绩效等量化指标为主,其容易被窄化为专业排名。在“双一流”建设语境 [1] 下,我们需要引导高校将注意力转向内涵建设,着眼专业长远发展规划,推进体制机制的综合改革。目前我国在高校评价指标体系构建研究上已经取得了很大进展,也有大量的研究团体以及研究人员对本科专业建设质量进行了研究,并且给出了许多排名,但这些评价、排名仍然存在一些不足,包括:没有明确介绍评估目标、评估指标体系和量化度量模型排行榜;各机构的参考指标、评价项目、评价重点往往各不相同;评估方法手段和标准单一;这些研究主要针对全国高校,不考虑地域、高校性质等因素。对于山西省的高校,目前还缺少专门针对此类地区且体系较为健全科学的专业建设质量评估体系。
在此背景下,本文拟以“高等教育质量监测国家数据平台”的数据作为基础,按照一定规则和筛选标准处理数据,并且利用因子分析对所选数据进行校验与筛选。在此基础上,教育部门或高校在确定评估目标和评估作用后,建立适应这种评估目标和评估作用的评估指标体系 [2] [3] [4] [5] ,然后通过基于RankNet神经网络模型来实现各三级指标的权重计算,并使用模糊数学计算模型来实现专业建设质量的排序结果。从而构建本科专业建设质量评价系统,为教育部门、高校提供较科学、合理、可靠的山西普通高等学校专业建设质量模型。
美籍教育批评家斯塔弗尔比姆提出了一种新的课程评估模型即CIPP评估模型 [6] [7] [8] ,它强调“评估是为领导决策提供数据支撑的一种过程”,其基本理念是“评价最重要的目的不在证明,而在改进”。该模型由“背景评估”、“输入评估”、“过程评估”和“结果评估”构成,可以运用于专业建设的总体流程,为建立合理的评价指标体系提供思路。
2. 评价指标体系的建设
2.1. 研究目标
1) 利用山西本省各高校相关数据,建立对山西高校全覆盖的专业建设质量评估模型。
2) 构建度量量化模型形成完整的专业建设质量评估体系以供山西省各高校不同专业进行实时的质量评价。
3) 为各高校的不同专业提供改善专业建设质量可行方向的可靠依据。
2.2. 研究方法
研究探索CIPP评价模式和专业周期理论,将其结合专业建设的一般过程进行思考,作为本项目的理论基础。
利用访谈法对行业内专家进行访谈,访谈专家们对于评价指标体系的建立的因素思考,结合专家们的建议和文献研究来初步构建专业建设质量评价指标体系。
利用因子分析法对收集所得的数据进行信度与效度检验以此确保数据的可用性,并利用因子分析筛选影响因子较小的指标将其筛去,进一步修改评价指标体系。
2.3. 研究思路
本文研究思路见图1:

Figure 1. Research ideas and technical diagrams
图1. 研究思路技术图
2.4. 模型研究
在科学理解高校专业建设基本内涵和参阅相关文献的基础上,参考教育部颁布的《普通高等本科教育教学审核评估指标体系》,并结合高校的实际情况构建高校专业建设评估指标体系,见图2。构建指标体系时,分为7个一级指标、22个二级指标、49个三级指标。
3. 权重的确定
3.1. 数据收集、整理与检验
通过研讨会及单位走访调研等多种数据采集方式,以山西各高校的“高等教育质量监测国家数据平台”的数据为主,结合其他官方网站数据补充来作为研究的数据支撑。通过访谈法对相关领域专家及教师进行深度访谈,提供指标初步构建的理论依据。由省属教育部门确定本项目的评估目标以及评估作用,并以此为依据指导评估指标体系的初步确立。依据初步确立的指标体系进行数据选择,完成数据收集。
首先对数据进行缺失值填补,这里使用K-means算法进行有效填补。然后对填补完整的数据进行无量纲化处理。设参与数据分析的各高校专业数量有n个,指标数量有m个,将各个指标值转换为标准化指标:
(1)

Figure 2. Professional construction evaluation index system
图2. 专业建设评价指标体系
为了检验收集与整理所得数据的可靠性与真实性,这里对数据进行信度与效度分析,利用SPSS软件进行信度与效度分析,见表1。由测量结果可以看出,信度与效度良好。

Table 1. Reliability and validity testing
表1. 信度与效度检验
接着进行KMO值和Bartlett球形检验,见表2,这可以反映数据之间是否具有较强的相关性,由结果知因子之间具有较强相关性,且适合做因子分析。

Table 2. KMO value and Bartlett sphericity test value
表2. KMO值和Bartlett球形检验值
3.2. 基于RankNet算法确定权重
本文采用RankNet的神经网络模型对专业建设指标的权重进行计算。RankNet算法是一种从概率的角度来解决排序问题的方法,其核心思想是构造概率损失函数来学习Ranking Function,并以此为工具对文档进行排序。RankNet不依赖于特定的机器学习模型,而是基于神经网络实现,使用误差反向传播训练模型。
基于RankNet神经网络模型的指标权重确定过程:
输入数据:将专业建设三级指标相关数据构成的特征向量组输入进RankNet神经网络中;
成对数据生成:随机选中一组指标数据进行计算;
模型建立:RankNet神经网络中,将每一对指标的数据作为输入,并将它们的权重值作为输出,使用交叉熵损失函数来训练模型;
训练模型:使用随机梯度下降算法来最小化交叉熵损失函数,更新模型参数,使得模型计算的权重值能够尽可能地接近真实的结果;
模型迭代:重复步骤2~4,直到达到指定的迭代次数或者损失函数收敛。
在本文中RankNet网络选择特征向量49个,即输入层神经元个数为49,隐藏层设置为1层,将样本输入到RankNet神经网络进行训练后,得出专业建设指标权重,见表3:

Table 3. Weights of tertiary indicators for professional construction
表3. 专业建设三级指标权重
4. 三级模糊综合评价量化度量模型
依据RankNet算法计算各个指标权重,模糊综合评价法以RankNet算法所的权重为已知数据,在RankNet算法的基础上进行三级模糊综合评价。
4.1. 一级模糊综合评判
设评价集
代表m个不同的高校。
一级指标“师资建设”下属的三级指标是定量指标,有具体的数据,对这些数据归一化即求出各个高校的该指标与总指标的比重,得到单因素评价值。对于其他是量指标的因素,按照同样的方法得到比重。就可得到M个高校的单因素评价值,其中每一行数据的和为1,部分数据示例见表4。

Table 4. Example of normalized teacher structure data
表4. 归一化后教师结构数据示例
得到“教师结构”的各因素的单因素评价矩阵,矩阵中的数据即为表中相应位置的数据。记为
。然后利用已有的三级指标权重归一化后对涉及到的几个因子进行权重分配,记为
。则“教师结构”因素的一级评判为:
。
(2)
而权重分配
。
因此
。
4.2. 二级模糊综合评判
对于师资建设、学术科研、教学条件、创新创业、教学改革与研究、课程体系建设以及教学效果下属的单因素指标进行二级评判。专业建设质量情况的二级评判可以得到7个矩阵,对于师资建设,记其二级评判为R1,R1为5行m列的矩阵,将教师结构的一级评判结果作为二级评判的单因素评价值,即学生信息评判矩阵R1的第1行,给出师资建设一级指标各因子的权重A1,通过
计算得到师资建设对专业建设质量的隶属度。同理计算其余一级指标对专业建设质量的隶属度。
4.3. 三级模糊综合评判
将二级评判结果
作为行,组成三级评判的单因素评判矩阵
(3)
而各一级指标权重集
,根据
即可得到一个一行m列的矩阵,从矩阵每个元素的数值大小就可以判断出某高校的某专业建设质量的分值,分值越高,表示专业建设排名越高。从而得到不同高校的不同专业建设质量排名。
可以依据学科评估等级划分为山西省内高校专业建设质量设定评级,当参与的各学校各专业足够多时,专业建设质量的排名也就愈发准确,评级也愈发真实,选取学科评级可以让模糊评价法得到的结果更加可视化。进行评分评级后,可通过与各指标标准值进行距离计算来观察所评估专业建设质量的优势与劣势,分析原因,基于此对弱势指标进行大力改进,保持并优化优势指标,稳步推进专业建设质量。
5. 研究结论
本研究以i个高校不同专业为例,通过对较多高校各专业进行实证分析,以CIPP评价模式与专业生命周期理论为理论基础,以推动发展山西高校专业建设目标为导向,围绕师资建设、学术科研、教学改革与研究、课程体系建设等对山西省高校专业建设进行了系统性评价。首先,以教育部颁布的《普通高等本科教育教学审核评估指标体系》作为基础,并参考专家等给出的建议构建高校专业建设评价指标体系。其次,以“高等教育质量监测国家数据平台”所提供数据为依据,通过RankNet神经网络模型计算专业建设指标体系中各指标权重。最后通过三级模糊评价模型,从而可以快速对高校各专业进行打分排名及评级,然后通过与指标标准数据进行距离计算分析专业建设质量优势劣势;进而以分析结果与指标距离为依据,各高校可针对性地对专业建设提出对策与建议并进行改进。
致谢
感谢同事对于本文算法的建设性建议。
基金项目
山西省高等学校教学改革项目支持研究。