1. 引言
近年来,新的高考改革已经在全国范围内如火如荼地展开,与新高考制度紧密结合的高中生综合素质评价也成为了教育界的热门话题。建立系统的高中生综合素质评价指标体系,对高中生进行客观的综合评价具有重要的现实意义。
国外的中学生综合素质评价已经趋于完善,其先进教育经验也已经成为我国高考制度改革、实施高中生综合素质评价的重要参考依据。马世晔 [1] 介绍了国际上主要的几种大规模教育评价体系和该教育评价的系统化、规范化和多元化等主要特点,并总结出国际教育评价对我国教育的启示。孟文娉 [2] 分别阐述了英国、美国、新加坡以及韩国的高校招考制度中的综合素质评价,总结了他们多元化、多样化的录取标准以及对我国的启示。
国内对于高中生综合素质评价的研究大多偏向理论分析,对于实践性的应用研究很少。周先进 [3] 就针对高考改革问题,指出了将高中生综合素质评价纳入高考体系的可行性和不易操作性;崔允漷 [4] 也对我国各地的综合素质评价政策实践的现状与问题做出了考察分析,并结合与其它发达国家教育政策的对比提出自己的建议。高中生综合素质评价的关键就是评价指标的选取,有许多学者对其进行了研究。表1列举了一些研究中所建立的综合评价指标体系的部分指标。
综合上述研究,存在如下的问题:一是指标体系并没有进行科学的验证,使得各个指标间的区分度与归属性都较差;二评价的指标不统一,不同地区的教育特点不同,导致所采用的评价指标体系也会产生较大的差异,难以统一标准;三是指标权重设置方法主观性较强。因此本文将在上述研究的基础上,构建新的综合评价指标体系,并提出一种修正综合评价指标体系的方法。

Table 1. A list of comprehensive quality assessment indicators for high school students in some studies
表1. 一些研究中的高中生综合素质评价指标列表
2. 高中生综合素质评价指标体系的构建与修正
2.1. 综合评价指标体系的建立依据
教育部出台的《关于加强和改进普通高中学生综合素质评价的意见》(以下简称《意见》)中明确要求要从思想品德、学业水平、身心健康、艺术素养以及社会实践这五个方面来反映学生的全面发展情况和他们自身拥有的个性特长,考察学生的社会责任感、创新精神和实践能力。美国著名的心理学家麦克利兰曾根据人的素质表现提出“冰山模型” [11],认为一个人的个体素质可划分为外在表现与内在表现,外在表现是能够被了解与测量的部分,容易改变,如基础知识、基本技能等,而内在表现是人体内在的、难以测量的部分,不易改变,如自我形象、社会角色等。本文以《意见》的要求以及“冰山模型”为依据,在表1的基础上构建了新的高中生综合素质评价指标体系。
2.2. 评价体系的初步建立
根据前文所述综合评价指标体系的建立依据,初步确定了由身心健康、个人修养、学习状态、兴趣爱好以及社会实践5个二级指标,一共包含18个三级指标的综合评价指标体系,如表2所示。

Table 2. Index of evaluation of comprehensive quality of high school students
表2. 高中生综合素质评价初始体系指标
2.3. 高中生综合素质评价调查问卷
表2给出了问卷和指标体系中指标的对应关系。调查问卷分别在重庆长寿中学和重庆渝高中学进行发放,这两所学校均属于重庆市普通中学,学生层次相近,在一定程度上能代表重庆市高中生的一般水平。总计发放了736份,收回了649份,剔除无效问卷64份,得到有效问卷585份,有效率90.1%。作答学生分布在高二的不同班级,其中文科班参与问卷调查的有318人,占作答总人数的54.4%;理科班参与问卷调查的有267人,占作答总人数的45.6%。
2.4. 综合评价体系的检验与修正
首先对调查问卷进行信度分析,运用SPSS软件对问卷数据进行整体的克隆巴赫系数计算,得到的数值为0.884,接近0.9,则说明本次收集的问卷数据总体是很可信的,然后又对每个二级指标进行克隆巴赫系数计算,得到的具体数值如表3所示。

Table 3. Cronbach coefficient of initial comprehensive evaluation index system
表3. 初始综合评价指标体系的克隆巴赫系数
其中身心健康和个人修养这两个指标的克隆巴赫系数均在0.8及以上,则可以表明这两个二级指标的内在一致性良好,但学习状态、兴趣爱好和社会实践这三个二级指标的克隆巴赫系数都小于了0.8,则说明这三个二级指标内的三级指标需要修正。计算该指标体系的KMO值为0.868,说明可利用主成分分析法来对初始综合评价指标体系进行探索性分析,提取4个主成分,构建新的综合评价指标体系。新的综合评价指标体系与初始指标体系基本一致,仅有的两处不同就在于将“实验表现”归属于“学习状态”以及将“兴趣爱好”和“社会实践”合并为一个二级指标“社会实践”。此时,4个二级指标的克隆巴赫系数都已经大于0.8,如表4所示。这说明修正以后的综合评价指标体系的一致性良好。

Table 4. Revised Cronbach coefficient
表4. 修正后的克隆巴赫系数
3. 高中生综合素质评价结构方程模型
结构方程模型在社会科学研究中是一种常用的融合了因素分析和路径分析的多元统计技术,可以用于处理一些不可观测的变量以及多变量、多结果的关系。
3.1. 结构方程模型
结构方程模型一般包括两个部分:测量模型和结构模型,其矩阵方程组如下所示:
(1)
其中,方程组中的第一个方程为结构模型,
、
为内生与外生潜变量向量,
、
为
、
的结果系数矩阵,
为结构模型的误差向量。后面两个方程为测量模型,x、y为内生与外生观测变量向量,
、
为回归系数矩阵,
、
为观测模型的误差向量。
3.2. 模型识别与估计
本文结合最终构建的综合评价指标体系来建立结构方程模型。首先,根据上文所得的评价指标体系画出高中生综合素质评价模型对应的路径,如图1所示。图中均由5个潜变量(椭圆形:综合素质、身心健康、个人修养、学习状态、社会实践)、18个观测变量(长方形:身体素质、集体意识、学习态度和艺术活动等)以及22个残差变量(圆形:e1~e18,t1~t4)构成。根据路径图可知,模型中待估参数有40个,数据资料点数为171,可以进行参数估计,且自由度为131。图1中单向箭头上的数字表示为对应的回归系数。

Figure 1. Initial path map of comprehensive quality evaluation for high school students
图1. 高中生综合素质评价初始路径图
3.3. 模型拟合与修正
为防止模型估计的结论产生误导性,需要对估计结果进行检验。表5则展示了该模型拟合指标以及对应的检验值。

Table 5. Model fitting index and test value
表5. 模型拟合指标及检验值
从表5中的模型拟合指标和对应的检验值可看出,卡方值与自由度的比值(CMIN/DF)小于了5,属于理想结果,RMSEA (近似误差均方根)的值小于0.08,也属于理想结果,IFI (增值拟合指数)和CFI (比较拟合指数)均大于了0.9,也符合理想标准范围,但TLI (Tucker-Lewis指数)小于0.9,检验结果不理想,需要利用MI修正指数来对该模型进行修正。
通过修正得到了最终的结构方程模型,其各个变量之间的路径系数如图2所示,从二阶因子的分析结果来看,除了校外辅导,其它的二阶因子的载荷均在0.5以上,则可以表明二阶因子与一阶因子之间的关系较强,且二阶模型能够充分地表达一阶因子间的关系,从而使得这四个一阶因子可聚合为“综合素质”。最终得到了高中生综合素质评价结构方程模型,模型的具体表达式见附录。

Figure 2. Finalpath map of comprehensive quality evaluation for high school students
图2. 高中生综合素质评价最终路径图
3.4. 结果分析
根据图2的路径系数,确定高中生综合素质评价的二级指标及所属的三级指标的路径系数和归一化处理后的权重,结果如表6所示。

Table 6. Evaluation index system standardization path coefficient and weight
表6. 评价指标体系标准化路径系数及权重
表6给出了综合评价指标体系中各级指标之前的权重关系,根据二级指标的权重,可得到高中生综合素质评价的综合评价值为:
(2)
指标的权重反映了该指标在进行高中生综合素质评价时应占有的比重,单从表6中给出的各指标所占权重结果来看,与国家对高中生的培养方案相一致,更注重学生学习能力与实践能力的培养。
4. 对重庆两中学的学生学习情况的评价分析
基于重庆市两中学的调查问卷数据进行实证分析。根据上文利用结构方程模型求得的各项评价指标的权重,可结合实际调查数据计算出重庆市两中学高中生的综合素质得分。首先利用学生对问卷的回答和真实成绩,通过加权求和的方法计算出各项二级指标的评价得分,从而根据式(2)计算得到高中生综合素质评价的综合评价值。
结合每个学生的高二总成绩以及从高一到高二的文理科年级排名变化情况(正为上升,负为下降),由于参与调研的学生较多,这里就不一一展示他们的综合得分情况,只列举出了前二十名的学生学习情况,即选取高二总分排名前二十的学生,并将其对应的综合评分进行从大到小的排序,得到表7的数据。

Table 7. Scores of the top 20 students
表7. 学生前二十名的得分情况
根据表7可看出,考试总分高的综合素质得分不一定高,且综合素质得分高的也不代表各项二级指标都高,这说明单单从考试成绩来判断一个学生的学业好坏并不科学,需要从学生的各方面来综合评价,毕竟每个人的个性与特性都不一样,存在个体差异性。
从上述表格的得分情况来看,参与调查的学生从高一升到高二的成绩排名都有很大的变化,大多数的排名均上升,也有小部分排名下降,因此,在科学评价学生的成绩时,也需要过程性评价,需要全面了解学生考试成绩的变化情况,了解学生的可塑性高低。由于综合素质评价和高考“硬挂钩”,则各个高校在录取学生的过程中,可以以自己学校所看重的点来利用加权平均的方式将综合素质与高考得分进行结合,总的分析学生的优异程度,挑选出自己所需要的人才。
5. 结论
根据国家政策的要求,在前人研究的基础上构建了高中生综合素质评价指标体系,建立了综合评价结构方程模型。通过问卷调查的方式从重庆市两所中学获得了相关数据,并对两所学校学生的综合素质进行了实证研究。结果表明,高中生综合素质评价应该从四个方面来进行,分别是身心健康,个人修养,社会实践以及学习状态。四个方面的权重值相差不大,其中,权重值最大的是学习状态,权重值为0.31,权重值最小的是身心健康,权重值为0.21。综合评价结果和考试成绩之间没有必然的联系,考试总分高的综合素质得分不一定高,且综合素质得分高的不代表各项二级指标得分都高,这恰好是综合评价的目的所在,能综合各个方面去对高中生的综合素质进行综合的评价。此外,评价的结果显示,理科生的综合评分明显比文科生高,由此可看出文理分科不利于学生综合素质的培养,进而说明了新高考改革中取消文理分科的正确性。
基金项目
重庆市社会科学规划项目(2018BS56)。