1. 引言
职业教育作为我国现代教育体系的重要组成部分,在培养技术技能人才、维护社会稳定、推动经济发展和促进就业等方面都发挥着不可替代的作用。构建科学有效的质量评价体系,是推动职业教育内涵式发展的关键环节。随着教育评价改革的深入推进,增值评价作为一种关注增长幅度、强调发展性、注重公平性的评价范式,为突破传统职业教育评价中结果导向与静态比较的局限提供了新的理论视角与方法工具。
本文旨在系统梳理职业教育增值评价的相关研究,首先追溯其历史演进与阶段特征,进而剖析其在学生发展、教学改进、院校优化及政策制定等多维层面的作用机制,最后结合技术发展与时代需求,对未来研究方向进行展望。对增值评价历史发展进程的整理有助于把握其理论源流与实践脉络;对增值评价多维作用的梳理有助于全面认识其教育价值与现实意义;对未来研究方向的展望有助于明确该领域的研究趋势与发展路径,从而为构建具有中国特色的职业教育评价体系提供参考依据。
2. 增值评价的历史发展进程
2.1. 思想萌芽与早期尝试
增值评价的理念根源可追溯至20世纪60年代。1966年,美国社会学家詹姆斯·科尔曼(James Coleman)发表了著名的《科尔曼报告:教育机会平等》(Equality of Educational Opportunity)。该报告通过大规模实证调查发现,学生的学业成就与其家庭社会经济背景的相关性远大于与学校资源投入的相关性。这一发现首次提出了教育的“净影响”概念[1],挑战了传统认为“增加学校资源投入就能自动提升学生成绩”的观念,引发了学界对如何科学评估学校“效能”的思考,为增值评价的思想播下了种子。
此后,教育界开始寻求能够分离学生背景因素、衡量学校自身贡献的方法。1977年,奥斯汀(Astin)提出了“输入–环境–输出”(I-E-O)模型,旨在通过统计方法控制学生的“输入”特征(如家庭背景、入学成绩),从而更清晰地考察大学“环境”对学生“输出”(学业成就)的“净效应”[2]。这一模型为教育效能的实证研究奠定了重要的方法论基础。
2.2. 政策驱动与广泛应用
在理论萌芽之后,政策驱动成为增值评价从学术研究走向大规模实践的关键力量。1984年,美国的《珀金斯职业教育法案》(Carl D. Perkins Act)通过,其核心目标是推动职业教育现代化、提升质量并促进教育公平[3]。该法案为使用增值评价等科学手段来评估教育效能、解决教育不公提供了法律和政策依据。在法律和政策的引导下,桑德斯(Sanders)及其团队于1992年开发了田纳西州增值性评价体系,采用多元线性模型,尝试剥离家庭社会背景、经济地位等因素的影响,通过分析学生学业成绩相对位置的变化来公平地评价教师和学校的效能。该体系在全州K3-K12年级广泛应用,使增值评价成为美国教育问责的新依据[4]。
值得说明的是,基础教育因有着统一的标准化测试体系,可以提供广泛、连续且有可比性的数据,其增值评价研究成果才得以广泛应用。因此,早期的增值评价主要应用于基础教育。直至哈蒙(Harmon)提出在职业教育和培训中设立增值指标[5],这才将增值评价正式引入职业教育中。
1986年,英国发布了《职业培训白皮书》,标志着其国家职业资格证书制度初步成熟,与之相对应的标准也日渐统一,这些都为增值评价在职业教育领域的发展提供了沃土。1995年,英国学者佩恩(Payne)在其报告《英格兰和威尔士青年群体报告——16岁的选择与24岁的结果:学术与职业教育培训路径的比较》中,基于“英格兰和威尔士青年群体研究”(YCS)的大规模纵向数据,采用最小二乘(OLS)模型,控制了学生GCSE成绩等起点因素,首次对职业教育路径开展了系统的增值评价研究。其核心结论是:对于学术起点较低的学生,选择职业教育和培训路径对其获得国家职业资格证书(NVQ)具有显著的正向“增值”效应[6]。该研究具有开创性的历史地位,它首次将增值评价范式从基础教育成功迁移至职业教育领域,用实证证据证明了职业教育作为“补偿机制”的公平价值,为后续职业教育效能研究奠定了方法论基础。随后,相关研究逐步深入。1997年,马丁内兹和鲁顿(Martinez & Rudden)进一步探讨了学业成绩与职业资格之间的增值关联。他们发现普通中等教育证书(GCSE)成绩与普通国家职业资格(GNVQ)成果之间存在显著的正相关[7]。之后,布拉德利和泰勒(Bradley & Taylor, 1998)从隐性增值视角分析了学校和个人因素对证书获取的影响[8]。至2000年,阿姆斯特朗和麦克维加(Armstrong & Mcvicar)运用有序probit模型,比较了职业院校学生与政府培训项目学员在职业资格增值方面的差异。其研究结果显示,两类教育途径在增值绩效上并无显著差别[9]。
从上述研究可以看出,从1986年至2000年间,职业教育领域的增值评价研究主要是围绕着职业证书获取率展开的,为职业院校和培训机构的教育诊断提供了方法和依据,但也存在数据来源单一、研究不够微观等问题。
2.3. 多元进化与统计优化
进入21世纪之后,为了更全面地衡量职业教育的复杂产出,获取的数据呈现出路径多元、指标多元、节点多元和对象多元的趋势。增值评价统计模型也实现了从简单到复杂的飞速演进。
在获取数据方面,2001年史密斯(Smith)在入学、中途和毕业三个时间节点进行了数据收集,且数据获取路径多样,采用了自评、问卷以及半结构化访谈的方式来获取数据[10]。而2006年修订的《珀金斯职业教育法案》中,也首次引入了包括学术成就、技术技能达成度、毕业率、安置率、非传统领域参与度与完成度、项目质量在内的6项评价指标,用于开展教育问责[11]。这6项指标作为增值评价的核心框架一直沿用至今,深刻影响了美国职业教育的评价范式。此外,2011年,欧盟在职业教育增值评价的应用基础上,实现了一次重要的范式拓展:将评价焦点从传统的教育机构层面(学生、教师、学校)延伸至产业层面[12]。它首次系统性地提出,应评估企业内部的职业培训以及外部输入的培训资源,究竟能为企业本身(体现在服务优化与生产效率提升)和员工个体(体现在技能增值与职业发展)带来多大的“净效应”。这一转变标志着增值评价不再仅是教育系统的内部管理工具,更演进为一种衡量教育投资对宏观经济和产业发展贡献率的重要方法。
在增值评价统计模型方面,其优化主要经历了3个阶段:第一阶段是分数差值模型,该方法较为直观简单,横向比较时通常将不同批次学生在同一阶段测试分数的平均值差异作为增值分数,纵向比较时通常将同一学生不同阶段测试分数的平均值差异作为增值分数。分数差值模型忽略了学生的起点水平、家庭背景等因素的影响,无法准确评估“净效应”,缺乏评价的公平性。第二个阶段是多元线性回归模型,此模型通过统计控制来提升公平性。它将多个可能影响结果的“控制变量”(如入学成绩、社会经济地位、性别、父母教育水平等)纳入一个统计模型中。前面提到1995年佩恩(Payne)使用最小二乘法分析英国青年数据的研究就是该模型的典型应用案例。多元线性回归模型比第一阶段的分数差值模型科学得多,能部分剥离外部因素的影响,更公平地估计教育本身的“净效应”。但它不能有效处理教育数据中固有的嵌套结构,会导致标准误估计偏差,影响结果的准确性。第三个阶段是分层线性模型,专门为处理嵌套数据而设计,能够精确分解变异来源,估算各层级的贡献,从而更加科学准确地估计学校或教师的真实效应。2010年蒂默尔曼斯(Timmermans)的研究就采用了分层线性模型来分析9万名荷兰中等职业学校学生学业增值与学校、培养方案之间的关系[13]。此模型被认为是衡量教育“净效应”的黄金标准,也是国外的主流研究模型。
国内职业教育领域的增值评价研究起步相对较晚。直至2001年,肖良松才首次倡议在中等职业教育中引入以学校为主体的增值评价[14],标志着相关理念的初步引入。此后一段时间,该领域在研究方法上也呈现明显滞后。例如,到2013年,王瑾仍致力于探讨如何将多元线性回归模型应用于高职院校的增值评价[15],而此时国际学界已普遍采用更为先进的多层线性模型开展相关研究。总体而言,我国职业教育增值评价仍处于对国际成果引进、消化和初步探索的阶段,尚缺乏大规模、系统化的实证研究与实践应用[16]。
3. 增值评价的多维作用分析
3.1. 赋能学生成长:激发内生动力与规划发展路径
增值评价通过聚焦学生个体的进步幅度而非绝对成绩,有效推动了个性化发展评估的实现。该方法突破了传统标准化评价的局限性,摒弃“一刀切”的评价方式,使不同起点的学生均能客观感知自身成长,尤其有助于提升“低起点”学生的学习自信心与自我效能感。在评价取向上,增值评价实现了从“与他人比较”到“与自身既往表现比较”的转变,引导学生更多关注自我突破与成长轨迹,从而激发其持续进步的内生动力。借助动态追踪与多模态学习分析技术,系统可生成可视化的成长曲线与发展雷达图,为学生调整学习策略、开展职业生涯规划提供客观依据。这一过程也与“最近发展区”理论相呼应,体现出增值评价在识别学生潜能和支持个性化发展方面的教育价值。
3.2. 助力教师发展:优化教学实施与绩效评价
增值评价为教师提供了基于数据的精准教学反馈,使其能够系统识别教学实践中的有效策略与薄弱环节。例如,当发现某一职业技能模块在学生群体中普遍呈现增值偏低时,即表明该部分的教学内容、方法或资源配置需进行针对性改进,从而实现更为精准的教学诊断与干预。同时,通过分析不同学生的初始水平及进步幅度,教师可依据增值数据实施更精细的分层教学和个性化学习支持,有助于实现“因材施教”的教育理念。
此外,增值评价还可以推动教师绩效评价体系的革新,将绩效评价重点从以往过度依赖竞赛获奖或证书通过率等终结性成果,转向关注教师“促进学生成长”的实际能力。这一转变有助于更加公平地反映教师的教学效能与其在教育过程中的贡献,突出发展性评价理念,也与新时代教育评价改革中强调“破五唯”和重过程的政策导向高度契合。增值评价不仅服务于教学改进,还为教师专业发展提供了实证依据,助力其实现从“经验型”到“反思型”再到“数据驱动型”教育者的转变。
3.3. 优化院校管理:驱动专业建设与资源适配
增值评价为职业院校的专业建设与资源配置提供了科学的决策依据,使其能够超越传统评价指标(如就业率、起薪等)的局限,更加客观地评估教育教学的实际效能。由于增值评价侧重于衡量学生在一定教育周期内能力成长的净效应,可有效排除地区经济差异、行业波动等外部因素的干扰,真实反映专业教学对学生职业能力发展的贡献程度。院校可借助增值评价体系,识别哪些专业在培养学生方面实现了“低进高出”或“高进优出”,从而有针对性地优化师资配备、实验设备投入及经费支持等关键资源。
持续良好的增值表现不仅标志着专业内涵建设的成效,也有助于职业院校形成独特的办学特色与教育品牌,增强其在社会、行业与企业中的认可度与合作吸引力,进而为学校可持续发展奠定坚实基础。在这一过程中,增值评价既是管理工具,也是战略导向,推动职业教育从规模扩张向质量提升的内涵式发展转型。
3.4. 服务宏观决策:完善质量监测与促进教育公平
在宏观教育治理层面,增值评价为构建更加公平科学的职业教育质量监测体系提供了方法论支持。该方法有效突破了传统评价中过度依赖生源质量来达成目标绩效的局限,转向关注教育过程带来的实际“净增益”,从而引导各类院校聚焦内涵提升与教学改进,而非生源竞争。通过强调增值而非绝对产出,增值评价体现了“人人皆可成才”的现代教育理念,不仅回应了社会对教育公平的广泛关切,也凸显了职业教育作为促进社会流动重要机制的功能价值。
此外,增值评价还能够为企业提供超越传统技能证书的更丰富的人才信息。除静态技能水平外,还可反映求职者的学习适应性、成长潜力与持续发展的能力倾向,助力企业基于发展性维度做出更科学、更前瞻的招聘与培养决策。
从政策设计角度看,依托增值评价形成的教育质量大数据,也可为区域教育资源配置、绩效拨款及院校评估提供实证依据,推动职业教育治理从经验判断走向数据驱动,进一步增强决策的科学性与系统性。
4. 增值评价的局限性与挑战
4.1. 理论层面
增值评价源于经济学的“净效应”概念,其在教育领域的适用性仍存争议。教育成效具有多因性、滞后性与难测性,简单套用“投入–产出”模型易忽视情感、态度与价值观等难以量化的维度。此外,尽管该评价试图控制生源和家庭背景等外部因素以衡量学校或教师的净贡献,但由于教育过程的复杂性,这些因素实际上难以完全剥离,过度追求“纯净效应”可能导致评价脱离实际。当前教育评价普遍以结果为导向、侧重于区分,而增值评价强调过程与发展,二者在理念与方法上的整合尚未有效实现,存在系统衔接不畅的风险。
4.2. 技术层面
技术实现上面临三方面主要困难。一是数据采集与质量瓶颈:增值评价依赖跨周期、多模态的大规模数据,但教育数据来源分散、标准不一、信效度不足,非认知领域的数据获取尤为困难。二是模型选择与解释性问题:不同统计模型各有假设与局限,误用易导致偏差;机器学习方法虽预测力较强,但可解释性低,制约其教育应用。三是长周期追踪与动态适应障碍:实现跨学段追踪需要稳定的数据系统和唯一标识机制,同时需应对教育目标变动与数据缺失问题,目前尚难以支持连续、全面的个体发展评估。
4.3. 实践层面
实践中的挑战在职业教育中尤为突出。其一,公平与效用难以兼顾:院校或教师可能筛选生源或侧重可测技能,忽视职业素养与创新能力等隐性目标。其二,高利害使用引发行为扭曲:一旦关联资源分配或绩效考核,易导致应试化训练和目标替代。其三,多元主体协同不足:企业、学校与学生的理解与参与度低,模型专业性强,推广中面临“理念热、实践冷”。根本问题在于,现有增值模型多基于普通教育学术成绩构建,难以适配职业教育强调技能形成、产教融合及岗位能力发展的特点,尚缺乏公认有效的技能增值测量体系。
5. 增值评价的未来研究方向
5.1. 理论体系的深化与本土化构建
当前增值评价的理论框架多源自西方教育评价传统,虽在控制起点差异和评估教育“净效应”方面具有科学性,但其理论预设和文化语境与中国教育实际,尤其是与“五育并举”、“立德树人”的根本任务尚未完全契合。未来应进一步开展理论本土化研究,构建融合中国学生发展核心素养以及契合职业教育类型特征的增值评价理论模型。尤其应立足于“人的全面发展”和教育现代化目标,明确增值评价在德育、智育、体育、美育、劳育不同维度中的具体内涵与测量方式,形成具有中国特色的教育评价体系。
5.2. 多模态数据融合与智能算法优化
随着技术的不断发展,可穿戴设备与智能终端逐渐应用于教育领域,实现了对学生行为、生理、情感与交互等多模态数据的采集。邹柳聪与张家华探讨了如何借助多模态数据破解科学教育评价中的诊断困境,以支持个性化学习分析与精准教学干预[17];炕留一等则尝试将其应用于教师网络研修的增值评价,拓展了该技术在教育评价中的适用场景[18]。然而,尽管多模态数据在增值评价中的融合已受到学者关注,当前教育数据采集仍高度依赖结构化学业数据,对非学业、非认知及行为过程等半结构与非结构化数据的获取与分析尚未形成系统化方案。未来研究应致力于构建融合多模态数据的教育生态系统,整合学业成绩、课堂行为、体能测试、艺术表现、劳动实践及社交互动等多维数据,并进一步探索人工智能在跨模态表征学习、动态知识图谱构建与认知诊断模型优化等方面的应用,从而提升对学生综合素养进行增值评估的准确性与可解释性。
5.3. 动态追踪与长周期增值评价机制
当前增值评价多局限于某一学段或特定教育区间内的短期分析,缺乏对学生发展轨迹的长周期追踪与动态建模。未来应着力打破学段壁垒,构建覆盖中职–高职–本科–就业全过程的纵向数据链,探索不同教育阶段间增值衔接与效能传递的机制。可依托生成式人工智能与大语言模型在时序数据分析与预测方面的技术优势,构建个体与群体的教育发展曲线,系统实现“一生一画像”,从而为教育政策制定与个性化干预提供前瞻性依据。
5.4. 职业教育增值评价的专业性与行业适应性
作为类型教育,职业教育的增值评价需重点关注学生的职业能力、岗位适应性及产业贡献度。未来应着力突破当前评价中职业技能难以量化、产教融合维度缺失等瓶颈。研究可结合行业与企业标准,构建融入技能竞赛、资格证书、实习表现和雇主反馈等多维指标的评价体系,并借助人工智能实现技能掌握程度的微观诊断。此外,还应将增值评价延伸至毕业生职业发展阶段,评估教育对个人收入、职业发展及社会融入的长期影响,从而更全面体现职业教育的社会与经济价值。
基金项目
北京农业职业学院2025~2026年度校级教学改革项目(NZJGH202513);甘肃省教育科学“十四五”规划2022年度一般课题(GS[2022]GHB1799)。
NOTES
*共同第一作者。
#通讯作者。