人工智能赋能教育评价的挑战与实践路径
Challenges and Practical Paths of Artificial Intelligence Enabled Educational Evaluation
摘要: 在教育数字化转型的背景下,人工智能凭借其强大的数据收集、分析、处理能力,为智能技术赋能教育评价带来了新的内驱力。随着ChatGPT、DeepSeek等人工智能的深入发展,推动着教育评价主体多元协同、教育评价内容丰富革新、教育评价方式动态立体。但与此同时,它也会带来一系列的风险挑战,包括技术至上带来的人文属性缺失,评价标准缺位引起的评估偏差,数据安全与隐私伦理风险,区域教育数字化发展失衡。最后,文章在此基础上提出人工智能赋能教育评价的实践路径,即提高评价主体智能素养,建立统一智能评价标准体系,建立多维度监督保障体系,加强区域教育数字化发展投入。
Abstract: In the context of the digital transformation of education, artificial intelligence, with its powerful data collection, analysis, and processing capabilities, has brought a new internal driving force for intelligent technology-enabled educational evaluation. With the in-depth development of ChatGPT, DeepSeek and other AI, it promotes the multiple synergies of educational evaluation subjects, the rich innovation of educational evaluation contents, and the dynamic and three-dimensional educational evaluation methods. However, at the same time, it also brings a series of risk challenges, including the lack of humanistic attributes brought about by the supremacy of technology, the assessment bias caused by the lack of evaluation standards, the risk of data security and privacy ethics, and the imbalance of regional education digital development. Finally, on this basis, the article proposes a practical path for AI-enabled educational evaluation, namely, to improve the intelligent literacy of evaluation subjects, to establish a unified intelligent evaluation standard system, to establish a multi-dimensional supervision and guarantee system, and to strengthen the investment in the digital development of regional education.
文章引用:孙佳琪. 人工智能赋能教育评价的挑战与实践路径[J]. 教育进展, 2025, 15(7): 1023-1030. https://doi.org/10.12677/ae.2025.1571318

1. 引言

早在2020年10月,中共中央、国务院印发了《深化新时代教育评价改革总体方案》,其中明确提出“充分利用信息技术,提高教育评价的科学性、专业性、客观性”[1]。教育评价是指导教育未来发展方向的指挥棒。近来ChatGPT、DeepSeek等人工智能兴起,广泛应用于工业生产、医疗健康、教育教学等多个领域,给各个领域带来了无限生机与活力。在教育评价领域,专家学者们也认识到了人工智能赋能教育评价的重要价值和意义。人工智能赋能教育评价的核心逻辑在于,“长期教育实践经验出发构建系统化的评价指标体系,利用人工智能技术实现多源异构教育数据的采集分析,对评价对象的外显状态和内隐特征进行全方位、时序化的建模分析,并依据预设的评价体系和算法逻辑生成评价结果,在此基础上挖掘潜在的教育问题,并生成定制化的教育改进方案,促进教育实践不断优化”[2]

近年来,国内学者认为支撑人工智能“跳跃式”发展的大数据、机器学习和学习分析等技术正与教育系统深度融合,重塑未来教育形态[3]。课堂教学行为评价以人工智能、大数据等技术为支撑,借助技术感知多维教学行为,可实现数据采集、获取及处理的自动化及智能化,有效推动了课堂教学评价[4]。杨晓哲和任友群提出在评价分类中,不仅要侧重对于学习结果的自动化评价,还要关注课堂学习过程中的全方面多模态评价[5]。与此同时,张辉蓉等人认为依托信息技术的教育智慧评价有可能存在过度重视“工具”的风险,从而影响乃至改变主体的实践方式,进而可能会使主体的认知方式及主体间的相互作用方式发生改变[6]。受不同地区经济发展水平、学校硬件设施配备、学生初始智能知识储备与学习能力起点等差异的影响,在推进人工智能教育实践中,不同地区、学校和学生应掌握的智能化知识也具有差异[7]。郑勤华等学者认为要破除人工智能基础与领域知识间的壁垒,除了从技术上探索,挖掘数据采集和分析的可能性外,还需要领域专家介入,发挥两者结合的优势。国外学者维克托·迈尔–舍恩伯格认为教育信息化的持续推进使得大数据正在进入教育的方方面面[8]。在人机合作的智能增强背景中,知识图谱增强型的认知计算方法将为机器带来更强大的推理与决策能力,并能在如教师–机器–学生互动、团队合作等更为复杂的认知任务中提供策略性的学习支持和教学辅助[9]。大卫·T·康利认为,趋向于人工智能技术为教育评价的变革创新带来了新的可能,但由于专业和技术的壁垒,但相较于制造业、金融等行业,教育系统的适应性、教育评价数字化变革相对迟缓[10]。人工智能赋能助力教育评价领域已经成为未来教育评价的发展趋势,但在实践过程中,由此带来的风险和挑战也不容忽视。本文通过分析梳理人工智能赋能教育评价方面的价值,厘清其中的风险挑战,以期为人工智能与教育评价深度融合的现实路径提供有价值的参考和建议。

2. 人工智能赋能教育评价的价值

将传统的教育评价与人工智能相融合,借助人工智能技术带动教育评价迸发新的生命力,有助于教育评价的主体、内容、方式向更加科学、客观、专业方向转型发展,也为智能化教育时代提供新的指引。

2.1. 教育评价主体多元协同

传统的教育评价主要是以教师主导为主,依靠教师的经验和考试成绩,缺乏科学性和真实性,造成唯分数论和成绩至上的乱象,不利于学生全面发展。从我国教育评价改革政策可以看出,教育评价参与者包括教师、学生、家长、管理者等多个主体[11]。根据建构主义理论,学生参与评价过程实质是知识建构与自我认知的过程。人工智能通过搭建多主体参与平台,实现从“教师中心”到“多元协同”的范式转换。人工智能通过链接教师、学生、家长等多个主体,搭建多主体评价平台,将海量的真实评价信息实时收集、分析、处理,激活不同主体评价积极性,得到真实、科学、全面的评价结果。具体来说,教师可以通过智能教育评价技术,获得更多全面、海量的学生学习情况和综合素质发展情况信息,从而对学生的教育评价更加科学、理性;学生在智能教育评价体系下,获得充分的评价自由,及时了解自身不足和优势,实现自我监督和自我反思,与此同时,在学生相互评价的过程中,学生们能够增加彼此间的了解,遇到困难相互援手,以实现见贤思齐的效果,促使大家互相进步;智能教育体系根据评价结果提供个性化辅导方案,家长能够及时跟进学生成长表现,配合学校教育进行更优质的家庭教育,形成家校合力,助力学生全方位成长和发展。此外,依靠智能技术,也能减少学校和社会在教育评价中的主观偏见和一些不公平的现象。通过人工智能赋能教育评价可以实现在教育评价过程中,教师、家长、学生、社会等不同主体的评价权益得到极大丰富,实现不同主体多元协同共同助力学生发展。

2.2. 教育评价内容丰富革新

人工智能技术不仅改变了学习者的学习方式和手段,更加丰富和革新了学习者的学习内容。新世纪以来,培养学生数字素养、创新意识、合作能力、批判意识等高阶思维能力成为了必不可缺的教育内容。通用人工智能大模型技术赋能的教育评价,可采集、还原并储存真实教育情境的精准数据,追踪评价对象的全过程成长轨迹,实现评价内容的创新[12]。加德纳多元智能理论强调人类智能的多元性与情境性,主张人类存在多种独立的智能类型,通过多元化教育评价挖掘个体优势。人工智能通过物联网设备与学习分析技术,构建包含认知能力、情感态度、社会技能等多维度的评价指标体系。传统评价多数以学业成绩作为主要评价依据,而智能技术的引入,建立一个多元化的评价体系,将学生的创新思维、团队合作、问题解决等能力纳入评价范围[13],综合评价学生的德、智、体、美、劳多个方面以及创新思维、批判意识等高阶思维能力,培养全面发展的拔尖创新人才。其次,评价场景丰富。在当今数字化浪潮之下,得益于科技日新月异的发展态势,我们逐步走向了“人人互通、万物互联”的新阶段,对教育领域来说,教育评价场景处于不断更新变化中,评价内容也包括了从教室内到教室外、从学校内到学校外的多元教育场景下的价值判断。例如,除了教室内的学习表现,家庭教育场景、社会实践活动等多元场景中的表现也通过人工智能记录和分析数据,为评价结果提供有效支撑。打破传统课堂的物理边界和时间限制,推动教育评价实现全景式发展,助力教育评价改革和教育高质量发展。

2.3. 教育评价方式动态立体

在过去,我们的教育评价方式都较为单一,以总结性评价为主。通常以实行课后测验进行“打分制”,虽然在一定程度上避免了主观判断的影响,但是难以对学习者在整个学习过程的数据展开持续、全方位且动态化地采集和剖析,反而影响了教育评价的客观性。在提倡高质量教育发展的如今,传统的教育评价方式已经不适用于当前的教育形式,人工智能技术赋能教育评价,使得教育评价方式能够动态立体地反映学习者的学习过程的全环节。其优势在于,一方面,人工智能能够将学习全环节的多维数据进行实时动态地收集、储存、分析。也就是说,智能技术能够将学习者的对话数据长期分类储存,再通过大数据模型得到进一步分析。这些数据可以对学生的认知思维能力、学习风格、学习态度乃至个性特点进行分析,从而帮助他们改进学习效能[14]。另一方面,人工智能具有高效便捷、个性全面的特点。在智能教育评价中,通过大数据模型分析学习者的对话交流数据帮助建立一对一的个性化学习评价体系,在减轻教师的部分负担的同时,使得教师能够把精力集中在需要情感和道德评判的复杂任务中,为教育评价的有效实施提供可靠性的支撑和保障。清华大学“智能助教”试点课程自从秋季学期开始8门课程试点,后续将开展100门试点课程,利用人工智能辅佐和深度介入课程教学和学生学习,基于雨课程平台,分析和记录每个学生的学习成果和学习表现,为教师的准确判断评价学生和后续的教学调整提供丰富的信息来源,除此之外,智能助教系统不仅能够生成具体的写作评价标准,还能及时反馈、动态调整大幅提高教学的针对性和实时性,从数据上来看,平台累计访问量超过24万次,用户满意度高达92%,认为系统“能够显著提升知识吸收效率”,反映了师生对于智能辅助教育评价的高度认可以及其在实践中的效果。

3. 风险挑战

3.1. 技术至上带来的人文属性缺失

智能技术的发展带给教育评价质的改变,由于其在教育评价中凸显出高速度、高效率、高准确率的优势,备受部分教育评价使用者青睐[15]。由此涌现了一批崇尚技术至上的“工具理性主义者”,然而仅仅拥有高精尖技术的教育评价系统却并不能符合新时代我们对教育评价的要求。根据阿多诺的批判理论,当智能技术在教育评价中被异化为纯粹的效率工具,便会形成“技术霸权”,导致教育评价偏离“以人为本”的核心价值。智能系统的自动化决策机制,使得教师的专业判断被算法规则替代,这与教育评价中强调的价值判断、情感关怀等人文特性形成根本性冲突。一方面,机器至上、技术至上可能会潜移默化地削弱评价主体的权利,将教师、学生、家长等的评价权益让渡给程序化的机器。并且机器至上将进一步导致教师对自身专业能力建设的重视度下降,忽视教师的实践经验和价值判断。长此以往,将会削减教师的教育评价判断能力。另一方面,教育评价本应是饱含情感、充满人文关怀的教育实践活动,需要教师依靠专业能力根据实践经验去进行价值判断。而人工智能的致命缺陷在于无法拥有情感表达和人文关怀,智能系统可能无法充分理解学生的动机、情感和社会互动等复杂的非量化的人文因素[16]。过度依靠人工智能进行教育评价存在情感属性缺失和育人本质弱化的倾向,最终与“培养完整的人”这一教育根本目标相背离。

3.2. 评价标准缺位引起的评估偏差

评价标准体系是链接人工智能和教育评价的基础,是智能教育评价系统运行的底层逻辑框架。由于人工智能是基于庞大的文本数据来进行模型训练的,而受过去传统唯分数论评价标准的影响,加之国内现有的评价数据和评价标准欠缺,人工智能训练后难免会受到过去的结果论、分数论评价的影响,被传统评价观点所裹挟。另一方面,学习者是复杂的、充满情感的人,他们在学习过程中不仅学到了知识内容,并且在情感、道德、价值观方面也得到了不同程度的发展。受缺乏评价标准的影响下,目前人工智能对于人的复杂情感还难以运用科学地将其分评估计算,因此难以科学衡量学生的思想情感、道德行为、创新能力、综合素质等非量化数据,造成数据评估偏差和数据壁垒,评价结果不能满足当今社会对人才培养的要求。此外,不同评价系统对于学习者的评价结果不一致、数据不统一,造成学习者转学、升学后前后评价结果偏差,也就是说,跨区域、跨群体的学习成果难以进行横向对比,因此不能完整持续地评价学习者的学习成长发展过程,限制了智能教育评价的实施。由此看来,评价标准不仅能满足智能教育评价系统对学习者的情感思维等因素的评估,又能满足未来对人才培养的要求,是智能教育评价未来发展的关键。

3.3. 数据安全与隐私伦理风险

现代教育必然是数据驱动的,而非纯粹的经验主义[17]。智能教育评价是建立在大数据资料的基础上的,根据欧盟GDPR确立的数据伦理准则,智能教育评价系统需要在数据收集、存储、使用等全流程建立严格的伦理审查机制,确保数据处理活动符合“目的限制”、“数据最小化”等伦理要求,也就是说在获取评价对象的资料和数据之前,都会征求对象的同意,但是由于评价对象自身认知的局限,以及智能技术大多都未说明数据的具体用途,势必会对评价对象的数据隐私安全构成威胁,进而引发新的数据风险和伦理冲突。对于学生来说,个人的隐私数据和学习信息的泄露,难免会造成同学焦虑、不安、攀比等心理,威胁学生的心理健康;对于教师来说,学生的心理健康问题将会加重教师的工作负担,引发家校之间的不信任感;对于家长来说,家长可能会因学生数据隐私泄露而遭遇诈骗,不利于家校合作共育。再者,大数据在分析评价对象的过程中,会收集海量的个人信息,包括种族、社会家庭背景、面部识别等各方面信息,这些多模态数据的收集可能会超出实际需求。一旦数据得不到良好的保护和运用,不遵从社会道德规范和数据安全规范,难免会造成对学生群体的偏见、歧视,加之基于历史数据的算法可能会加深对弱势学生群体的刻板形象,进而影响教育评价的公平公正性。

3.4. 区域教育数字化发展失衡

在技术赋能的同时,由于区域间教育技术资源分布不均匀、师资力量结构性落差等问题逐渐凸显出来,导致人工智能进一步赋能教育评价的进程呈现区域化教育数字化发展失衡的现象。我国地区经济差异化导致了经济发达地区凭借雄厚的经济实力能够率先完成教育智能化基础设施建设。例如,重庆两江地区投入2.28亿元实施“五年行动计划”,建成覆盖全域的5G教育双域专网和智慧教育云平台,形成“校校有人工智能机器人”的格局。相比之下,部分乡村偏远地区甚至很能保证校园网络全覆盖。区域间教育技术资源的不均,很容易形成“马太效应”,即强者愈强、弱者愈弱[18],进一步拉大区域间教育资源失衡。进一步而言,在教育智能化转型过程中,教师群体面对着教育技术应用能力和智能素养难以胜任的问题,特别是中西部偏远区县,优质师资结构性短缺问题尤为明显,那么这些地区大多依靠传统的教师经验来进行教育评价,无法将人工智能作为技术手段对学习者进行精准判断和个性化诊断,进而加剧教育资源的“数字鸿沟”。

4. 实践路径

从实践方面来看,人工智能赋能教育评价是一把“双刃剑”,其风险和机遇并存,如何最大程度减少负面影响,科学发挥智能教育评价的优势,是未来教育数字化发展的前提和关键。要想解决好这个问题,必须从意识和实操两个方面入手,通过提高评价主体智能素养,建立统一智能评价标准和多维度监督保障体系,加强区域教育数字化基础设施投入,构建出绿色发展的教育评价生态系统,进一步提高教育评价的专业性和科学性。

4.1. 提高评价主体智能素养

教育评价丰富的教育意义与内在价值,要求新时代教育评价改革始终要以“立德树人”为衡量改革是否成功的标准[19]。“立德树人”从本质上来看,就是要培养学生良好的道德品德,培养全面发展的人才,以适应未来社会发展。面对智能化教育评价可能出现的人文属性缺失、人文关怀降低的局面,只有将评价主体的智能素养与时代发展相匹配,才能确保人工智能赋能教育评价可持续发展。一是要强化教育人工智能系统开发者的跨领域知识整合能力以及教育相关素养,通过建立教育学家、评估专家与工程师的常态化协作机制,通过基础理论、教育观念、实践模拟等教育培训课程,确保技术设计与教育规律相契合。例如,采取一些“开发者–教师结对”项目计划,使他们在教育专家学者的指导下,开展技术设计发明,使技术更新始终锚定真实教育需求。

二是提高教师的智能评价素养。从师范类高校来看,增设智能评价核心课程,普及人工智能、大数据分析等基础知识,搭建智能评价模拟系统模拟真实学习者学习情况并通过判断结果设计干预方案,通过教师技能训练和课堂实践操作,将理论和实践融入其中,提高师范生的智能素养、数字意识,将评价主体智能素养的培育提高到一个新的高度。另一方面,教师应该始终谨记评价的目的在于“育人”,重视发展“软”“硬”皆施的评价技能。主动学习教育评价、人工智能、大数据等“硬”知识,了解智能评价的最新发展趋势和学术前沿内容,在日常教学中积极使用智能评价工具并进行反思分析,思考如何改进教学策略和评价方式。教师不仅要善于利用“硬”智能评价工具助力教育教学,还需要掌握包括情感沟通、人文关怀等在内的“软”技能[20]。同时,学校制定系统的教师培训计划,不定期开展教师分享论坛、学术交流会议、专题培训课程,为教师提供必要的技术支持和引导,重视建立合理的激励制度,对智能评价表现优异的教师提供奖励激发教师的积极性,为教育评价智能化、专业化提供支持。

4.2. 建立统一智能评价标准体系

评价体系构建是教育人工智能研究的基础性工作[21]。统一、合理、科学的评价标准对智能化教育评价起关键保障的作用。一是要政府相关部门制定完善人工智能赋能教育评价相关的顶层设计,出台科学的人工智能教育评价发展战略规划、制订涵盖教师和学生以及技术部门等多维度的统一科学的评价标准,为智能化教育评价提供总体方向指引。此外,由于我国地区教育发展差异和文化差异较大,地方各教育部门在进一步落实整体规划的同时制定适合地区差异性的、有针对性的教育评价体系和标准,保证适合各地区差异性和特殊性,为各地教育评价数据的收集、结果的生成、方案的设计提供有价值的参考标准。在学校层面,按照上级的标准和要求把具体的方案和标准实施落地,将具有推广意义、有价值的案例和经验反馈给制度设计层面,推动中央和地方智能教育评价领域政策和措施融通契合。二是建立标准化的数据共享平台,打破数据“孤岛”,在教育部门的支持下,整合不同地区、不同学校等多源数据,设置数据动态更新以保证数据的时效性,实现数据收集储存的统一管理和实时交互,通过标准化的数据共享平台为全年龄、全地区的学生提供成长建议。

4.3. 建立多维度监督保障体系

面对评价数据的收集、评估、应用过程中的数据安全威胁,需要通过建立多维度监督保障体系来消除教育数据安全威胁。从立法维度来说,监督部分应该加快出台完善相关法律法规和详细的隐私安全保护政策,通过基础性立法明确发展导向和监管边界,明确教师、企业、学校等对教育数据收集使用的范围和责任界定,强化数据安全责任划分,建立专门教育评价安全库保护个人隐私,从源头降低数据滥用风险。另一方面,加强意识形态引导。从教师维度来说,自觉加强数据安全意识教育,认识到保护学生数据隐私的重要性,并且在日常教学和评价活动中,严格遵循相关的数据安全使用规范,树立正确的数据安全观。对于技术开发部门和企业来说,通过多层加密算法技术处理学生的隐私数据,定期组织人员参加数据安全和意识形态教育。从学校维度,面向全体师生开展数据安全意识形态教育,如专题讲座和沙龙会议等,营造充满数据安全氛围的校园。最后,健全数据安全保障机制,联合多主体协同监督,记录每个环节的全流程使用过程留痕,实现评价领域跨部分追责,在实践中探索形成人工智能赋能教育评价数据安全保障机制,最终形成具有教育温度、尊重学生隐私的智能教育评价新范式。

4.4. 加强区域教育数字化发展投入

各区域的经济市场和教育模式存在一定的差异性,由生产要素流动和教育人力资本倾斜引发了许多教育不公平现象[22],因此加强区域教育数字化发展投入成为助力人工智能赋能教育评价的重要抓手。首要任务是建立教育数字化公共支撑体系,通过制定专项政策引导财政资源向薄弱地区倾斜,构建开放共享的数字教育资源协同机制,破除区域间存在的教育技术和信息壁垒,促进基础教育领域数字公共服务均等化发展,同时优质教育资源地区提供智能评价工具库,向基础设施薄弱地区免费提供一些语音诊断、表情分析、作业针对性诊断等基础智能算法模型,搭建覆盖城乡的统一教育评价专业平台,实现教学行为数据、学业表现数据、评价成果分析的标准化收集分析。二是提高区域教师数字素养,根据偏远地区教育发展特点和需求,开发定制化培训课程,涵盖适合当地教学资源的数字化评价工具使用、分析和个性化教学方案制定。同时,组织线上直播和线下集中培训相结合的方式,邀请教育评价专家讲解人工智能赋能教育评价理论和实践,组织教师进入智能教育评价方面表现优异的学校深入交流学习。总之,提高偏远地区教育数字化发展投入,关键在于落实基础设施建设发展,以教师需求为中心,构建智能教育评价发展新格局。

5. 结论

人工智能技术深度融入教育评价领域,正驱动评价主体走向多元协同、评价内容实现丰富革新、评价方式呈现动态立体,为提升教育评价的科学性、专业性、客观性,进而为引领教育高质量发展注入了强劲动能。然而在实践过程中,其作为“双刃剑”的特性也带来不容忽视的风险挑战:技术至上倾向可能削弱人文属性与育人本质,评价标准缺位易引发评估偏差与数据壁垒,数据安全与隐私伦理风险威胁个体权益与社会信任,区域教育数字化发展失衡则加剧“数字鸿沟”与教育不公。所以,为最大程度释放人工智能赋能教育评价的积极效能并有效规避潜在风险,需构建多维度协同治理体系:着力提升包括技术开发者与一线教师在内的评价主体智能素养,确保技术理性与教育规律、人文关怀相融合;加快建立统一、科学且兼顾区域差异性的智能评价标准体系及数据共享平台,破除数据孤岛,为精准评价奠基;建立健全涵盖立法监管、技术防护、意识教育和责任追溯的多维度数据安全监督保障体系,筑牢隐私与伦理防线;重点加强薄弱地区教育数字化基础设施投入与教师数字能力建设,通过资源倾斜与定制化培训促进区域均衡发展。唯有在技术驱动与人文坚守之间寻求平衡,在制度完善与多方协同中凝聚合力,方能构建安全、公平、高效且富有教育温度的智能教育评价新生态,真正发挥其“指挥棒”作用,助力教育事业高质量发展。

参考文献

[1] 教育部. 中共中央国务院印发《深化新时代教育评价改革总体方案》[EB/OL].
https://www.gov.cn/gongbao/content/2020/content_5554488.htm, 2020-10-13.
[2] 郑永和, 王一岩, 杨淑豪. 人工智能赋能教育评价: 价值、挑战与路径[J]. 开放教育研究, 2024, 30(4): 4-10.
[3] 徐瑾劼, 申昕. 重塑以学习者为中心的教育评价生态——基于教育评价智能化发展的全球观察[J]. 开放教育研究, 2023, 29(3): 40-46.
[4] 留一, 叶海智, 张瑾, 等. 基于多维数据的课堂教学行为评价研究[J]. 现代教育技术, 2022, 32(4): 68-77.
[5] 杨晓哲, 任友群. 教育人工智能的下一步——应用场景与推进策略[J]. 中国电化教育, 2021(1): 89-95.
[6] 张辉蓉, 朱山, 谢小蓉. 教育智慧评价: 意蕴、特征与挑战[J]. 中国考试, 2021(9): 1-7.
[7] 唐懿滢, 谭维智. 培养高质量的学习者——对智能时代教育质量实现载体及评价标准的思考[J]. 开放教育研究, 2025, 31(3): 74-83.
[8] [英]维克托·迈尔-舍恩伯格, 肯尼斯·库克耶. 与大数据同行——学习和教育的未来[M]. 赵中建, 张燕南, 译. 上海: 华东师范大学出版社, 2015: 1, 121.
[9] Conley, D.T. (2018) The Promise and Practice of Next Generation Assessment. Harvard Education Press, 10-75.
[10] Kizilcec, R.F., Reich, J., Yeomans, M., Dann, C., Brunskill, E., Lopez, G., et al. (2020) Scaling up Behavioral Science Interventions in Online Education. Proceedings of the National Academy of Sciences, 117, 14900-14905.
https://doi.org/10.1073/pnas.1921417117
[11] 鹿星南, 高雪薇. 人工智能赋能教育评价改革: 发展态势、风险检视与消解对策[J]. 中国教育学刊, 2023(2): 48-54.
[12] 吴砥, 郭庆, 吴龙凯, 程浩. 智能技术赋能教育评价改革[J]. 开放教育研究, 2023, 29(4): 4-10.
[13] 王殿军. 以深化教育评价改革推动教育强国建设[J]. 中国考试, 2024(10): 7-9.
[14] 李毅, 郑鹏宇, 张婷. ChatGPT赋能教育评价变革的现实前提、作用机理及实践路径[J]. 现代远距离教育, 2024(3): 9-17.
[15] 吴龙凯, 程浩, 张珊, 等. 智能技术赋能教育评价的时代内涵、伦理困境及对策研究[J]. 电化教育研究, 2023, 44(9): 19-25.
[16] 宋兆祥, 司林波. 人工智能赋能新时代教育评价改革的逻辑、边界与路径——构筑智慧教育评价生态的变革之路[J]. 教育科学研究, 2024(11): 59-65.
[17] 杨开城. 教育何以是大数据的[J]. 电化教育研究, 2019, 40(2): 5-11.
[18] 朱煜. 马太效应[M]. 北京: 中国纺织工业出版社, 2007: 前言.
[19] 曹渡帆, 朱德全. 新时代教育评价改革的数字正义何以可能[J]. 电化教育研究, 2023, 44(12): 21-27+34.
[20] 付卫东. 智能时代教师评价素养实践进路[J]. 中国教师, 2024(5): 1.
[21] 宋宇, 许昌良, 朱佳, 柴少明. 面向思维培养: 基于精准标注技术的智能化课堂教学分析及应用[J]. 华东师范大学学报(教育科学版), 2023, 41(8): 79-89.
[22] 周露芳. 难为与能为: 立足区域差异分析教育公平的短板与补板路径[J]. 教育理论与实践, 2021, 41(22): 20-24.