人工智能技术在教育评价中的应用与挑战:基于多元智力理论视角
The Application and Challenges of Artificial Intelligence Technology in Educational Evaluation: A Perspective Based on the Theory of Multiple Intelligences
摘要: 随着人工智能技术的不断发展,其与教育领域中不同方向的融合也在不断地深入。人工智能技术推动教育评价的改革已经是大势所趋。根据国家推动深化教育评价改革的要求,人工智能技术在教育中的应用给教育评价的改革提供了更加多元化的变革途径。人工智能技术赋予教育评价的变革包括了评价内容、评价方式、评价主体、评价手段等多方面的变革。包括通用人工智能大模型在内的数据挖掘技术、学习分析技术等为教育评价提供了更多的可能性,使教育评价变得更加丰富、更加准确和客观。本文主要论述了人工智能技术在教育评价中的应用以及多元智力理论视角下的智能教育评价。
Abstract: With the continuous development of artificial intelligence technology, its integration with various directions in the field of education is also deepening. The reform of educational evaluation driven by artificial intelligence technology has become an inevitable trend. According to the national requirements for deepening the reform of educational evaluation, the application of artificial intelligence technology in education provides more diversified transformation paths for the reform of educational evaluation. The changes brought by artificial intelligence technology to educational evaluation include multiple aspects such as evaluation content, evaluation methods, evaluation subjects, and evaluation means. Data mining technologies including general artificial intelligence large models and learning analysis technologies provide more possibilities for educational evaluation, making it more rich, accurate, and objective. This article mainly discusses the application of artificial intelligence technology in educational evaluation and intelligent educational evaluation from the perspective of multiple intelligence theory.
文章引用:吴静, 林木辉. 人工智能技术在教育评价中的应用与挑战:基于多元智力理论视角[J]. 教育进展, 2025, 15(7): 486-491. https://doi.org/10.12677/ae.2025.1571243

1. 引言

随着智能时代的到来,信息技术与人工智能技术不断发展,这些新兴技术与教育领域不断地进行融合,推动着教育的改革和发展。机器学习、数据挖掘、深度学习等技术在教育教学过程中展现了它们巨大的潜能。教育评价作为教育活动中的重要的一部分,改革已是势在必行。2020年10月,中共中央、国务院印发的《深化新时代教育评价改革总体方案》明确提出,教育评价改革要“充分利用信息技术;针对不同类型教育特点;健全学校评价;利用人工智能开展全过程、全要素的评价”[1]。教育评价对教育的发展有着重要的导向作用,事关教育的发展方向[2]。当前,传统教育评价的方法手段已经不能满足当下教育评价改革的需求。素质教育已然普及,对于学习者的总结性评价无法对学习者各方面综合素质进行更加全面地评估。由于人工智能技术与现代信息技术的迅猛发展,数字信息世界已经成为教育与学习的重要场所。教育的重点必然聚焦到以创新能力、批判意识等高阶思维培养为核心的育人过程上来[3]。为促进学评融合的发展,利用人工智能技术推动教育评价的改革势在必行。为满足新时代教育中对综合评价的需求,人工智能技术为教育评价提供了更多元、更高效、更可靠的方法。人工智能技术在教学活动中提供的数据和技术让大规模因材施教的可能性大大提高了。

2. 多元智力理论视角下的智能教育评价

2.1. 概念界定

2.1.1. 人工智能

从概念上说,人工智能是一种让机器能够像人一样聪明灵活和精准感知,或者比人做得更好的技术。因此,凡是有助于机器的人工智能水平提高的技术都可归纳为人工智能技术[4]。自人工智能诞生以来,已经给教育评价领域带来了巨大的变革。它在改变着人们生活和学习方式的同时,提高了当前对具有创新素养、高数字素养和信息素养人才的需求。在当下的智能时代,教育的边界变得更加宽广了,传统的只是单纯学习知识技能的时代已经成为过去,更加强调了人的全面发展。

2.1.2. 教育评价

教育评价的本质是价值判断,是对教育活动是否实现教育目标.达到应有的质的要求的评判[5]。教育评价在教育过程中有着重要的地位,它直接影响着教师的行为与学生的行为。它还决定着教师在教学过程中使用的教学方法和教学手段。教育评价在很大程度上反应了教育的价值观,教育的价值观又直接影响着教育的评价标准、评价方式和评价者的评价能力。所以说,教育评价的改革是一场教育治理的改革。

2.1.3. 多元智力理论

多元智力理论是加德纳对智力的定义,他认为:“智力是在某种社会或文化环境的价值标准下,个体用于解决自己遇到的真正的难题或生产及创造出有效产品所需要的能力”[6]。这些智力包括语言智力、逻辑数学智力、音乐智力、空间智力、身体运动智力、人际关系智力、内省智力和自然智力。加德纳认为,智力的基本性质是多元的,基本结构也是多元的,各种能力不是以整合的形式存在,而是以相对独立等形式存在[7]。这种理论认为,每个人都是不同的,不以某种能力去作为解决问题的唯一方法,而是通过自己的方法来利用身边的资源或自己的身体机能来达到自己的目的。这种理论就要求我们的教育需要培养多方向发展的创造型人才,促进受教育者的个性化发展。

2.2. 多元智力理论与智能评价的融合

多元智能理论的宗旨是使每个学生在身心方面都得到健全的发展,即开发人的潜能、发展人的个性、实现人的价值[8]。多元智力理论的评价观包括了价值观、动态观、多元观、差异观。加德纳认为要在真实的环境中对学生的各项能力进行评价,不能脱离学习者的周围环境对学习者的能力进行单一独断的评价。每个人的发展速度和程度是不同的,即使是同一种能力,每个人的呈现方式也是不同的[9]。对学生进行评价的目的并不是将学习者的能力排个高低优劣,而是为了促进学习者的全面发展。要准确地对一个学生进行评价就要在其整个动态的学习过程中对学生的全方位进行评价。加德纳认为各种智力之间是相互独立的,不能过度地突出对某一方面智力的过度评价而忽视对其他智力评价的重要性。他认为学习者解决问题是靠各种智力之间的相互配合而不是使用单一一种智力来解决问题的。因此,他认为教育评价应该是更多元的评价。学习者个体之间存在着巨大的差异,这一点是毋庸置疑的,不能因为某个学生某方面不及别人优秀而认为这个学生是所谓的“差生”。所以,要用适合每个学生的不同评价方式去评价他们。

多元智力理论倡导多角度,多层次地从真实的情境中进行教育的评价。那么,随着信息化和智能化时代的到来,社会的发展需要创新型的人才,多元评价的教育观念也随之而来。使每个学生都能找到属于自己的发展方向、胸有成竹地走向社会、实现人的多元化发展是多元评价的基本价值理念[10]。而为了实现多元且综合的教育评价,传统评价手段已经无法满足它的需求。传统的评价是相对静态的评价,这种评价方式是偏离学生的发展过程的,评价的内容也比较单一片面,评价的主体还是以教师为主,这与当下的教育目的是背道而驰的[11]。而智能技术的升级为动态、全面的多元评价提供了可能性。多元智能理论与智能教育评价的融合构成了数据、价值、实践三者之间的闭环关系。多元智力理论为教育评价提供了更加全面的发展价值导向,改变了传统单一的评价范式。人工智能技术通过多模态的数据采集与智能算法建模等技术实现了对学生语言、逻辑、空间等多元智力的评估。与此同时,教育评价的实践所产生的反馈数据又持续不断地对评价模型进行优化。形成了理论指导评价目标、技术赋能评价实施、实践验证理论假设的协同进化关系,不断推动教育评价向个性化、过程化和综合化转变。

3. 人工智能在教育评价中的应用

3.1. 结果评价

利用大数据,在机器学习技术的支持下对教学的结果进行评价,将其与人工智能技术中的情感分析模型、语言分析模型等结合起来[12]。根据丰富的数据收集来源,拓展评价的内容和维度,让评价结果更加多元、准确,促进评价的智能转化。这些应用包括机器学习技术支持下的在线同伴互评、利用自然语言分析模型开发的自动化的评价系统、利用机器学习的算法开发评教模型基于评教文本对教育质量进行评价、利用人工智能大模型根据评价对象的发展现状进行智能命题等。例如,在计算机支持的协作学习系统环境下,要求学习者开启同伴之间的互评,用主观文本的内容与这些互评内容相结合给出准确客观的结果评价。人工智能技术支持下的自动评分系统也在教育评价中应用广泛,其中最典型的就包括作文文本的自动评分系统。例如,中国2011年上线的批改网是一款基于语料库和云计算技术的机改作文系统,此系统以大学英语四级作文考试要求为模板,可以在1.2秒内自动批改学生的英语作文,并给出分数、总评、按句纠错的批改反馈[13]。人工智能技术在很大的程度上保证了这些教育评价的客观性与公平性。

3.2. 过程评价

人工智能技术可以根据数据记录下的学生学习过程对每个学生形成个性化的学生画像并刻画其整个学习过程的成长路线并对学生和教师进行实时的反馈。智能化测评更加关注测评的形成性功能,能够基于长期的学习过程性数据,对学生的特定学科知识与学科能力进行诊断与分析[14]。教师能够通过这些过程性数据及时地对每位学生的学习情况进行一个了解,发现教学过程中的教学问题以及学生学习过程中的学习问题。通过学习分析技术,教师能够真正地做到因材施教,为学生提供更加有针对性的,更加符合学生个性化发展的学习资源和改善教学实施的环节。学生可以通过这些实时生成的画像反馈来判断自己的能力倾向和更加适合自己的学习路线,找出自己的薄弱之处,对自己的发展能够有清晰的认知。这些应用包括计算机支持的自适应学习、基于学习分析技术的学习预测、通过情感分析系统捕捉学习者学习过程中的情感数据来判断不同学习者的在学习上的不同喜好等。依托人工智能技术,我们可以从多角度分析学习者的认知加工过程、高阶能力水平、情感状态[15]。通过这种多角度的分析,教师可以深入地了解每个学生的各方面能力的程度和对其制定更加符合每个学生自身发展的教学过程,提高教学的效率和针对性。

3.3. 增值评价

增值评价是一种对传统的终结性评价的反思,它的内涵是通过追踪研究设计,收集学生在一段时间内不同时间点上的标准化测验结果,基于学生自体的纵向比较[16]。增值评价不以学生单方面的学业成绩水平的高低来判断一个学生是否优秀和是否有进步,它更加关注学习者的学习能力以及其他方面的综合素质的增长水平。因此,增值评价对评价的指标以及模型有着更高的要求,利用大数据与人工智能技术可以对学生的学习过程进行实时地检测从而采集学习过程中的所有样本数据,再利用精确的算法模型对其学习过程进行精密的分析最后得出符合每位学习者的个性化的评价画像,提供精准的学业增值水平的评价。增值评价让学习者更加直观地面对某个时间段或持续的学习过程中自己各项能力的增长和退步的过程,能让学习者快速地调整自己的学习状态和让教师及时调整自己的教学状态。

3.4. 综合评价

综合评价的本质在于综合,关注整体成效和全局特性,能够综合多方意见、采取多种方法和视角对评价对象进行整体性评价,在评价实践中呈现系统性、多样性、复杂性、全面性等特点[17]。综合评价是教育评价中的重要一部分,发展和改革的重点关注部分。人工智能技术在综合评价中的应用主要包括利用机器学习和专家系统等算法构建综合评价模型、基于大数据等智能技术和深度学习的算法,对学习者的分析数据做一个可视化的数据呈现等。这些应用让评价过程变得更加生动有色彩,学习者和教育者能对教育与学习过程有一个更加直观准确的了解,为学习者的全面发展提供了有价值的参考。综合评价让学习者能及时了解自己在学习过程中的不足之处和学习发展过程中更有优势的一部分,让学习者能够及时弥补自己的不足之处和发扬自己更有优势的部分。

4. 人工智能在教育评价中的挑战与应对策略

4.1. 主要挑战

中国教育评价长期存在方式简单初级、手段传统落后、内容片面僵化、标准单一匮乏和主体狭窄局限等诸多问题[2]。人工智能技术为教育评价的评价效率、评价准确性和评价速度的提升带来了很大程度上的改变,但是,在利用人工智能技术赋能教育评价的实施过程中依然存在着许多的问题。

首先,关于教育评价的主体明确问题,人工智能技术覆盖下的教育评价的主体不是智能技术,而是人,是教育的管理者、教师和学生。教育者对智能技术的过度依赖将会导致评价过程中带有情感色彩和自我需求的那一部分渐渐消失,评价主体慢慢由人偏移成技术。另外,评价主体的自身能力不足也将会导致人工智能辅助教育评价的效果并没有那么好,教育评价的质量可能会有下降的风险。智能技术的强势介入在肯定评价人员的主体性的同时,也在不断冲击评价主体的生物素养[18]。因此,评价主体的智能素养等培养也迫在眉睫。其次,关于技术发展的问题,由于人工智能技术与教育的深度融合还在发展阶段,智能教育评价还有待探索和开发。目前的智能评价只能完成特定情境下的测评任务,对设备以及平台有一定的要求,还不能运用到更加复杂的教育环境中去。所以,在当前的智慧评价技术中,评价的成本相对来说较高。最后,由于收集数据的质量偏差,数据本身就存在多样性和多层次的特点。因此,如果过分地依赖数据指标为教育评价提供的便利很可能会降低评价的效度以及影响教育的导向。机器所做的决策并不能保证教育评价的公平性,受传统的评价思维影响,评价者使用机器或技术去实现智能评价的过程中也许也会带有传统评价的色彩。如果不能改变传统的评价思维,那么智能评价不过是披着智能的外衣的传统评价罢了。

4.2. 应对策略

要解决当下教育评价改革的问题,针对人工智能技术赋能教育评价目前面临的困境与挑战,提出以下相应的解决途径与应对策略。

首先,针对由于过于依赖智能技术导致评价主体偏移的问题。各学校可以提供培训计划,有针对性地提升教育团队整体的数字素养,加强各评价主体对当下人工智能相关理论的认识。在此基础之上,加强评价主体对人工智能技术的学习,包括对人工智能评价结果的分析、复核以及补足;提升对使用人工智能技术进行教育评价这项工作的兴趣和利用人工智能技术进行教育评价的能力。其次,针对技术发展不足以应付更加复杂的评价环境的问题。应当对技术进行优化,提升智能评价的适应性与精确度。当前智能评价模型的泛化性不足,还需依赖特定的场景与设备。一方面,可以开发更加轻量化的评价工具,如低依赖的算法等,减少对高性能算法的依赖性。另一方面,可以增强现有智能评价模型的泛化能力,让单一学科的模型适应更多学科、多学段的评价需求,建立开放的数据集等。最后,关于评价数据的质量和隐私安全的问题,要建立合法合规的数据管理体系。例如对敏感数据进行匿名化处理、明确数据采集的边界,只收集必要的学习行为数据等。除此之外,学校或上层部门也可设立数据管理员等相关人员来监督和筛选合法合规的数据,在确保数据质量的同时保护学生数据,确保数据在合规的范围内被使用。为了保证评价的公平性,要定期的对智能评价模型进行检测,公开评价模型的算法逻辑。评价主体在使用智能评价模型开展评价的过程中要摒弃传统的评价思维,结合多方面的多元评价数据对学生进行综合的全方位评价。

5. 未来展望

当前,智能评价虽然还存在着一些待解决的问题,但这些问题并不是没有解决之道。充分地利用人工智能技术来深化教育评价的改革是当下教育评价改革的发展趋势,也是必经之路。首先,对于教育评价的主体一定要以人为主体,在提高技术发展的同时,作为评价主体的人也要提高自身的能力,充分利用好人工智能这项技术,才能发挥智能评价的最大优势。其次,在信息化的今天,要保护好所收集数据的隐私安全,在保护隐私的同时要大力发展数据分析技术,提高教师和学生的数字素养。最后,要树立符合当下智能时代的教育评价观念,改变原先传统的教育评价观念,让智能技术在教育评价的领域里绽放应有的色彩。在利用智能技术的同时要用多元的视角去看待评价过程,技术的发展也应配合评价视角的多元性,建立更多样的评价模型,丰富更多元化的评价技术。在将人工智能技术引进评价的过程当中时要注意其伦理道德问题,统筹协调各方的意见,努力构建新时代的教育评价体系。只有在这些前提下,人工智能技术在教育评价中的应用才能发挥其最大的作用,为教育活动增光添彩。

NOTES

*通讯作者。

参考文献

[1] 国务院. 深化新时代教育评价改革总体方案[EB/OL]. 2020-10-13.
http://www.gov.cn/zhengce/2020-10/13/content_5551032.htm, 2022-03-15.
[2] 龙海涛. 人工智能时代教育评价改革: 契机、挑战与路径选择[J]. 中国考试, 2021(11): 10-18+34.
[3] 张生, 王雪, 齐媛. 人工智能赋能教育评价: “学评融合”新理念及核心要素[J]. 中国远程教育, 2021(2): 1-8+16+76.
[4] 梁远海. 人工智能教育探思[J]. 小学科学, 2023(15): 16-18.
[5] 周拥军. 素质教育与教育评价[J]. 新疆师范大学学报(哲学社会科学版), 2000, 21(3): 62-65.
[6] 霍力岩. 加德纳的多元智力理论及其对我国幼儿教育改革的积极意义[J]. 学前教育研究, 2000(2): 11-13.
[7] 王友涵, 胡中锋. 多元智力理论回顾与反思——纪念多元智力理论诞生40周年[J]. 全球教育展望, 2024, 53(3): 3-11.
[8] 龚孝华. 多元智能: 对教育评估科学性研究的影响[J]. 教育科学, 2002(5): 20-22.
[9] 罗静. 多元智能理论与教育评价的多元化[J]. 现代教育论丛, 2012(Z1): 6-9.
[10] 王斌儒. 多元智能理论与传统教育评价[J]. 科学咨询, 2023(1): 248-250.
[11] 卢小青. 多元智力理论对教育评价的价值与启示[J]. 中国成人教育, 2017(22): 33-36.
[12] 赵磊, 田丹. 人工智能何以赋能教育评价——基于国际研究热点和前沿的分析与启示[J]. 中国医学教育技术, 2024, 38(1): 1-9+22.
[13] 袁莉, 曹梦莹, 约翰∙加德纳, 等. 人工智能教育评估应用的潜力和局限[J]. 开放教育研究, 2021, 27(5): 4-14.
[14] 骆方, 田雪涛, 屠焯然, 等. 教育评价新趋向: 智能化测评研究综述[J]. 现代远程教育研究, 2021, 33(5): 42-52.
[15] 黄涛, 王一岩, 张浩, 等. 智能教育场域中的学习者建模研究趋向[J]. 远程教育杂志, 2020, 38(1): 50-60.
[16] 彭波, 王伟清, 张进良, 等. 人工智能视域下教育评价改革何以可能[J]. 当代教育论坛, 2021(6): 1-15.
[17] 刘邦奇, 刘碧莹, 胡健, 等. 智能技术赋能新时代综合评价: 挑战、路径、场景及技术应用[J]. 中国考试, 2022(6): 6-15.
[18] 鹿星南, 高雪薇. 人工智能赋能教育评价改革: 发展态势、风险检视与消解对策[J]. 中国教育学刊, 2023(2): 48-54.