人工智能技术在赋能心理测量与评估教学中的应用
The Use of Artificial Intelligence Technology to Empower Teaching in Psychometrics and Assessment
摘要: 人工智能(Artificial Intelligence, AI)在过去的几十年里飞速发展。尽管AI为各个领域的研究与实践提供了极大便利,但仍然不能忽视其可能存在的问题。此外,很少有文章关注心理测量与评估与AI的融合。因此,本文从心理测量与评估领域出发,概述了人工智能在心理测量与评估及教学中的应用,并探讨了心理测量与评估教学实践在人工智能技术赋能下的机遇与挑战,旨在寻找AI更好赋能教育的方法和途径。
Abstract: Artificial Intelligence (AI) has advanced rapidly over the past few decades. Although AI has provided tremendous convenience for research and practice across various fields, its potential issues cannot be overlooked. Moreover, few studies have focused on the integration of psychometrics and assessment with AI. Therefore, this paper explores the applications of AI in psychometrics, assessment, and education from the perspective of the psychometrics and assessment field. It also discusses the opportunities and challenges in teaching practices empowered by AI technology, aiming to identify better methods and approaches for AI to enhance education.
文章引用:贾砚璞, 吴荔荔, 刘伟志, 尚志蕾. 人工智能技术在赋能心理测量与评估教学中的应用[J]. 职业教育发展, 2026, 15(2): 84-88. https://doi.org/10.12677/ve.2026.152070

1. 人工智能的发展

人工智能(Artificial Intelligence, AI)被定义可以使机器推理和执行解决问题、物体和单词识别、世界状态推理和决策等功能的算法[1]。尽管AI通常被认为与计算机或机器人有关,但它的根源遍及多个领域,包括哲学、心理学、语言学和统计学。

AI在过去的几十年里发展迅速,其应用在许多科学领域中变得越来越普遍。自然语言处理(natural language processing, NLP)和生成式AI的发展导致了DeeepSeek、ChatGPT等强大工具的诞生。除了产生类似于人的语言外,这些技术还可以处理和分析大量的文本数据,为学者提供前所未有的见解。比如说,AI在心理学研究方面就提供极大便利。以往研究的广度和深度可能会受到传统社会心理学研究中使用的费力数据分析和小样本数量的限制。然而,随着生成式AI的发展,学者们现在可以有效地评估大量文本数据并对复杂的社会关系进行建模,为理解社会现象和人类行为提供新的见解和资源[2]。在实践方面,人工智能也越来越多的应用于医疗保健领域,例如疾病的预测与评估[3],药物的配方与开发[4],图像的识别与判断[5]等。这些基于AI的健康应用管理通过自动化医疗编码、基于人工智能的诊断特异性以及基于人工智能的早期检测信息,进而实现精准医疗。近年来,人工智能逐渐渗透到教育领域。AI通过其强大的数据处理和智能分析能力,为传统教育的创新带来了新的可能性。AI通过其配套技术主要包括云计算、大数据、VR/AR、边缘计算、智能传感器等,可以帮助实现关键数据的识别、采集、传输、存储和加密,为AI模型提供基础的可处理数据集。AI的关键技术包括卷积神经网络、循环神经网络、深度神经网络、贝叶斯网络等,可以基于基础数据集分析教育过程中的潜在规则,完成数据分析,分类、聚类和预测,协助学校、教师或学生优化教学方案设计、效果评价、伤害预警等应用,提高整体教学效果。这些越来越多研究的讨论也足以见得AI技术在各个领域应用的热度。

尽管AI技术为各个领域的研究与实践提供了极大便利,但很多研究者仍然提示不能忽视其可能存在的问题(如道德和偏见)。虽然AI融合医学方面有很多研究,但很少有文章聚焦心理测量与评估这一具体领域。因此,本文从心理测量与评估领域出发,概述了人工智能在心理测量与评估及教学中的应用,并讨论了心理测量与评估教学实践在人工智能技术赋能下的机遇与挑战,寻找AI更好赋能教育的方法和途径。

2. 人工智能与心理测量学的交叉融合

随着AI在各个领域的飞速发展,AI技术也大大促进了心理学研究内容与方法的革新[6],其中就包含心理测量学。基于AI与心理测量学的交叉融合,催生了许多新的研究方向,如认知计算、脑机接口等。这些方向的研究不仅有助于揭示人类心智的奥秘,还为AI的发展提供了新思路和新方法。AI在丰富测量方法、提升分析速度等方面为心理测量学的发展提供了有力支持。

2.1. 人机交互的测量与评估技术

主要依赖于自我报告法的传统心理测量方法虽然在标准化、灵活性及普适性等方面具有一定优势,但不可否认的是也具有一定局限性,比如这些方法可能受到参与者主观意识、理解能力和表达能力的影响,导致测量结果的准确性和可靠性受到限制。因此,首先基于自然语言处理和人脑机交互测量工具的开发,为心理测量研究提供了新的方法和手段。由于AI的优势,脑机接口(brain computer interface, BCI)和神经调控技术的可靠性变得越来越高。BCI在AI的帮助下可以实现快速“读取”大脑活动并解码及编码神经信号的含义[7]。并且AI正在赋能神经调控技术向精准化、智能化、个性化方向发展,其结合不仅提升治疗效果,还可能催生新型治疗范式(如基于神经状态的自适应调控) [8] [9]。未来,随着神经科学数据的爆炸式增长和AI算法的优化,这一领域有望成为脑疾病治疗的核心手段之一。其次,AI技术可以整合来自多种渠道的数据,如生理指标(如心率、皮电)、行为数据(如认知能力)、影像数据(如MRI)等。这种多模态数据相较以往的单一维度数据,可以更全面地了解个体的心理状态,提高心理测量的全面性和准确性[10]。随着AI的飞速发展,AI驱动的评估技术也会更加丰富,未来甚至有可能实现对个体心理状态的直接测量。

2.2. 多模态自动化的数据分析技术

AI跨学科的发展也为心理测量与评估提供了新的范式,例如深度学习算法和多模态学习技术。研究发现,基于机器学习的方法不仅可以通过分析行为数据直接完成对个体心理特征高准确度的自动识别,相比自我报告法还具有时效性高、可回溯测量、生态效度好等独特优势[11]。也可以将不同模态的线索相互补充,显著提高测量变量识别的效能[12]。这也就是为什么,与传统测量方式相比,AI技术有助于及时预警心理障碍或疾病。例如,旨在实现多模式数据收集的平台,如mindLAMP [13]、AWARE [14]和CrossCheck [15],有助于持续远程监测和识别精神病复发的主观和客观指标。当检测到异常或高危信号时,如自杀倾向、重度抑郁等,AI系统能够自动触发分级预警,并联动专业机构提供紧急援助。这种实时的分析和预警机制有助于及时发现问题,采取干预措施,防止事态恶化。此外,数据驱动的AI方法还可以帮助根据表现的异质性、人口统计学特征和环境因素等来识别心理疾病的亚型[16]。基于多模态信息的AI驱动评估技术推动心理测量与评估技术向自动化、自适应、普适化方向发展。

3. 心理测量与评估教学实践在人工智能技术赋能下的机遇与挑战

3.1. 机遇

首先,在学生层面,人工智能为转变学生的被动学习角色提供了新的可能性,实现了从“知识接收容器”到“知识主动建构者”的转变。在传统的“填鸭式”课堂中,学生往往处于信息流的末端,被动地接受统一灌输的知识,其个体差异与主动探究的欲望被极大地压抑。而人工智能的介入,通过个性化学习路径规划、自适应内容推送和智能答疑系统等手段,为每个学生打造了专属的学习旅程。人工智能技术支持混合式学习、翻转课堂等新型教学模式,人工智能赋能教学的有效性在越来越多的研究中得到证实。在这个过程中,学生的参与度大大提高,可以由被动的填鸭式学习转变为主动的探究式学习[17],教学活动也变得更加灵活、互动。这一有效性除了体现在学生方面,也体现在教师层面,它不仅是教学效率的提升工具,更是教师专业发展和心理健康的重要支撑。例如,研究发现通过加深人工智能理论和工具的认知理解,可以提升教师的心理灵活性,缓解教师焦虑情绪[18]。这种掌控感和效能感的提升,将会是对抗职业倦怠和焦虑的强大缓冲器。

心理测量与评估作为一门技术指向性课程,AI技术可以帮助学生通过多种途径快速学习并掌握最新测量与评估技术,批量提取并处理多模态数据,从而获得更加准确的测量结果。AI平台和工具包(如基于Python的Scikit-learn、TensorFlow等)为学生提供了低门槛接触和应用最新测量与评估技术的途径。学生无需从零开始编写复杂算法,便可通过实践学习项目反应理论、计算机化自适应测验、自然语言处理等前沿主题,极大地缩短了从理论到实践的距离。其优势不言而喻,这无疑对扩宽学生的研究思路和学习效能是有帮助的。

3.2. 挑战

尽管AI技术可以带来极大的便利性,但仍然存在一定的不足与挑战,心理测量与评估的过程中应值得注意。首先是数据伦理问题,心理评估涉及个人隐私(如家庭背景、心理状态),AI存储与分析可能引发泄露风险。但在数据分析中,人口学信息又是极为重要不可或缺的分析变量,在AI技术下如何保障被试隐私和数据安全的前提下,推动人工智能与心理测量学的深度融合与持续发展是值得思考的问题。随着AI技术的飞速发展,未来可能需要越来越多不同领域伦理规范和法律法规的出台[19]。其次是,AI测量评估下结果的有效性仍需验证。心理测量的公平性建立在“所有被试在相同构念上被衡量”的前提下。如果模型对不同群体使用了不同的“代理变量”进行预测,那么比较的结果本身就是不公平的。人口学信息在用于统计控制以消除偏见时是必要的,但被黑箱模型滥用时,反而会成为固化偏见的工具。AI算法效能会受不平衡的社会结构的影响,例如2019年发表在Science上的研究在一种广泛使用的算法中发现了种族偏见的证据,从而导致这一算法对特定群体预测效能下降了30% [20]。当我们用历史数据训练AI预测“未来表现”时,这些历史数据本身就包含了人类社会存在的系统性偏见。AI学习的不是“真实能力”,而是“有偏见的历史决策模式”。此外,同样也有一些研究发现,基于深度学习的表现劣于传统统计模型[21]。在教学过程中教师应提示学生在心理评估与测量技术时要抱有谨慎态度,不能过度追求先进算法。最后是,警惕生成式AI的局限和潜在风险[22]。心理测量与评估教学过程强调的是人机协同,而不是AI占据主动地位。AI作为心理测量与评估的“辅助工具”具有一定优势,但过度依赖AI可能导致师生沦为“技术执行者”。为应对生成式人工智能的局限和潜在风险,避免其过度依赖和沉迷人工智能,学校和教师应积极变革教学模式。

4. 小结

随着技术的发展,心理学智能化的趋势逐渐显现,人工智能与心理学融合将促进心理学各个领域理论及应用的发展。AI为心理测量与评估带来了前所未有的效率与深度,但其应用需平衡技术理性与教育伦理。它迫使我们必须重新审视心理测量学的基石:我们测量的究竟是什么?我们如何确保这种测量对每个人都公平且有意义?应对这一危机,需要我们将算法伦理、可解释性、因果推断融入AI测量模型的研发、评估和教育全流程,唯有在技术可控、价值向善的前提下,AI方能真正成为教育公平的赋能者,而非教育本质的异化者。

NOTES

*通讯作者。

参考文献

[1] Bellman, R. (1978) An Introduction to Artificial Intelligence: Can Computers Think? Boyd & Fraser Pub Co.
[2] Chen, D., Liu, Y., Guo, Y. and Zhang, Y. (2024) The Revolution of Generative Artificial Intelligence in Psychology: The Interweaving of Behavior, Consciousness, and Ethics. Acta Psychologica, 251, Article 104593. [Google Scholar] [CrossRef] [PubMed]
[3] Winchester, L.M., Harshfield, E.L., Shi, L., Badhwar, A., Khleifat, A.A., Clarke, N., et al. (2023) Artificial Intelligence for Biomarker Discovery in Alzheimer’s Disease and Dementia. Alzheimers & Dementia, 19, 5860-5871. [Google Scholar] [CrossRef] [PubMed]
[4] Noorain, Srivastava, V., Parveen, B. and Parveen, R. (2023) Artificial Intelligence in Drug Formulation and Development: Applications and Future Prospects. Current Drug Metabolism, 24, 622-634. [Google Scholar] [CrossRef] [PubMed]
[5] van der Velden, B.H.M., Kuijf, H.J., Gilhuijs, K.G.A. and Viergever, M.A. (2022) Explainable Artificial Intelligence (XAI) in Deep Learning-Based Medical Image Analysis. Medical Image Analysis, 79, Article 102470. [Google Scholar] [CrossRef] [PubMed]
[6] 刘冬予, 骆方, 屠焯然, 饶思敬, 沈阳. 人工智能技术赋能心理学发展的现状与挑战[J]. 北京师范大学学报(自然科学版), 2024, 60(1): 30-37.
[7] Zhang, X., Ma, Z., Zheng, H., Li, T., Chen, K., Wang, X., et al. (2020) The Combination of Brain-Computer Interfaces and Artificial Intelligence: Applications and Challenges. Annals of Translational Medicine, 8, 712-712. [Google Scholar] [CrossRef] [PubMed]
[8] 解虎涛, 张建国. 神经调控技术的过去、现在和未来[J]. 四川大学学报(医学版), 2022, 53(4): 559-563.
[9] Li, Y., Nie, Y., Quan, Z., Zhang, H., Song, R., Feng, H., et al. (2024) Brain-Machine Interactive Neuromodulation Research Tool with Edge AI Computing. Heliyon, 10, e32609. [Google Scholar] [CrossRef] [PubMed]
[10] Wang, J., Ouyang, H., Jiao, R., Cheng, S., Zhang, H., Shang, Z., et al. (2024) The Application of Machine Learning Techniques in Posttraumatic Stress Disorder: A Systematic Review and Meta-Analysis. npj Digital Medicine, 7, Article No. 121. [Google Scholar] [CrossRef] [PubMed]
[11] 苏悦, 刘明明, 赵楠, 刘晓倩, 朱廷劭. 基于社交媒体数据的心理指标识别建模: 机器学习的方法[J]. 心理科学进展, 2021, 29(4): 571-585.
[12] Zhao, S., Jia, G., Yang, J., Ding, G. and Keutzer, K. (2021) Emotion Recognition from Multiple Modalities: Fundamentals and Methodologies. IEEE Signal Processing Magazine, 38, 59-73. [Google Scholar] [CrossRef
[13] Lee, E.E., Torous, J., De Choudhury, M., Depp, C.A., Graham, S.A., Kim, H., et al. (2021) Artificial Intelligence for Mental Health Care: Clinical Applications, Barriers, Facilitators, and Artificial Wisdom. Biological Psychiatry: Cognitive Neuroscience and Neuroimaging, 6, 856-864. [Google Scholar] [CrossRef] [PubMed]
[14] Torous, J. and Walker, R. (2019) Leveraging Digital Health and Machine Learning toward Reducing Suicide—From Panacea to Practical Tool. JAMA Psychiatry, 76, 999-1000. [Google Scholar] [CrossRef] [PubMed]
[15] Ben-Zeev, D., Brian, R., Wang, R., Wang, W., Campbell, A.T., Aung, M.S.H., et al. (2017) Crosscheck: Integrating Self-Report, Behavioral Sensing, and Smartphone Use to Identify Digital Indicators of Psychotic Relapse. Psychiatric Rehabilitation Journal, 40, 266-275. [Google Scholar] [CrossRef] [PubMed]
[16] Dwyer, D.B., Falkai, P. and Koutsouleris, N. (2018) Machine Learning Approaches for Clinical Psychology and Psychiatry. Annual Review of Clinical Psychology, 14, 91-118. [Google Scholar] [CrossRef] [PubMed]
[17] 张雄涛, 黄旭, 曾孟佳, 吴小红, 蒋云良. 本科生人工智能教学模式和实训体系的探索与实践[J]. 湖州师范学院学报, 2021, 43(2): 89-93.
[18] 林艳丽. 人工智能教学培训机构教师焦虑情绪与心理灵活性研究[D]: [硕士学位论文]. 南昌: 南昌大学, 2022.
[19] 李骢等. 人工智能处理医学数据伦理要求的专家共识[J]. 生理学报, 2024, 76(6): 937-942.
[20] Obermeyer, Z., Powers, B., Vogeli, C. and Mullainathan, S. (2019) Dissecting Racial Bias in an Algorithm Used to Manage the Health of Populations. Science, 366, 447-453. [Google Scholar] [CrossRef] [PubMed]
[21] Jiang, R., Woo, C., Qi, S., Wu, J. and Sui, J. (2022) Interpreting Brain Biomarkers: Challenges and Solutions in Interpreting Machine Learning-Based Predictive Neuroimaging. IEEE Signal Processing Magazine, 39, 107-118. [Google Scholar] [CrossRef] [PubMed]
[22] 汪靖, 米尔外提·卡马勒江, 杨玉芹. 人机共生的复合脑: 基于生成式人工智能辅助写作教学的应用发展及模式创新[J]. 远程教育杂志, 2023, 41(4): 37-44.