借助AI培养批判性思维的教学案例实证分析
Fostering Critical Thinking in AI-Enhanced Teaching: An Empirical Case Study
摘要: 为应对生成式人工智能对教育的挑战,本研究基于建构主义理论,构建了“AI四阶段层级能力发展支架模型”。通过在研究生学术英语课程中开展准实验研究,并结合问卷、反思日志、教师记录等数据,实证探究该模型借助AI培养学生批判性思维的有效性。结果显示,实验组学生在元思辨能力、认知技能和情感特质上均取得显著提升。研究验证了将AI作为“思维支架”的系统路径,为智能时代的批判性思维教学提供了实践范式,并探讨了相应的教师角色转变。
Abstract: Addressing the educational challenges posed by generative AI, this study developed a “AI Four-Stage Hierarchical Critical Thinking Ability Development Scaffolding Model” based on constructivist theory. A quasi-experiment in a postgraduate academic English course, employing questionnaires and reflective journals, examined the model’s efficacy in fostering critical thinking. Results showed that the experimental group significantly improved in meta-critical thinking, cognitive skills, and affective dispositions. This study validates a systematic approach of using AI as a “thinking scaffold,” offering a practical paradigm for critical thinking pedagogy and illuminating the evolving role of teachers.
文章引用:王英男, 许炜. 借助AI培养批判性思维的教学案例实证分析[J]. 教育进展, 2025, 15(12): 660-666. https://doi.org/10.12677/ae.2025.15122328

1. 引言

在飞速发展的信息时代,批判性思维已成为个体发展的核心素养,它被认为是21世纪的一项关键技能,具有更强批判性思维的学生预计会有更好的未来[1],因此培养学生独立思考、理性判断的能力也已成为当今高等教育的核心目标[2] [3]。目前,生成式人工智能(AI)迅猛发展,当AI能够瞬间生成看似十分严谨的论文时,教育的核心价值必然要从知识的传递转向高阶思维能力的锻造。换句话说,我们必须培养学生一种超越人工智能输出能力的人类智慧:即质疑AI结论、审视其内在逻辑与偏见,并在此基础上进行创造性整合与价值判断的能力。

本文依据建构主义理论,以及文秋芳教授的思辨能力层级理论模型,提出“AI四阶段层级能力发展支架模型”(以下简称“四阶段模型”)。从研究生学术英语的课堂实践出发,采用问卷调查、学生反思日志以及教师观察记录等方式,探索如何借助AI为学生们搭建数字“支架”,在提高学生语言能力的同时,培养他们的批判性思维能力。

2. 理论框架

批判性思维最早可追溯至苏格拉底的“诘问法”,后经杜威[4]、恩尼斯[5]等学者发展,逐渐形成系统理论。美国哲学协会“德尔斐研究”提出的双维结构模型[6]、美国学者理查德·保罗的三元结构模型[7]、我国学者林崇德的三棱结构模型[8]均强调批判性思维是认知技能与情感特质的结合。本研究主要依据的是文秋芳构建的外语类大学生思辨能力层级模型[9],该模型将思辨能力划分为元思辨能力与思辨能力两个层级,强调自我监控与认知标准的统一(见表1)。

Table 1. Hierarchical theoretical model of critical thinking abilities for foreign language major students [9]

1. 外语类大学生思辨能力层级理论模型[9]

元思辨能力(自我调控能力)——第一层次

思辨能力——第二层次

认知

情感

技能

标准

好奇(好疑、好问、好学)

开放(容忍、尊重不同意见,乐于修正自己的不当观点)

自信(相信自己的判断能力、敢于挑战权威)

正直(追求真理、主张正义)

坚毅(有决心、毅力,不轻易放弃)

分析(归类、识别、比较、澄清、 区分、阐释等)

推理(质疑、假设、推论、阐述、 论证等)

评价(评判预设、假定、论点、论据、结论等)

精晰性(清晰、精确)

相关性(切题、详略得当、主次分明)

逻辑性(条理清楚、说理有根有据)

深刻性(有广度与深度)

灵活性(快速变化角度、娴熟自如地 交替使用不同思辨技能)

在教学层面,本研究借鉴建构主义的支架理论。该理论源于维果茨基的“最近发展区”概念,后经布鲁纳发展为“支架”教学法,指为学习者提供的、可协助其跨越认知发展区的临时性支持。

基于上述理论,我们构建了“AI四阶段层级能力发展支架模型”(见表2),旨在通过语言课堂教学培养学生的批判性思维。该模型分为四个阶段:示范与建模、引导与实践、能力提升与巩固、独立应用与创造。在各阶段中,教师、AI与学生角色动态变化:教师从主导者逐渐变为促进者,AI从“思维典范”退居为“静默工具”,学生则从观察者成长为自主学习者。

Table 2. AI four-stage hierarchical critical thinking ability development scaffolding model

2. AI四阶段层级能力发展支架模型

阶段

角色/任务

元思辨能力

核心思辨能力

情感特质

教师

AI

学生

认知技能

认知标准

第一阶段

示范与建模

设计情境、示范讲解

外化思维、 提供典范

观察思考、内化框架

计划、监控与评价

分析(识别、比较、 区分)

评价(评判)

清晰性、

准确性

好奇

开放

第二阶段

引导与实践

提供支架、个别指导

互动提问、 即时反馈

主动实践、

初步反思

监控(主导)

分析(辨析)、推理 (论证)、评价 (自我调控)

逻辑性、

深刻性

坚毅、

自信

第三阶段

能力提升与巩固

催化反思、评估过程

生成样本、 提供分析

批判评估、

自主决策

评价(对自我 思维的深度 评价)、调整

分析(比较、 区分)、评价(评判、检验、自我调控)、

重要性、 公正性

正直、

自信

第四阶段

独立应用与创造

创设任务、担任顾问

按需调用、 静默工具

独立创作、

综合应用

全面主导 (计划、监控与调整、评价)

所有技能的 自主应用

所有

自信、

开放、

正直、

坚毅

基于上述理论模型,本研究在研究生学术英语课堂中进行了教学实践与效果验证,具体设计与分析如下。

3. 研究设计与方法

本研究采用“前测–后测对照组”的准实验设计,并融合质性研究方法,旨在探究“四阶段模型”对研究生学术英语写作中批判性思维能力的培养效果。

3.1. 研究对象

本研究在北京某211高校的“研究生学术英语”课程中展开,选取两个平行班为对象。学生均为一年级工科研究生,在专业背景、英语入学成绩与前置课程方面无显著差异,具有可比性。随机将A班设为实验组,B班为对照组。

3.2. 教学干预

教学围绕学术论文的“摘要”、“引言”与“结论”三个模块展开,因其结构规范,可控制专业内容差异带来的干扰。

  • 实验组(A班):采用“四阶段模型”教学,学生使用AI进行互动并撰写反思日志。

  • 对照组(B班):采用传统教学法,教师讲解范文结构与写作技巧,学生完成练习并接受反馈。AI仅作为词汇查询或简单润色工具,不涉及系统性思辨训练。

3.3. 数据收集与分析

为达成数据三角互证,本研究从多来源收集数据:

1) 批判性思维自评问卷:考虑到课程特点,本研究没有使用现有的批判性思维测量工具,比如《加利福尼亚批判性思维技能测量》(CCTST),而是基于文秋芳的思辨能力层级模型编制了更符合“学术英语”课程内容的问卷,共13题,采用李克特五点计分法。本研究重点考察选择“符合”与“非常符合”(得分4与5)的学生百分比变化。

2) 学生反思日志:用于获取学生思维过程与决策的质性证据。

3) 学生写作作品:收集从初稿到终稿的文本,作为其思辨技能的行为体现。

4) 教师观察记录:用于记录课堂互动与学生行为表现,为分析提供第三方情境支撑。

为进行深度个案分析,我们依据写作成绩进行分层抽样,从每班的高、中、低三个层级各随机抽取6名学生(每班n = 18),构成核心分析样本。

数据分析采用混合方法:对问卷数据进行描述性统计分析(计算百分比);对反思日志与教师观察记录进行主题分析,并通过引文予以呈现。

4. 教学实施:摘要写作案例

本教学实施旨在将上述的“四阶段模型”转化为具体的课堂教学行动。以下以“学术论文摘要写作”单元为例,概述各阶段的核心教学活动(其与思辨能力的对应关系详见表2),并重点剖析关键环节的设计意图(见表3)。

Table 3. Implementation framework of the AI four-stage hierarchical critical thinking ability development scaffolding model in summary writing

3. AI四阶段层级能力发展支架模型在摘要写作教学中的实施框架

阶段

学生核心任务

关键AI提示词(功能角色)

教师角色

第一阶段

示范与建模

观察、对比、内化范文 分析框架

“请分析这篇摘要的语步结构和信号词。”

(思维典范)

设计情境

示范讲解

第二阶段

引导与实践

撰写初稿,根据AI反馈进行反思与修改

“请你扮演一位严苛的审稿人,针对我摘要的结构和 语言,提出两个尖锐的问题。”(互动提问者)

提供支架

个别指导

第三阶段

能力提升与巩固

对比AI生成的样本, 撰写“修改说明”以捍卫自己的写作选择

“请基于我的论文初稿生成一篇‘规范摘要’,并对比我的初稿,从信息取舍、逻辑、论证力度三方面指出三个具体不足并提供修改方向。”

(对比样本与分析向导)

催化反思

评估过程

第四阶段

独立应用与创造

独立完成新任务的摘要 写作,或进行“人机 协同”的同伴互评

“请为我生成一个包含五个要点的评估清单, 帮助我评阅同伴的摘要。”

(静默工具,按需调用)

创设任务

担任顾问

教学从教师与AI协作分析范文开始(阶段一),帮助学生建立“优秀摘要”的认知框架。学生随后进入写作循环:撰写初稿,并主动寻求AI的挑战性提问,以暴露逻辑漏洞(阶段二)。阶段三为关键环节,学生需提交正式“修改说明”,阐述接受或拒绝AI建议的理由,例如:“我接受AI关于……的建议,因为……;但我保留……的表述,因为……”。该设计强制学生完成两项批判性操作:评价AI反馈的合理性,并论证自身选择的依据。阶段四,学生面对全新的论文材料独立撰写摘要,或在不依赖AI直接生成内容的前提下进行同伴互评;AI仅作为可选工具,标志着教学支架的撤除与学生自主应用能力的形成。

上述教学流程为评价“四阶段模型”在培养学生批判性思维方面的实效提供了具体情境,其结果与分析将在下节详细呈现。

5. 研究结果

通过对前测与后测问卷、学生反思日志、写作作品及教师观察记录的混合方法分析,本研究发现,“四阶段模型”对实验组学生的批判性思维能力产生了多维度积极影响。

问卷数据显示,实验组在元思辨能力、核心认知技能与情感特质三个维度的进步均显著高于对照组(见表4)。这表明,“四阶段模型”作为一种系统性的教学干预,对学生思辨能力的影响是全面而深入的。

Table 4. Comparison of pre-test and post-test percentages (%) of students who selected “agree” and “strongly agree”

4. 选择“符合”与“非常符合”的学生比例前后测对比(%)

维度

组别

前测

后测

百分比变化

元思辨能力

(计划、监控、调整)

实验组

36.7%

65.7%

+29.0%

对照组

33.3%

40.0%

+6.7%

核心认知技能

(分析、推理、评价)

实验组

40.0%

64.3%

+24.3%

对照组

40.7%

47.3%

+6.6%

情感特质

(好奇、开放、自信、正直、坚毅)

实验组

45.5%

70.2%

+24.7%

对照组

45.3%

52.1%

+6.8%

5.1. 元思辨能力发展

实验组在元思辨能力方面提升最为明显(+29.0%)。后测中,65.7%的学生表示能在写作中有效规划并监控思维过程。教师观察发现:“学期初,学生多为‘提笔就写’;中后期,多数学生会先拟提纲,写作中不断回看与自我提问。”反思日志中也印证了这一转变,如学生提到:“现在我会先考虑整体框架,而非直接写第一句话……常自问‘这样写是否准确概括了论文?’”这种从自动化运作到策略性监控的转变,是元思辨能力发展的核心标志,也为其他高阶思维技能的应用奠定了基础。

5.2. 核心认知技能提升

实验组在核心认知技能上提升24.3%。反思日志显示,AI在阶段二的提问(如“你的研究目的如何从研究空白引出?”)促使学生发现论述断层并予以修补。教师观察也指出:“实验组在互评中更多使用‘因为……’、‘如果……那么……’等逻辑连接词,表明推理技能已从隐性转化为显性应用。”

5.3. 情感特质转变

实验组情感特质提升24.7%,后测中70.2%的学生表现出更强的学术自信与开放态度。一名学生写道:“以前视AI为权威,现在视其为有时犯错的伙伴。我多次拒绝其复杂句式建议,坚持工程领域的清晰表达,并在修改说明中写明理由。我能判断机器‘对错’的自信是最大收获。”教师观察也表明:“学期后半段学生更敢于质疑AI,并为自己的写作选择辩护。学术自信显著增强。”

6. 讨论与反思

基于上述研究结果,本研究发现“四阶段模型”在提升学生的批判性思维能力方面展现出明显成效。为了进一步理解其内在机制并审慎推进后续实践,下面从模型有效性、伦理边界与教师角色三个层面展开深入探讨。

6.1. 模型有效性的内在逻辑

本模型通过将批判性思维分解为可操作的教学阶段,借助AI实现“外化–冲突–内化”的思维训练循环。AI将抽象思维标准具象为分析框架与提问,使学生“看见”思维;通过创设认知冲突推动学生进入元认知循环;而“修改说明”任务则促使外部反馈转化为内部论证能力,实现从依赖权威到自主评判的认知跃迁。

6.2. 伦理边界与教育责任

为防范AI使用的伦理风险,本研究通过过程透明化与评价重心转移予以应对。要求学生提交AI对话记录与修改说明,让使用行为公开化,并将评价焦点从成品转向思维过程,从而抑制抄袭动机。教师还需引导学生注意数据隐私保护,将相关规范纳入数字素养教育。

6.3. 教师角色的重塑

本模型的实施对教师专业能力提出了新要求。教师不再是知识的唯一权威者,而是学习过程的设计者、思维对话的引导者与AI协作的协调者。

实践中,教师需具备三项核心能力:1) 提示词设计与AI反馈解读能力,以精准激发学生的高阶思维;2) 元认知对话引导能力,善于通过提问促进学生“对思考的思考”;3) 学习生态设计能力,统筹人机互动、生生协作与教师引导,构建融合式的批判性思维训练场域。

综上所述,“四阶段模型”的有效性不仅依赖于“外化–冲突–内化”的认知机制,还取决于与之配套的伦理规范与教师的新型角色。这一系统性的教学框架为在AI时代开展批判性思维培养提供了理论与实践依据。

7. 结束语

批判性思维作为创新能力的基石,是高等教育质量提升的关键目标。生成式AI既挑战传统教学,也为思维教育深化提供了技术杠杆。本研究构建的“AI四阶段层级能力发展支架模型”,通过系统化教学设计将AI从替代思维的工具转化为培养思维的支架,证实了其在提升学生批判性思维方面的可行性与有效性。

尽管本研究在样本规模与分析深度上仍存在局限,但它是一次融合智能技术与思维教学的有益探索。我们相信,本研究所构建的模型与实践,为在智能时代借助AI工具培养学生的批判性思维提供了一条可操作的路径。展望未来,如何在此基础上进一步拓展学科适用性、开发配套的教师发展课程、构建更精准的思维评估体系,将是后续研究的重要方向。

参考文献

[1] Butler, H.A., Pentoney, C. and Bong, M.P. (2017) Predicting Real-World Outcomes: Critical Thinking Ability Is a Better Predictor of Life Decisions than Intelligence. Thinking Skills and Creativity, 25, 38-46. [Google Scholar] [CrossRef
[2] 谷羽, 刘芝庆, 谷木荣. 以辩论游戏提升大学生批判性思维能力——以新闻传播学课堂实践为例[J]. 高教发展与评估, 2021, 37(2): 105-114, 120.
[3] 范福兰, 雷雪英, 王建书, 王思雨, 麦迪努尔∙买合木提. 基于张量表示的大学生批判性思维多模态测评[J]. 现代远程教育研究, 2024, 36(4): 104-112.
[4] Dewey, J. (1933) How We Think: A Restatement of the Relation of Reflective Thinking to the Educative Process. D.C. Heath, 9 p.
[5] Ennis, R.H. (1962) A Concept of Critical Thinking. Harvard Educational Review, 32, 81-111.
[6] Factone, P.A. (1990) Critical Thinking: A Statement of Expert Consensus for Purposes of Educational Assessment and Instruction. The California Academic Press.
[7] Paul, R. and Elder, L. (2008) The Miniature Guide to Critical Thinking: Concept and Tools. The Foundation for Critical Thinking, 24 p.
[8] 林崇德. 思维心理学研究的几点回顾[J]. 北京师范大学学报(社会科学版), 2006(5): 35-42.
[9] 文秋芳, 王建卿, 赵彩然, 刘艳萍, 王海妹. 构建我国外语类大学生思辨能力量具的理论框架[J]. 外语界, 2009(1): 37-43.