1. 引言
根据《义务教育英语课程标准(2022年版)》,核心素养的培养是基础教育的目标,其中语言能力作为基础要素[1]。《普通高中英语课程标准(2017年版2022年修订)》进一步指出:“语言能力指在社会情境中,以听、说、读、看、写等方式理解和表达意义的能力。”[2]初中英语口语能力作为语言能力的重要组成,其提升对于核心素养培养至关重要。当前初中英语口语教学中,教师多依托语言模态(语音、文字系统)组织口语训练,而系统性忽视了非语言模态(如体势语、视觉表征等)的认知协同效应。认知负荷理论将人的认知结构分为工作记忆和长时记忆,并认为有效的学习是通过工作记忆将信息高效处理和存储到长时记忆中[3]。认知负荷是学习任务对工作记忆的信息处理需求[4];当学习任务引发的认知负荷超过个体工作记忆资源上限时,学习进程会受到阻碍[5]。一旦认知负荷超载,学生就会陷入表达僵局,严重影响工作记忆信息存储效率[6]。在口语输出中,学生对单一语言模态的依赖会导致表达障碍,由于缺乏多模态支持,工作记忆无法有效处理认知负荷。多模态话语理论强调信息通过语言模态与非语言模态的协同作用实现传递[7]。当口语任务因词汇、句法缺失导致认知负荷超载时,非语言模态可通过提供多模态通道语义补偿,分担语言模态的编码负荷,提升工作记忆信息处理能力,缓解认知负荷超载。基于核心素养与上述理论框架,开展初中英语多模态口语教学研究具有必要性。现有研究指出,多模态口语教学通过多模态协同输入强化知识理解,提升学生口语自信[8];通过兴趣培养和能力训练提升学生口语输出[9]。尽管多模态口语教学已被证实能提升口语教学效果,但既有研究多聚焦于整体效果,却缺乏对内部模态相互作用机制的解析,尚未从认知负荷理论视角,揭示非语言模态如何通过减负机制促进口语输出,提升口语教学效率。基于认知负荷理论,本研究指出,非语言模态可分担工作记忆中语言模态的编码负荷,以此揭示初中英语多模态口语教学中非语言模态促进口语教学的减负机制,从内部作用路径论证多模态口语教学的重要性。
2. 核心概念及理论基础
2.1. 多模态教学
模态指事物通过特定感官或符号系统传递与接受信息的方式,多模态指协同使用两种及以上模态的过程[10]。多模态教学基于多模态话语分析理论,整合语言、图像、声音、动作等多种模态构建意义表达与交流[11];通过构建拟真情景激活多重感官认知,强化学习者互动体验,与语言学体验观形成理论呼应[12]。在初中英语多模态口语教学中,教师通过整合图片、视频、音频、动作等多种模态,创设真实情境,调动学生视觉、听觉、动觉等多重感官,如利用情境辅助词汇理解、通过角色扮演强化语言输出等教学方法,以提高教学效率。
2.2. 减负机制
在认知负荷理论视角下,本文所提到的减负机制,本质上是一种通过优化教学模态配置以缓解学生认知负荷的教学策略。这一机制的核心在于,通过引入非语言模态辅助语言模态的信息处理,从而有效地分散和减轻学生在单一语言模态下因信息超载而产生的认知压力。具体而言,多模态口语教学通过整合多种感官输入,使学生通过语言模态处理信息时,能够借助非语言模态的辅助进行信息的解码、编码和存储[13],进而扩展工作记忆的信息处理路径。这种机制不仅有助于解决语言模态下信息超载的问题,还能通过多模态信息的交互作用,促进学生对语言知识的深度理解和内化,形成更加稳固和灵活的语言能力。
本文的减负机制与Richard Mayer的多媒体学习认知理论(CTML) [14]相比,两者形成有机对话。CTML中双通道假设所提出的“信息处理系统”与本机制的“工作记忆”在功能与本质上完全对应,其容量有限性是双方共同的理论起点。同时,Mayer的“听觉/言语通道”和“视觉/图像通道”则精准对应本机制的“语言模态”与“非语言模态”的核心内涵。Mayer理论聚焦于经典的视听双通道,而“非语言模态”包括动觉、触觉等更为广泛的感知通道,是一个更具包容性的范畴,故“视觉/图像通道”仅是“非语言模态”中的一个核心构成要素。在此基础上,更为关键的是,Mayer的主动加工假设所强调的信息主动构建与本机制的有效运行条件达成根本共识:即减负机制的有效运行绝非一个被动的、机械的信息加工过程。多模态教学为该机制的启动提供了外部条件与可能,而其最终能否有效运行,根本依赖于学习者自身的主动加工意愿与学习动机。
综上所述,本文所提出的减负机制,不仅是一种动态的教学优化过程,更是在与Mayer多媒体学习认知理论等经典框架的对话与拓展中,确立了其理论深度与实践价值。该机制旨在通过多模态的协同作用,提升工作记忆信息处理效率,从而最终达成语言学习效果的提升。
2.3. 认知负荷理论
认知负荷理论认为,教学效率取决于对认知结构的优化,该理论将认知结构分为工作记忆(负责即时信息处理)和长时记忆(存储知识图式),并指出学习过程中的认知负荷源于工作记忆的资源消耗[15]。认知负荷是学习任务对工作记忆施加的负荷,具体分为三种:内在、外在和相关认知负荷[16]。内在认知负荷仅由学习内容和学习者的专业水平决定,若学习内容和学习者专业水平处于确定状态,内在认知负荷便无法改动,而外在认知负荷由次优教学设计引发,教师应尽可能通过优化教学设计将其最小化[17]。相关认知负荷是构建图式和促进图式自动化所投入的认知资源,教师应通过教学设计强化相关认知负荷,驱动深度学习[18]。工作记忆是长时记忆与外界环境互动的媒介,而长时记忆是人脑的核心信息库,二者协同实现信息处理[19]。内在与外在认知负荷消耗工作记忆资源,相关认知负荷则提升其信息处理效率[20]。学习效率取决于工作记忆能否成功处理并转化信息到长时记忆,一旦任务需求超出其能力,就会导致认知负荷超载,学习失效[21] [22]。该理论提出的三重负荷分类不仅为诊断学习障碍提供了理论框架,更指明了教学设计的优化方向:在内在负荷不可变的前提下,通过消除外在负荷干扰、激发相关负荷的积极投入,最终实现工作记忆资源的最优配置。综上,认知负荷理论从认知架构的视角揭示了学习效率的本质机制:通过科学调配工作记忆负荷,实现将工作记忆信息向长时记忆转化的效能提升。
3. 初中英语多模态口语教学中的减负机制
3.1. 口语教学中的认知负荷
3.1.1. 内在认知负荷
在初中英语多模态口语教学中,语言系统本身的复杂性(语音、词汇、语法、语用)与学生当前专业水平共同构成内在认知负荷。这种由学习材料本质属性和学生认知基础双重决定的负荷,直接增加工作记忆的信息处理压力,具体表现为:
(1) 语音编码负荷
语音编码负荷指学生在口语表达中,因需要同步处理发音准确性(如音素、重音)和语言流畅性(如连读、停顿)而产生的认知压力。当学生已掌握单词的正确发音,但未达到自动化输出水平时,工作记忆在转化语音信息时,其语音回路监控系统会执行对语音、语调的实时监测与修正[23]。这种双重任务需求会占用大量的工作记忆资源,对工作记忆的信息转化过程产生内在认知负荷,降低工作记忆信息转化效率。例如:当学生试图说“banana”时,若误读为/bɑ: nɑ: nɑ/,工作记忆中的语音回路监控系统会通过将实际发音与大脑中存储的正确发音模板/bəˈnɑ: nə/或/bəˈnænə/进行实时比对,以此检测发音错误。
(2) 词汇提取阻滞
词汇提取阻滞指学生在口语表达时因词汇网络激活不足(如单词遗忘、搭配不熟)导致的表达中断现象。由于工作记忆中的中央执行系统负责监控工作记忆内容和调节词汇存储策略,因此在语言输出过程中,工作记忆需要同步处理词汇检索和语义组织[23]。当学生因词汇提取失败(如无法回忆目标单词或短语时)而表达中断时,工作记忆的信息转化过程也会被迫停滞。一旦某个环节卡顿,整个信息转化流程就会受阻,既影响当下的表达连贯性,也阻碍词汇信息向长时记忆的巩固。这种阻滞会直接干扰工作记忆对信息的转化,阻碍外部信息向长时记忆的编码。
(3) 语法监控冲突
语法监控冲突指学生在口语输出过程中因语法知识不足或自动化程度低,导致句式错误(如时态混淆、主谓不一致)或表达中断(如因语法犹豫而中断)。这种冲突迫使工作记忆同时承担双重认知负荷:一方面需要完成对语言信息向长时记忆的转化,另一方面又不得不进行实时的语言监控与修正。这种双重任务的资源竞争不仅会分散注意力,导致口语表达的流畅性下降,还会因这种持续的语法监控过程而显著增加工作记忆的内在认知负荷,使学习者可用于其他语言处理任务的认知资源进一步减少。
(4) 母语负迁移
二语学习者在英语口语表达时,母语的并行激活会导致跨语种竞争,从而对目标语产生影响[24]。母语负迁移指二语学习者在英语口语表达过程中,由于过度依赖汉语的思维模式和语言结构,导致产出不符合目标语习惯的想象。例如:学生在进行口语表达时,常将中文表达习惯直接迁移到英语中,将“开门”表述为“open the door”,而非地道表达“answer the door”。这种跨语言干扰迫使工作记忆执行双重任务:既要抑制母语自动化反应,又要激活正确的英语口语表达,显著增加了认知负荷。
3.1.2. 外在认知负荷
在初中英语多模态口语教学中,外在认知负荷指由于教师教学设计不当,引发学生与核心学习目标无关的认知压力,这种压力不仅阻碍语言输出的流畅性与准确性,更会显著增加工作记忆的信息转化负担。具体表现为:
(1) 教学指令不明
在初中英语口语教学中,教学指令不明会显著增加学生的外在认知负荷,进而阻碍口语教学活动的有效开展。当教师未能提供清晰的任务目标、操作步骤或评价标准时,学生需要额外分配工作记忆资源来揣测任务要求,如:学生需消耗认知资源解读模糊指令,而非专注于语言输出,这种与核心学习目标无关的认知加工会占用有限的工作记忆容量。
(2) 缺乏及时引导
有效的教师引导(如提示性提问、范例演示等)可通过提供“及时认知支架”,将学生从试错性加工(指学生在错误中反复尝试并总结经验的认知过程)中解放出来,使其工作记忆集中于目标语表达。教师未能及时提供引导会增加学生的外在认知负荷。当学生在口语输出过程中遇到困难(如词汇提取障碍、话轮转化困惑[25])时,若缺乏教师的适当干预,学生需自主分析障碍成因(如判断是词汇不足还是句法错误),消耗本应用于语言生成的认知资源。此时,工作记忆资源将被非必要认知活动占用。
3.1.3. 相关认知负荷
相关认知负荷特指工作记忆资源中专门用于图式构建和实现自动化的部分,其本质是对学习有积极贡献的认知投入,在初中英语多模态口语教学中具体体现为“学生在兴趣和动机的驱动下,主动进行的深度语言加工”。动机和兴趣是相关认知负荷的催化剂,它们促进学生主动分配更多认知资源到图式构建和自动化过程中。例如:高动机的学生更愿意“多听多练”,主动通过模仿视频对话中的语音语调、自觉观察教师的手势表情、反复练习直到脱口而出等练习方式来提高口语输出能力。
3.2. 非言语模态对语言模态的协同促进
3.2.1. 视觉模态分担语义加工
在初中英语多模态口语教学中,视觉模态通过跨通道表征分担语义加工负荷,有效缓解工作记忆压力。当学生因词汇提取困难(内在负荷)或指令模糊(外在负荷)导致语言加工受阻时,教师提供的视觉支撑(如图片、视频、手势等)可帮助学生进行双重编码。视觉信息通过大脑的视觉处理区域与语言中枢协同工作,形成互补的信息通道。如:学生遗忘“unbrella”时,教师展示雨伞图片而非单纯的语言提示(如“It is used on rainy days.”)。视觉模态通过提供外源性表征支架,将部分语义加工从工作记忆的语言通道卸载至视觉通道,实现认知负荷的跨模态平衡。
3.2.2. 动觉模态强化语义理解
在初中英语多模态口语教学中,动觉模态(手势、表情、肢体动作)通过具身认知机制,将抽象的词汇和复杂语境具象化,从而分担工作记忆压在纯语言模态下承担的语义解析压力。动觉模态激活大脑运动皮层,形成感知运动耦合[26]。例如:学习“stagger (蹒跚)”时,学生通过模仿摇晃动作,将抽象动词与本体感觉绑定,减少工作记忆对语言定义的依赖。动觉模态通过身体动作的时空表征,将语言模态无法单独承载的语境信息具身化,实现工作记忆从符号化加工向感知化加工的负荷转移。
3.2.3. 听觉模态强化语音编码
在初中英语多模态口语教学中,听觉模态通过提供标准化的语音输入,优化工作记忆的语音编码效率,从而降低因发音不准或语调错误导致的内在认知负荷。当学生仅依赖语言模态(如文字符号)进行发音推测时,工作记忆需消耗额外认知资源进行音位转换(如字母a对应/æ/),而听觉模态通过直接输入声学信号,使工作记忆将信息直接存储于长时记忆中。听觉模态通过声学信号的直接输入,绕开工作记忆的符号转换瓶颈,将语音编码从耗时的规则推导转化为高效的知觉模态,从而释放认知资源用于更高阶的语用加工,缓解因语言模态对语音信息处理能力不足时所导致的内在认知负荷。
3.2.4. 多模态输入对相关认知的提升
在初中英语多模态口语教学中,听觉、视觉与动觉模态通过增强情境沉浸感与自我效能感,显著提升学生的内在学习动机,进而促进学生将更多的认知资源主动分配给图式构建与自动化加工。通过整合视听等多模态输入,能够促进大脑中多巴胺系统激活,从而增强学生学习动机[27],帮助学生更高效地分配注意力与记忆资源,最终实现高效学习。以“购物对话”教学为例(目标句型:How much is...? I will take it.),教师首先播放真实的超市购物对话,以营造沉浸式语言情境;随后通过视频展示商品信息,以提供口语话题;最后组织学生分组角色扮演,使用道具货币完成交易任务,以强化语言理解。这种多模态输入模式不仅激活了学生大脑中的多巴胺系统,使其在拟真购物场景中获得成就感,更促使学生主动将认知资源分配给图式构建,更加主动地使用语言,实现从刻意练习到自动化输出的转化,最终实现高效学习。
3.3. 减负机制的执行条件
在核心概念论述中,本文确立了学习者的主动加工意愿是减负机制得以有效运行的必要前提。在此基础上,本部分将默认该前提已得到满足,进而聚焦于探讨该机制在微观层面上的执行条件。具体而言,本部分将依据冗余效应、工作记忆的有限组块容量以及注意分离效应,对减负机制有效运行的具体条件剖析如下:
3.3.1. 模态互补性条件
只有当不同模态提供互补信息时,才能提升工作记忆信息处理效率,缓解认知负荷。根据冗余效应,若不同模态呈现重复内容,反而会浪费工作记忆有限的信息处理资源,变相增加工作记忆的认知负荷[28]。当同一信息被多种模态重复呈现,工作记忆的信息处理组块会被重复信息占用,这意味着变相减少可用组块,实质增加工作记忆的信息处理负荷。即便同一信息被多种模态呈现会增强该信息的记忆痕迹,但多模态的教学核心目标是促进知识的深度理解和多维构建,而非简单强化单一记忆痕迹。真正的记忆强化应发生在信息转化为长时记忆后的提取练习阶段,而非初始学习时的机械重复。优质的多模态设计应着力于知识的全面呈现与有机整合,而非表层的记忆强度堆积。工作记忆的有限容量决定了教学设计必须遵循“互补优先”原则——每个模态应提供独特信息维度(如视觉呈现形态、听觉传递语境、动作激活体验),使学习者构建起互联的知识网络。冗余信息不仅浪费宝贵的组块资源,更会阻碍知识在长期记忆中的结构化存储。
3.3.2. 容量有限性条件
工作记忆有限的信息处理组块决定了模态并非越多越好——超出组块总数(通常3~5个)的任何多模态教学设计,无论信息是否互补,都将导致工作记忆信息处理系统的认知负荷超载[29]。尽管通过精心设计(如使内容高度关联)可将两个模态整合为一个组块,但这并不意味着参与工作记忆信息处理的模态越多越好。工作记忆的四个组块上限是刚性约束——即便部分模态能合并处理,但随着模态数量的增加,工作记忆的信息处理组块仍会被占用完,仍会产生额外信息处理负荷。
3.3.3. 模态衔接性条件
该减负机制的减负作用需以模态间高效衔接为必要条件。根据注意分离效应,当模态呈现存在时空或语义割裂时,将诱发注意资源竞争,迫使学习者执行非必要的认知整合,从而显著增加外在认知负荷[29]。具体而言,时空割裂会迫使学习者在不同空间位置或时间节点反复切换注意焦点,导致视觉搜索负荷加重。语义割裂会引发概念表征冲突,导致命题整合负荷加重。这都可能导致减负机制失效,甚至反向增负。因此,多模态教学设计必须严格考虑模态之间在教学中的衔接性。
综上所述,本研究减负机制需同时满足三个前提条件:(1) 模态经过整合后的信息单元数量应小于等于工作记忆组块总容量;(2) 各模态信息遵循互补原则;(3) 各模态在教学中应具备衔接性。只有遵循该前提,减负机制才可能会通过非语言模态对语言模态的辅助来缓解工作记忆的认知负荷。反之,该减负机制可能会增添工作记忆信息处理负荷。
4. 对教学实践的启发
4.1. 强化学习动机,奠定减负基石
减负机制的有效运行,其首要前提是学习者的主动加工意愿。因此,在初中英语口语教学中,多模态教学设计的首要任务并非模态的简单堆砌,而是在于创设能够激发学生内在学习动机的情境。教师应通过设计具有挑战性、关联性和趣味性的多模态任务(如角色扮演、游戏化活动),或是播放贴近学生生活背景的趣味视频、音频,并组织他们围绕内容进行交流与讨论,以此有效激发学生的兴趣和动机,并引导其投入认知资源,主动进行信息的选择、组织与整合。唯有在此前提下,工作记忆的资源才能被充分调动,旨在优化认知资源分配的减负机制也才可能被激活并生效。
4.2. 控制模态数量,促进深度整合
减负机制的有效运行严格受到工作记忆有限容量的约束。根据认知负荷理论,工作记忆同时处理的信息组块数量极为有限,且每个新增的教学模态都可能占用独立的工作记忆资源组块。因此,教师需审慎控制模态使用的数量,避免陷入“多模态即优”的误区,防止过多的模态同时竞争有限的认知资源,引发资源过度分散与认知超载,反而加重工作记忆信息处理负担。更为关键的是,模态的使用应旨在促进信息的深度整合,即通过精心设计,使多个模态在认知层面上被表征为一个高度关联、语义连贯的信息整体,让多个模态只占用一个工作记忆组块,从而高效利用工作记忆的有限信息处理容量,为处理更复杂的信息和进行更深度的思维活动创造条件。
4.3. 确保模态互补,规避冗余效应
减负机制的核心在于通过不同模态的协同增效来优化认知资源分配,而非信息的简单重复。因此,教学设计必须严格遵循模态互补原则,即每个新增的模态都应提供独一无二、不可替代的信息内容。在初中英语口语教学中,教师应精心设计,使非语言模态(如图像、图表、动作演示)负责呈现语言模态难以清晰表达或抽象复杂的内容(如空间结构),而非重复相同的文字信息。任何导致信息冗余的多模态设计,都会突然地占用宝贵的工作记忆组块,不仅无法促进知识的结构化理解,反而会因处理重复信息而增加不必要的外在认知负荷,彻底违背减负机制的初衷,从“减负”异化为“增负”。
4.4. 强化模态衔接,规避注意分离
减负机制的有效性不仅取决于模态所呈现的内容,同样取决于其呈现的时空关系。教学设计必须遵循模态衔接原则,即在时间和空间上确保相关联的模态紧密呈现,以最大限度地减低学生整合信息的认知努力,规避注意分离效应带来的额外外在认知负荷。在初中英语口语教学中,教师需精心安排教学流程,确保模态切换自然流畅、意义连贯。例如,在播放一段示范对话视频后,应立即组织学生围绕视频内容进行角色扮演或小组讨论等教学活动,并利用提问或图文提示作为认知支架,帮助学生迅速建立模态所呈现内容之间的意义连接,无缝切入语言输出练习。任何时空上造成模态衔接割裂的设计(如文字信息与对应图片分隔太远),都会强迫学生耗费宝贵的工作记忆资源进行额外的信息搜索与整合。
5. 研究局限性
本研究基于认知负荷理论探讨了初中英语多模态口语教学中所存在的减负机制,揭示了非语言模态如何通过分担语言模态的信息处理压力,提升工作记忆的信息转化效率,但仍存在三方面局限性。首先,本研究假设非语言模态必然促进语言模态,但未深入探讨模态间的潜在冲突(如过多的视觉输入可能干扰语言输出,或复杂肢体动作分散语言注意力);模态间的潜在冲突可能导致认知资源分配失衡。其次,研究未充分考量学习者个体差异(如:认知风格、语言水平、学习偏好)对模态效果的影响。最后,尽管研究揭示了非语言模态通过协同语言模态缓解内在认知负荷并提升相关认知负荷的机制,但未涉及外在认知负荷(如教学设计缺陷引发的压力)的减负路径,未能阐明跨模态补偿如何抵消或缓解教师指令模糊等外在干扰。综上所述,这些局限性提示未来研究需进一步验证模态冲突的条件,开发基于学者特征的个性化多模态设计,并完善对外在认知负荷的干预理论框架。
6. 结论
本研究基于认知负荷理论,采用定性的研究方法系统论证了初中英语多模态口语教学的减负机制,揭示了非语言模态如何通过提供辅助性信息处理通道,有效分担语言模态的认知压力,从而提升工作记忆的信息转化效率。本研究基于认知负荷理论的内在、外在和相关认知负荷三维框架,首先系统分析了三者在初中英语口语教学中的具体体现,进而论证了多模态教学通过非语言模态与语言模态的协同作用针对认知负荷的减负机制。更为重要的是,本研究深入探讨了该减负机制有效运行的四项前提条件:学习者的主动加工意愿、模态数量的有限性、模态内容的互补性以及模态呈现的衔接性。基于上述理论与条件分析,本研究最终凝练出四项核心教学启示:(1) 强化学习动机,奠定减负基石;(2) 控制模态数量,促进深度整合;(3) 确保模态互补,规避冗余效应;(4) 强化模态衔接,规避注意分离。这四项启示与减负机制共同构成了一个旨在优化认知资源分配的多模态口语教学减负体系,为解决传统单模态教学中的认知超载问题提供了系统化的新思路。同时,本研究也指出未来需要进一步探讨的问题:(1) 模态间可能存在的冲突;(2) 学习者个体差异对模态效果的影响;(3) 非语言模态如何通过跨模态补偿缓解教学设计引发的外在认知负荷,为后续研究指明了方向。这一认知负荷理论视角的探讨,为初中英语多模态口语教学的重要性提供了理论依据和实践指导。