1. 引言
托福(TOEFL)考试宣布2026年开始对部分题型进行变革,以求该考试能更精准地反映学生在真实语境中的语言应用能力。作为新增题型,Read in Daily Life (日常阅读)是本次改革中可以被视作托福阅读部分转型的标签之一,以非学术文章为主要文本,向日常生活逐步渗透。它的设计理念根植于CEFR (欧洲语言共同参考框架),通过模拟非学术场景下的文本交互,考察学生对碎片化、情境化文本的理解和处理能力。这种改革标志着托福考试从传统的学术导向向综合应用导向的战略转型。
作为改革后的新题型,学界对日常阅读的研究目前处于起步阶段,当前,教师和学生普遍面临备考方向模糊的困境。
本研究以托福改革后发布的16篇共40道日常阅读题目为样本,使用Bloom分类法、CEFR分层教学法为分析框架,结合5个教师完成TPO模拟考试的案例进行探索性分析,从题型特征、设计原理、文本难度、能力导向等维度展开研究,揭示日常性题目背后隐藏的能力要求,最终形成能力画像、教学对策、研发建议的研究闭环。
2. 研究背景
2.1. 题型介绍
Read in Daily Life主要考察学生对短篇非学术文本的阅读理解能力,其文本类型通常涵盖日常生活中的各类功能性文本,例如海报、通知、菜单、邮件、短信、社交媒体帖子等,文本长度被控制在15~150词之间。该题型在题目设置上兼具实用性和多样性,每篇文本匹配2或3道单选题。从能力维度上看,该题型着重考察学生对非线性文本格式信息的解码能力,包括理解非正式语言的语境含义、基于文本特征进行合理推断、筛选关键信息等综合技能,体现对真实语言运用场景的深度模拟。
2.2. 出题思路分析
2.2.1. 文本字数和视觉特点
根据认知负荷理论,只有在工作记忆中需要同时处理的信息量被控制在其认知资源可承载的范围内时,由信息超载引发的认知负荷才能被有效降低[1]。同时,该题型不仅在文本类型、字体,甚至在页面上都力求还原日常生活中看到的信息,尽可能保留原始格式特征,这有利于引导学生将认知资源投入到一种真实的文本交互情境中,从而避免无效认知负担,能够更好评估考生的实际阅读能力。这一思路与Weir对情境化任务的核心观点一致,他强调测试任务的设计必须与目标语言使用领域的真实情境高度一致,例如语境真实性、认知过程匹配、任务特征多样化[2]。这种现实世界导向的文本呈现方式对考生的多模态识读能力提出了要求。
2.2.2. 文本类型分布
在文本类型上,本次选取的例题中有一半的文本类型为邮件,覆盖了职场、教育、生活等场景,这体现了邮件在日常沟通中的多样性和实用性。此外,通知也是较为常见的一种文本类型,主要包括社区公告、活动变更等场景,这种文本强调信息传递的规范性。其余文本还包括社交媒体发帖、短信链和广告,这些文本类型出现频率较低,同时侧重于出现难度较高的题目如目的总结、信息推断等。
2.2.3. 出题思路分类统计
托福提供的16篇共40道样题[3],从教学分类角度,题目设计呈现以下特征分布:
○ 单向传播(通知、广告等):50%
○ 双向互动(短信、社交媒体等):50%
Figure 1. Communicative functions in the “Read in Daily Life” official specimen paper
图1. Read in Daily Life官方样题中交际方向图表
○ 生活服务(Daily Life Services):31.25%
○ 工作职场(Workplace):18.75%
○ 学习/教育(Study/Education):18.75%
○文化/娱乐(Culture/Leisure):31.25%
Figure 2. Taxonomy of contextual scenarios in the “Read in Daily Life” official specimen paper
图2. Read in Daily Life官方样题中场景分类维度图表
○ 细节题:52.5%
○ 推断题:27.5%
○ 目的题:20%
Figure 3. Distribution of item types in the “Read in Daily Life” official specimen paper
图3. Read in Daily Life官方样题题型分类图表
2.3. 难度系数分析
作为一种考察阅读能力等级的题型,Read in Daily Life呈现出CEFR等级中以B1难度为主导的特征,与此同时还设置了一定数量的A2、B2难度题型来进行过渡和区分不同水平的群体。在该部分,本文以Bloom分类法为基础,结合CEFR等级分类方式,区分出题目考察的不同认知层级。Bloom分类法将认知领域的教育目标从低到高分为六个层次:记忆、理解、应用、分析、评价、创造[3]。CEFR等级从低到高共有A1、A2、B1、B2、C1、C2共六个等级,这与Bloom分类法中对认知能力的具体分类有很大程度的相似性。由于Read in Daily Life是一种非学术性的短篇阅读,更加考察学生的实用性文本阅读能力,因此该题型几乎不会涉及关于评价和创造的题目(C1、C2难度),这种难度的题目更多地在长文本、多段落逻辑、信息需要批判性解读的内容中出现,而在官方提供的样题中,Read in Daily Life极少涉及这些内容。这种题型难度主要分布在A2、B1、B2的等级并主要集中在B1等级上,占据50% (图4)。
Figure 4. Proportional distribution of CEFR levels in the “Read in Daily Life” official specimen paper
图4. Read in Daily Life官方样题中CEFR等级占比图表
CEFR中A1、A2等级涉及Bloom分类法中的记忆和理解,信息处理以接收为主,要求学生能理解日常简单表达(基础词句、常见场景)。在阅读中,学生需要提取、识别、解释文本中明确的事实或者简单的逻辑。该认知技能层级的题目典型特征为:短文本(便签、简单广告)、语言简单(高频词、短句)。
B1、B2等级涉及应用和分析,需要学生能够分解信息或者理解信息之间的关系。在做题过程中,学生需要能理解较为复杂的日常表达(隐含逻辑、观点陈述)等。该认知技能层级题目的典型特征为:中等长度文本(通知、长广告)、语言较为复杂(复合句、隐含条件)、信息需要整合。B1等级和B2等级的主要区别在于,B1等级能力要求仍以信息接收与基础处理为核心,主要处理一些复合句。B2等级则以信息整合与加工为核心,解决问题需要使用到文本中的隐含逻辑关系与抽象概念,涉及Bloom分类法中的中高阶认知。
2.4. 认知步骤与难度分析
此外,基于认知步骤的数量或解答问题所需要的认知操作,试题的难度也能被区分。Halford等人提出的关系复杂性理论(RC-Theory)表明,任务的难度并不由信息本身的数量或个体的处理速度有关,而是由必须处理的信息之间关系的数量和复杂性决定的[4]。在Read in Daily Life题型中,题目的难度可依据解题所需认知步骤的数量及认知操作的复杂性进行分级。如表1所示,简单题目对应单步直接提取的认知操作,仅需要通过定位关键词并完成选项匹配即可解题。中等难度则要求学生在定位关键信息的基础上,增加一步较为简单的推理过程,体现了学生对信息关联性初步加工的能力。难题则呈现出综合处理的特征,不仅需要整合多源信息,还需要进行逻辑推断,需要学生具备对复杂信息关系的解构能力。总之,这种难度分类方式呼应了关系复杂性理论的核心观点,让不同难度的题目形成清晰的梯度序列。
Table 1. Correspondence of cognitive process characteristics with difficulty level, cognitive operations, and average response time in “Read in Daily Life”
表1. Read in Daily Life中思维步骤特征与难度、认知操作、平均解题时间对应表
难度等级 |
思维步骤特征 |
典型认知操作 |
平均解题时间 |
简单 |
单步直接提取 |
定位信息–匹配选项 |
≤45秒 |
中等 |
两步信息处理 |
定位信息–简单推理 |
45~75秒 |
难题 |
三步及以上综合处理 |
多源信息整合–逻辑推断–排除干扰 |
≥75秒 |
2.5. 和其他考试的区别
与托福学术阅读测试相比,Read in Daily Life作为一个全新题型在文本类型、长度和考查焦点上存在显著差异。学术阅读以200词左右的说明性学术短文为主,涵盖历史、科学等多学科领域,考查体系化的学术信息处理、文本结构解析和高阶推理判断能力。而Read in Daily Life则专注于15~150词的非学术性短文本,模拟真实日常生活场景,更强调对碎片化、非线性信息的快速解码、非正式语言的理解以及社会语用能力。
与TOEFL Essential考试相比,两者虽同属短文本范畴,但Read in Daily Life的认知要求更高,文本类型更多样(如邮件链、社交媒体对话),更侧重于在真实语境中应用语言进行推断和整合信息的能力(B1~B2级别),而非仅停留在基础信息提取(A2~B1级别)。
3. 研究方法
为探究Read in Daily Life题型对不同语言基础考生的差异化影响,本研究深度分析了5份完整的TPO模考数据。
3.1. 案例收集与处理
模考数据来源于新东方在线多名资深国际教育教师以不同CEFR等级学生为基准,模拟不同题目的不同正确率,包括第一个模块(Module 1)的总体正确率、各题型正确率、模块自适应跳转结果、第二个模块(Module 2)的表现并得出最终得分。
3.2. 案例描述
具体数据汇总如表2所示,表格中CW为题型Complete the Words缩写,RDL为Read in Daily Life缩写,AP为Academic Passage缩写。
Table 2. A Comparative analysis of five TPO mock test cases: Overall accuracy, “Read in Daily Life” accuracy, navigation paths, and performance outcomes
表2. 5个TPO模拟考试案例总正确率、Read in Daily Life正确率、跳转方向以及成绩结果
案例编号 |
Module 1
总正确率 |
Read in Daily Life 正确率(M1) |
跳转方向 |
Module 2
配置 |
Module 2
总正确率 |
Read in Daily Life 正确率(M2) |
最终
得分 |
Case 1 |
63.64% |
5/5 (100%) |
Lower Level |
CW(10) + RDL(5) |
100% |
5/5 (100%) |
4.0 |
Case 2 |
70.37% |
5/7 (71.43%)* |
Upper Level |
CW(10) + AP(5) |
100% |
N/A |
5.0 |
Case 3 |
70.00% |
4/5 (80%) |
Upper Level |
CW(10) + AP(5) |
60% |
N/A |
4.0 |
Case 4 |
65.00% |
3/5 (60%) |
Lower Level |
CW(10) + RDL(5) |
53.33% |
3/5 (60%) |
3.0 |
Case 5 |
40.00% |
2/5 (40%) |
Lower Level |
CW(10) + RDL(5) |
86.67% |
4/5 (80%) |
3.5 |
*注:Case 2在Module 1中遇到不计分的随机加试,故RDL题量为7道,但其正确率仍具参考价值*。
3.3. 信度与效度
本研究精心选取的五个案例覆盖了低(Case 5)、中(Case 1, 4)、高(Case 2, 3)三种典型水平,尽量涵盖不同程度考生面对该题型的各种可能反应类型。因此,本研究得出的结论(如该题型的功能定位、对不同水平考生的差异化影响)能够理论上推广至具有相似特征的其他考生群体中,为理解新题型的作用机制提供了一个可靠的分析框架。
所有分析均基于客观的模考数据(正确率、跳转结果、得分),最大限度地减少了研究者的主观偏见对数据本身的干扰,并且原始数据以表格形式完整呈现,分析过程详尽披露,保证了研究的透明度。
4. 研究讨论
结论一:ETS官方将Read in Daily Life视作为难度远低于另外两种题型的基础题目
数据分析表明,考试系统在设计上将Read in Daily Life明确归类为基础性能力测试题型。所有进入Upper Level测试模块的案例(如Case 2与Case 3),其Module 2部分均未再出现此题型,而是被认知要求更高的Academic Passage所替代。相反,所有进入Lower Level模块的考生(如Case 1、4、5),均需在Module 2中再次完成一组该题型。而Complete the Words则同时出现在两个水平等级,明显这一模块分配机制从测试设计层面证实,Read in Daily Life所要求的认知处理深度低于学术阅读段落,其核心测试功能在于对中等及以下水平考生的基础阅读能力进行鉴别与成绩分级。
结论二:Read in Daily Life的正确率对中等水平考生相对有更大的影响
对于处于分数区间中段的考生(目标分数约4.0),本题型表现具有关键性影响。如Case 1所示,尽管该考生Module 1总体正确率(63.64%)仅处于中等水平,但其在Read in Daily Life部分取得满分。这一优势很可能成为避免其被系统归类至Lower Level的关键判别因素,有效发挥了防止总分大幅下滑的功能。反之,如Case 4所示,该考生在此题型上持续而稳定地平庸表现(正确率60%),实质上构成了其得分上限,阻碍其向更高分数段突破,最终总分被限定于3.0。这一现象凸显了该题型对中等水平考生最终成绩的界定性作用。
结论三:增强Read in Daily Life的正确率对基础薄弱考生的提分性价比更高
对于低水平考生(B1及以下),Read in Daily Life题型显示出更高的性价比。结合Case 1与Case 3进行分析,在Case 1中尽管考生在Module 1中的正确率表现不佳被跳转到lower level,但如果能够同时保证Module 1和Module 2中Read in Daily Life的高正确率,仍然能够与被跳转到upper level的Case 3考生最终得分一致。相对而言,目前可以得出TPO模考并没有为Read in Daily Life与Academic Passage两篇难度相差极大的文章中的题目赋予不同的分数权重,提高Read in Daily Life正确率的难度与需要付出的时间都更少,而低水平的考生更容易达到。
5. 教学方法建议
5.1. 针对CEFR A1~A2级别学习者的教学建议
该群体学习者处于语言发展的基础阶段,其核心困难在于词汇提取效率低、文本结构意识弱和信息定位能力不足。教学干预应集中于语言基元的夯实与基础阅读微技能的自动化培养。
词汇教学应优先覆盖高频场景化词汇域。例如,基于官方样题toefl-ibt-full-length-practice-test-1:Municipal Charter通知,应重点讲授与金融服务(如enroll,account,statement)和日常生活管理(如technician,request,present)密切相关的实义词。教学方法应强调词汇的复现与情境嵌合,可采用词义匹配、语境填空等练习形式,促进词汇的深度加工与快速提取。
这类学生的文本识别意识培养也至关重要。教师应引导学习者识别不同文体(如通知、邮件、短信)的程式化特征与信息组织模式。以toefl-ibt-teachers-resources-practice-test-1会议改期通知为例,应显性讲解此类文本中用于宣布变更的句法结构(如“…has been rescheduled. It will now take place…”),帮助学习者建立文体图式,降低认知负荷,提高信息定位效率。
5.2. 针对CEFR B1级别学习者的教学建议
此级别学习者具备一定的语言基础,但理解的准确性与推断的合理性尚不稳定。教学重点应从单纯的信息识别转向对文本功能、作者意图及隐含信息的推理能力训练。
需强化这类学生的功能语言学分析。以toefl-ibt-full-length-practice-test-1健身房开业邀请函为例,教学应引导学习者辨析语言的不同交际功能,如“We’re excited to invite you…”体现邀请功能,“This is a great opportunity…”体现劝说功能,而“Bring your friends and family!”则具鼓励行动功能。通过分析此类语言线索,学习者可更准确地把握文本主旨与细节目的。
同时可以提升学习者对自身阅读理解过程的监控与调节能力。具体可指导其建立错题归因机制,将错误分类为词汇误解、细节疏忽、推理过度或语境误判等类型,并据此进行针对性补救练习。
5.3. 针对CEFR B2级别学习者的教学建议
该级别学习者的语言能力已接近熟练,教学核心在于追求处理的自动化与答案的精确性,并完成从基础阅读到学术阅读的战略重心转移。
教师可以致力于语言精度与语用意识的进一步提升。即使面对看似简单的文本,也需引导学习者关注其语言运用的精细之处。例如,在分析toefl-ibt-full-length-practice-test-2中维修热水系统,应讲解“the heating system will be offline”是“not functioning”的正式语体表达,并分析“remote work arrangements may be considered”中情态动词“may”所传达的可能性而非建议的语义细微差别(Nuance),从而培养其对正式书面语体的敏感度。
心理建设与战略定位是此阶段的关键。教师需明确向学习者阐释该题型在自适应考试系统中的基础性定位,强调其必得分属性。可借助Case 3的典型案例,警示学生注重Read in Daily Life的重要性。在此基础上,也可以在保证正确率的基础上加快做题速度,以此为其他阅读题型争取更多时间。
5.4. 针对CEFR C1及以上级别学习者的教学建议
对于此类高水平学习者,其在此题型上已无显著语言障碍。教学干预遵循最小化原则,侧重于状态维持与策略性提醒,确保其在此部分的优势不因心理或注意力因素而流失。
教学实施可以主要依赖于嵌入式模考与精细化反馈。将该题型纳入完整的模拟考试流程中,仅在后续复盘时关注其完成效率与准确率。若出现非典型性错误,则进行一对一诊断,其原因通常是注意力短暂分散或对某一生僻表达(如toefl-ibt-teachers-resources-practice-test-2服务器维护中的“semi-monthly”)的瞬时误判以及对一些电报式语言(Telegraphic Language)或缩略语(如RSVP)的瞬时误判。核心教学目标是帮助其将此类题型的处理过程固化为一种近乎本能的、低认知消耗的自动化技能,从而将全部战略性认知资源投入学术阅读部分,冲击顶尖分数。
6. 反思与不足
尽管本研究对Read in Daily Life题型进行了系统分析并提出了详细的教学与发展建议,但仍存在若干局限性。首先,本研究基于官方发布的有限样题(16篇文本,40道题目)以及5套TPO模拟题进行分析,虽然能反映题型特征,但题目样本量相对较小,且案例数量(N = 5)也相对较少,结论的普遍性仍需更大样本量的研究进一步验证。其次,数据来源于TPO模考而非官方正式考试。尽管TPO是高度仿真的权威模考工具,但其考试心理环境和信效度与正式考试可能存在细微差异。可能无法涵盖所有可能的文本变体和题目类型。未来研究可通过扩大语料库规模进一步验证本研究结论的普适性。此外,本研究提出的教学建议虽然体系完整,但对教师的专业素养和教学资源提出了较高要求。例如,CEFR分层教学和KLSS框架的有效实施需要教师准确诊断学生水平并准备大量差异化材料,这在实际教学环境中可能面临挑战。未来研究可开发更具体的教师培训资源和标准化工具,降低实施门槛。最后,随着数字技术的发展,如何将人工智能、自适应学习平台等技术手段融入Read in Daily Life的教学与测评中以实现更精准的个性化学习,是本研究尚未探讨但未来值得关注的重要方向。
这些局限性也为后续研究指明了方向:需要通过严格的实证研究验证教学效果,开发更具体的教师培训方案,加强技术融合研究,并扩大研究样本的多样性,以进一步完善学术阅读教学体系。
致 谢
衷心感谢新东方国际教育为本研究提供的坚实教研平台与资源支持。特别感谢王雪老师与黄伟娴老师所给予的极具洞察力的学术指导与专业建议,他们的真知灼见为本研究奠定了重要的理论基础。同时,感谢新东方在线的国际教育教师们在研究案例征集与分析过程中所提供的鼎力协助。谨向所有为本研究提供支持与帮助的人士,致以最诚挚的谢意。