阅读理解的三因素剖析:词频、语境预测性与词素位置概率
Deconstructing Reading Comprehension: Examining the Interplay of Word Frequency, Contextual Predictability, and Morpheme Position Probability
摘要: 阅读的核心目的在于理解文本信息,即实现阅读理解,这一能力在儿童的学习与发展中至关重要。本研究旨在系统探讨影响阅读理解的三个关键因素:阅读频率、语境预测性,以及词素位置概率。文章将重点分析与比较上述因素在阅读理解中的作用机制、异同点及其相互间的关联性。
Abstract: The primary goal of reading is to comprehend textual information, known as reading comprehension, an ability crucial to children’s learning and development. This study aims to systematically investigate three key factors influencing reading comprehension: reading frequency, contextual predictability, and morpheme position probability. The article will focus on analyzing and comparing the mechanisms, similarities and differences, as well as the interrelationships among these factors in reading comprehension.
文章引用:欧泽鹏, 杨美荣 (2025). 阅读理解的三因素剖析:词频、语境预测性与词素位置概率. 心理学进展, 15(12), 369-375. https://doi.org/10.12677/ap.2025.1512664

1. 引言

文本阅读是一种复杂的行为,涉及多个过程。阅读过程中的单词识别在以前的研究中从不同的角度受到了很多关注。从认知的角度来看,研究人员主要感兴趣的是单词特定的语言属性如何影响单字识别(Hudson & Bergman, 1985; O’Regan & Jacobs, 1992)。从发展的角度来看,研究人员已经确定了几种与单词阅读相关的特定技能,如音系意识、快速自动命名(RAN)和形态意识(Landerl et al., 2019; McBride-Chang et al., 2005)。然而,单字识别任务和心理测量测试可能无法提供日常生活中自然阅读过程中经历的认知过程的有效反映,其中文本是连续书写的。为此,眼动追踪技术提供了一个强大的工具来揭示连续阅读过程中的认知过程。

在这一领域,当前研究的很大一部分致力于研究语言属性如何影响眼球运动,在此基础上开发了相关的计算模型。然而,单词识别不仅取决于单词属性,还取决于个体读者对这些属性的学习程度(Perfetti, 1985, 2007)。因此,阅读技能的个体差异可能会影响阅读过程中的眼球运动也就不足为奇了。

除此之外,汉字的正字法规则(Yan & Pan, 2023)。也影响阅读理解。汉字是汉语书写系统的基本单位。每个汉字无论其视觉复杂程度如何,都占据着相同的方格。不同正书法的阅读和动眼活动有着相类似的模式。在阅读语素文字和拼音文字的句子和段落时,眼睛相对静止地注视一个单词,大约150~300毫秒的(即一种固定)用于信息处理,然后移动到另一个单词。尽管在正字法、音系学、语义学和形态学之间的关系上与拼音文字有根本的不同,但语言因素也会影响汉语句子阅读中的词汇通达。例如,字符视觉复杂度和频率分别影响注视位置和注视时间。在阅读障碍儿童和正常儿童的比较中,词频影响注视时间,词长影响FL。对汉语句子阅读过程中眼动的语料库分析也表明,与其他语言一样,单词的属性,如单词长度、频率、视觉复杂性和可预测性,是注视位置和注视时间的主要预测因素。

现有研究一致表明,高预测性词语在认知加工过程中表现出显著优势。从神经机制层面看,在汉语拼音学习任务中,低预测性词语会诱发更大幅度的N400成分,反映出语义整合难度较高(Dambacher et al., 2006; Kretzschmar et al., 2015);而在行为表现层面,高预测性词语不仅整体注视时间更短,首次注视时间、凝视时间等早期指标也明显偏低,同时其跳读率显著更高,说明读者在预视阶段即可借助语境线索完成部分词汇识别(Ashby et al., 2005; Rayner et al., 2001)。这一规律在汉语文本阅读中同样得到多维度验证:无论是基于眼动轨迹的视觉加工指标,还是基于反应时的行为测量,均显示出预测性对词汇通达速度的稳定促进作用(Rayner et al., 2006)。值得注意的是,这种预测性效应不仅体现在词汇识别层面,还会进一步影响后续句法分析和语义整合的深度与效率。综合认知神经与行为研究的证据可知,语境预测性作为一种跨语言普遍存在的认知加工机制,通过调节注意资源分配、加速词汇表征激活、优化信息整合路径等多重作用,系统性地影响不同层级的语言加工过程。有人还提出,人们在对汉语的学习过程中,在词语的不同位置对整个词语的影响不同,比如说同一个汉字在词语的首部位置和在尾部位置对词语的影响不一致,与此同时词汇频率的不同也会影响读者的阅读方式,因此词汇的频率对汉字在词首还是词尾的不同位置需要我们进行进一步探讨(曹海波等,2023)。

根据主流词汇识别模型(如McClelland & Rumelhart (1981)的交互激活模型、Davis (2001)的自组织模型及Taft (2004)的多层激活模型),词频是影响词汇通达路径的关键因素,能够系统调节不同读者对词语的加工方式。Li与Pollatsek的中文阅读整合模型进一步指出,词频不仅直接作用于词汇理解过程,还能够有效预测眼跳控制模式。

本文基于刘志方等(2017)关于语境预测性影响词汇加工的眼动研究,以及曹海波等(2023)对词素位置概率作用的实证分析,系统探讨词频、词素位置与语境预测性三者在中文阅读中的互动关系。词频作为核心调节变量,其高低水平会显著影响词素位置信息与语境预测性的作用强度。下文将分别从词频对语境预测性的调节作用,以及词频对词首/词尾词素位置效应的差异化影响两方面展开论述。

2. 语境预期对字词加工的影响

在汉语阅读过程中人们通过对语境信息的预期对词语进行理解,在理解高预期性的词语的时间明显少于低预期性的词语(Clifton et al., 2016; Dambacher et al., 2006; Rayner, 1998, 2009)。人们在汉语拼音的学习中,语境的可预期性会大大促进人们对于词语的理解(Schotter, Angele, & Rayner, 2012; Schotter, et al., 2015; White et al., 2005)。较高水平的单词频率(Hyönä & Pollatsek, 1998; Rayner, 2009)和可预测性(Lavigne, 2000)引导读者进一步凝视单词,导致FL更接近单词中心。这些因素也在儿童阅读字母语言时的眼球运动中发挥作用(Hyönä & Olson, 1995)。关于语言因素对动眼活动影响的大部分工作都是使用语料库分析方法进行的。与实验正交操作相比,语料库分析同时估计大量潜在相关的预测因子。在这种情况下,必须使用线性混合模型等统计模型在统计上控制其他预测因子的可能影响以及读者和项目水平上的个体差异(Kliegl et al, 2006)。

2.1. 语境预期分别与词汇频率、字词频率相互影响词汇加工理解的差异

在连续书面文本的阅读过程中,读者需要将目光投向文本的不同位置,以获取有用的信息。眼动追踪技术已被证明是研究阅读过程中瞬间认知过程的敏感工具。很多心理语言学研究关注的是所谓的三大语言因素,其中词汇的频率是重要的影响因素之一,(Hudson & Bergman, 1985; Monsell et al., 1989; Sereno & Rayner, 2000, 2003),语境的可预期性与词汇频率的交互作用表明语境的可预期性将直接影响对词语的理解与应用。在英语的阅读理解过程中表明,语境的预期性明细影响跳读的效率,并且高预期性花费的时候明显少于低预期性(Balota et al., 1985; Schustack et al., 1987),并且词语频率是否影响跳读对于不同读者来说是不一致的,只有在眼睛关注到目标词语时,人们跳读高频率词语的时间才会明细少于跳读低频率词语的时间,由此可知,语境的可预期性对人们阅读跳读的影响比词语频率的影响更大(Rayner & Duffy, 1986; Rayner & Well, 1996; Rayner, 1998, 2009)。跳读行为受到词汇局部信息加工的引导(Engbert et al., 2005)。语境预测性作为高效的预视线索,能显著提升跳读率;词频则因难以在预视阶段被有效提取,对跳读决策影响微弱。这一现象揭示了不同语言变量在加工时序上的层级性:语境预测性在早期认知加工中快速生效,而词频的影响相对滞后。这种时序上的分离,为理解阅读中认知资源的优化分配和词汇通达的模块化加工机制提供了关键证据。

2.2. 语境预期性分别与首字字频、尾字字频相互影响词语加工的差异

在语境预测性与字频的交互作用上,词首与词尾字频呈现不同模式。研究发现,词尾字频与语境预测性存在显著交互,共同影响多项眼动指标;而词首字频则未表现出此类交互效应。这种差异可能源于二者在词汇加工中的不同角色。

现有研究表明,语境信息在汉语词切分中起着关键作用。考虑到词切分过程启动较早,其时间进程可能与语境预测性及词尾字频效应存在重叠。基于此,我们推测语境加工、词尾字加工及其交互作用,可能共同构成了汉语词切分的认知机制。这一理论假设有待后续研究进一步验证。

3. 词素位置概率在汉语阅读中的作用

本研究采用词汇判断与眼动追踪技术,考察了词素位置概率对中文词汇识别与切分过程的影响。四项实验结果表明,词素位置概率对阅读行为具有引导作用,且其效应受整词频率调节:低频双字词的识别更依赖于词素位置概率信息。值得注意的是,词首词素位置概率的作用强于词尾,眼动数据进一步显示该效应贯穿词汇加工的早期与晚期阶段。无论在孤立词汇识别还是句子语境中,词素位置概率均表现出稳定的影响。下文将分别探讨该因素在中文词汇识别与切分中的具体作用机制及其影响因素。

3.1. 词素位置概率在汉语词汇识别与切分中的作用机制

本研究证实,词素位置概率对词语识别与词切分具有促进作用。具体表现为位置概率越高,注视时间越短,该规律已通过线性回归验证,并与研究一致。

依据Li与Pollatsek (2011)的汉语阅读整合模型,位于知觉广度内的单字会被并行激活,进而激活其组成的词汇。在注视目标词语时,其构成汉字及对应位置信息同步激活,而词素位置激活强度与其使用频率直接相关:词素在特定位置出现频率越高,激活水平越强。随着阅读经验积累,读者逐渐形成对词素常见位置的认知预期,从而强化词素与位置间的关联。当词素实际位置与预期一致时,词汇切分更为顺畅;若不一致,则需重新分析位置信息并调配更多认知资源,导致注视时间延长。

从交互激活的视角看,汉语词汇识别是不同层级认知单元协同作用的结果。首字加工不仅激活其自身特征,其高位置概率属性还会快速激发一批候选整词;这些被激活的整词表征随即反馈至字层级,动态增强对词首位置的识别。词素位置频率在此扮演了“加速器”角色,频率越高,整个交互激活进程越快,最终表现为词汇识别效率的提升。

研究表明,词首词素位置概率对词汇识别具有独立且关键的作用,其效应不受词尾词素位置干扰。该发现获得多项实证支持:Taft (2004)指出双词素词加工中首词素是主要搜索单元;Perea和Lupker (2003)的字母换位研究显示词首位置变动引发的认知损耗最大;Ma与Li (2015)进一步证实字复杂性仅对词首加工产生显著影响。这些证据共同凸显了词首在词汇加工中的核心地位。从认知机制看,Davis (2001)的自我组织模型揭示首字母激活水平最高,随后逐级递减。汉语研究同样支持该趋势:迩嘉和隋雪(2018)发现首字信息破坏会显著延长注视时间;结合Inhoff和Wu (2005)的单向切分假设,中文阅读遵循从左向右的注意梯度,左侧汉字优先获得认知资源。当高频使用的词首词素与其常见位置匹配时,会通过前馈–反馈机制加速整词激活,从而有效提升词汇识别效率。

3.2. 词频对词素位置概率发挥词语切分作用的影响

本研究证实词素位置概率的作用受词频调节:表现为对低频词影响显著,而对高频词影响微弱。其机制在于,高频词采用整体表征,而低频词依赖分解加工,因而更需借助词素位置线索。已有研究显示,低频词加工需消耗更多心理资源,认知负荷较高(Rayner, 2009),此时词素特征更易凸显,词素位置信息可为词边界划分提供线索。相比之下,高频词因熟悉度高、加工难度低,往往在词素水平信息充分激活前已完成整词识别,从而削弱了对词素位置特征的依赖,降低了位置冲突可能带来的干扰。

Chu与Leung (2005)进一步指出,高频词以自上而下的整体加工为主,局部特征易被忽略;低频词则更多依赖自下而上的分析,使词素位置等局部信息得以凸显。词频在复合词表征中具有重要作用。例如,理解“海象”“海马”时我们直接提取其整体意义,而不会将其分解为“海中的象”或“海中的马”,说明高频词存在对应的整体表征单元。

本研究显示,在加工如“海兔”这类低频词时,由于心理词典中缺乏完整的整词表征,读者会更多地依赖词素成分完成词汇识别与语义通达。根据复合词混合表征理论,汉语词汇加工是一个动态过程,同时涉及词素单元与整词表征之间的交互激活:词素层级的加工为整词识别提供基础成分,而整词层级的激活又会反馈调节词素单元的加工强度。

具体而言,低频词由于使用频次较低,在大脑词典网络中难以形成稳定的整词表征,因此更多以分解的词素形式存储。这种表征特性使得低频词的识别过程更容易受到词素特征(如位置概率、语义透明度等)的促进——当词素出现在其常见位置时,词汇切分与识别的效率显著提升。相反,高频词因整词表征稳固且激活阈值较低,通常能够直接被整体提取,这种“整词优先”的加工策略降低了对词素位置等局部特征的依赖,导致词素位置概率信息的促进作用相对有限。

从认知发展的角度来看,词素位置概率在汉语动态词切分中扮演着重要角色,这种能力体现了读者基于长期阅读经验所形成的汉字位置统计学习机制。随着阅读经验的积累,读者逐渐内化了汉字在不同位置出现的概率分布,从而建立起优化的词汇切分策略。

未来研究可进一步围绕该能力的发展轨迹展开深入探索:通过横断研究或纵向追踪,比较学龄儿童、阅读障碍人群及老年群体在词素位置概率信息利用上的表现差异与发展模式,这将为理解汉语阅读能力的发展规律及阅读障碍的干预提供重要启示。同时,结合神经影像学技术考察不同群体在加工词素位置信息时的脑机制差异,也将为揭示汉语阅读的神经基础提供新的证据。

NOTES

*通讯作者。

参考文献

[1] 曹海波, 兰泽波, 高峰, 于海涛, 李鹏, 王敬欣(2023). 词素位置概率在中文阅读中的作用: 词汇判断和眼动研究. 心理学报, 55(2), 159-176.
[2] 刘志方, 张智君, 潘运, 仝文, 苏衡(2017). 中文阅读中预视阶段和注视阶段内词汇视觉编码的过程特点: 来自消失文本的证据. 心理学报, 49(7), 853-865.
[3] 徐迩嘉, 隋雪(2018). 身份信息与位置信息的加工进程及语境预测性的影响. 心理学报, 50(6), 606-621.
[4] Ashby, J., Rayner, K., & Clifton, C. (2005). Eye Movements of Highly Skilled and Average Readers: Differential Effects of Frequency and Predictability. The Quarterly Journal of Experimental Psychology Section A, 58, 1065-1086.[CrossRef] [PubMed]
[5] Balota, D. A., Pollatsek, A., & Rayner, K. (1985). The Interaction of Contextual Constraints and Parafoveal Visual Information in Reading. Cognitive Psychology, 17, 364-390.[CrossRef] [PubMed]
[6] Chu, M. M. K., & Leung, M. T. (2005). Reading Strategy of Hong Kong School-Aged Children: The Development of Word-Level and Character-Level Processing. Applied Psycholinguistics, 26, 505-520.
[7] Clifton, C., Ferreira, F., Henderson, J. M., Inhoff, A. W., Liversedge, S. P., Reichle, E. D. et al. (2016). Eye Movements in Reading and Information Processing: Keith Rayner’s 40 Year Legacy. Journal of Memory and Language, 86, 1-19.[CrossRef
[8] Dambacher, M., Kliegl, R., Hofmann, M., & Jacobs, A. M. (2006). Frequency and Predictability Effects on Event-Related Potentials during Reading. Brain Research, 1084, 89-103.[CrossRef] [PubMed]
[9] Davis, C. J. (2001). The Self-Organising Lexical Acquisition and Recognition (SOLAR) Model of Visual Word Recognition. Dissertation Abstracts International: Section B: The Sciences and Engineering, 62, Article 594.
[10] Engbert, R., Nuthmann, A., Richter, E. M., & Kliegl, R. (2005). Swift: A Dynamical Model of Saccade Generation during Reading. Psychological Review, 112, 777-813.[CrossRef] [PubMed]
[11] Hudson, P. T. W., & Bergman, M. W. (1985). Lexical Knowledge in Word Recognition: Word Length and Word Frequency in Naming and Lexical Decision Tasks. Journal of Memory and Language, 24, 46-58.[CrossRef
[12] Hyönä, J., & Olson, R. K. (1995). Eye Fixation Patterns among Dyslexic and Normal Readers: Effects of Word Length and Word Frequency. Journal of Experimental Psychology: Learning, Memory, and Cognition, 21, 1430-1440.[CrossRef
[13] Hyönä, J., & Pollatsek, A. (1998). Reading Finnish Compound Words: Eye Fixations Are Affected by Component Morphemes. Journal of Experimental Psychology: Human Perception and Performance, 24, 1612-1627.[CrossRef
[14] Inhoff, A. W., & Wu, W. (2005). Word Segmentation of Overlapping Ambiguous Strings during Chinese Reading. Journal of Experimental Psychology: Learning, Memory, and Cognition, 31, 1045-1057.
[15] Kliegl, R., Nuthmann, A., & Engbert, R. (2006). Tracking the Mind during Reading: The Influence of Past, Present, and Future Words on Fixation Durations. Journal of Experimental Psychology: General, 135, 12-35.[CrossRef] [PubMed]
[16] Kretzschmar, F., Schlesewsky, M., & Staub, A. (2015). Dissociating Word Frequency and Predictability Effects in Reading: Evidence from Coregistration of Eye Movements and EEG. Journal of Experimental Psychology: Learning, Memory, and Cognition, 41, 1648-1662.[CrossRef] [PubMed]
[17] Landerl, K., Freudenthaler, H. H., Heene, M., De Jong, P. F., Desrochers, A., Manolitsis, G. et al. (2019). Phonological Awareness and Rapid Automatized Naming as Longitudinal Predictors of Reading in Five Alphabetic Orthographies with Varying Degrees of Consistency. Scientific Studies of Reading, 23, 220-234.[CrossRef
[18] Lavigne, F., Vitu, F., & d’Ydewalle, G. (2000). The Influence of Semantic Context on Initial Eye Landing Sites in Words. Acta Psychologica, 104, 191-214.[CrossRef] [PubMed]
[19] Li, X., & Pollatsek, A. (2011). Word Knowledge Influences Character Perception. Psychonomic Bulletin & Review, 18, 833-839.[CrossRef] [PubMed]
[20] Ma, G., & Li, X. (2015). How Character Complexity Modulates Eye Movement Control in Chinese Reading. Reading and Writing, 28, 747-761.[CrossRef
[21] McBride-Chang, C., Cho, J., Liu, H., Wagner, R. K., Shu, H., Zhou, A. et al. (2005). Journal of Experimental Child Psychology, 92, 140-160.[CrossRef] [PubMed]
[22] McClelland, J. L., & Rumelhart, D. E. (1981). An Interactive Activation Model of Context Effects in Letter Perception: I. An Account of Basic Findings. Psychological Review, 88, 375-407.[CrossRef
[23] Monsell, S., Doyle, M. C., & Haggard, P. N. (1989). Effects of Frequency on Visual Word Recognition Tasks: Where Are They? Journal of Experimental Psychology: General, 118, 43-71.[CrossRef
[24] O’Regan, J. K., & Jacobs, A. M. (1992). Optimal Viewing Position Effect in Word Recognition: A Challenge to Current Theory. Journal of Experimental Psychology: Human Perception and Performance, 18, 185-197.[CrossRef
[25] Perea, M., & Lupker, S. J. (2003). Transposed-Letter Confusability Effects in Masked Form Priming. In S. Kinoshita & S. J. Lupker (Eds.), Masked Priming: The State of the Art (pp. 97-120). Psychology Press.
[26] Perfetti, C. A. (1985). Reading Ability. Oxford University Press.
[27] Perfetti, C. A. (2007). Reading Ability: Lexical Quality to Comprehension. Scientific Studies of Reading, 11, 357-383.[CrossRef
[28] Rayner, K. (1998). Eye Movements in Reading and Information Processing: 20 Years of Research. Psychological Bulletin, 124, 372-422.[CrossRef] [PubMed]
[29] Rayner, K. (2009). The 35th Sir Frederick Bartlett Lecture: Eye Movements and Attention in Reading, Scene Perception, and Visual Search. Quarterly Journal of Experimental Psychology, 62, 1457-1506.[CrossRef] [PubMed]
[30] Rayner, K., & Duffy, S. A. (1986). Lexical Complexity and Fixation Times in Reading: Effects of Word Frequency, Verb Complexity, and Lexical Ambiguity. Memory & Cognition, 14, 191-201.[CrossRef] [PubMed]
[31] Rayner, K., & Well, A. D. (1996). Effects of Contextual Constraint on Eye Movements in Reading: A Further Examination. Psychonomic Bulletin & Review, 3, 504-509.[CrossRef] [PubMed]
[32] Rayner, K., Binder, K. S., Ashby, J., & Pollatsek, A. (2001). Eye Movement Control in Reading: Word Predictability Has Little Influence on Initial Landing Positions in Words. Vision Research, 41, 943-954.[CrossRef] [PubMed]
[33] Rayner, K., Reichle, E. D., Stroud, M. J., Williams, C. C., & Pollatsek, A. (2006). The Effect of Word Frequency, Word Predictability, and Font Difficulty on the Eye Movements of Young and Older Readers. Psychology and Aging, 21, 448-465.[CrossRef] [PubMed]
[34] Schotter, E. R., Angele, B., & Rayner, K. (2012). Parafoveal Processing in Reading. Attention, Perception, & Psychophysics, 74, 5-35.[CrossRef] [PubMed]
[35] Schotter, E. R., Lee, M., Reiderman, M., & Rayner, K. (2015). The Effect of Contextual Constraint on Parafoveal Processing in Reading. Journal of Memory and Language, 83, 118-139.[CrossRef] [PubMed]
[36] Schustack, M. W., Ehrlich, S. F., & Rayner, K. (1987). Local and Global Sources of Contextual Facilitation in Reading. Journal of Memory and Language, 26, 322-340.[CrossRef
[37] Sereno, S. C., & Rayner, K. (2000). The When and Where of Reading in the Brain. Brain and Cognition, 42, 78-81.[CrossRef] [PubMed]
[38] Sereno, S. C., & Rayner, K. (2003). Measuring Word Recognition in Reading: Eye Movements and Event-Related Potentials. Trends in Cognitive Sciences, 7, 489-493.
[39] Taft, M. (2004). Morphological Decomposition and the Reverse Base Frequency Effect. The Quarterly Journal of Experimental Psychology Section A, 57, 745-765.[CrossRef] [PubMed]
[40] White, S. J., Rayner, K., & Liversedge, S. P. (2005). The Influence of Parafoveal Word Length and Contextual Constraint on Fixation Durations and Word Skipping in Reading. Psychonomic Bulletin & Review, 12, 466-471.[CrossRef] [PubMed]
[41] Yan, M., & Pan, J. E. (2023). Joint Effects of Individual Reading Skills and Word Properties on Chinese Children’s Eye Movements during Sentence Reading. Scientific Reports, 13, Article No. 14754.[CrossRef] [PubMed]