1. 引言
在与阅读有关的心理学研究领域中,一直以来都聚焦于一个关键问题:词汇特征如何影响大脑对词语的信息加工方式。先前研究表明,人们在阅读文章时对单词的各种属性和特征(如词长、词频)非常敏感,已有研究证明这些变量会对读者注视位置和注视的持续时间产生显著影响[1]。同时,词汇的语义特征在单词识别过程中也能够对词素含义到更高层次语义表征的整合过程起到促进作用。MORRIS [2]指出,一个词形复杂的词,如果其意义可以直接由词干和词缀组合而成,那么它在语义上就是透明的。
语义透明度是国内外心理语言学研究常用的概念之一。王春茂与彭聃龄[3]提出,语义透明度反映的是由组成复合词的各词素成分推知复合词语义的程度。具备较高透明度的词,其含义可轻易从单个成分的语义推知,有效解释日常生活中“看词知意”的现象,从而促进词汇理解。与之相反,不透明词的成分对整词含义贡献甚微,甚至产生误导,如“东西”难以从“东”和“西”推知整体含义。Sandra [4]进一步提出,一个成分被用来定义其所属复合词的频率越高,其语义透明度越高。例如:茶匙是用来喝茶的勺子。高语义透明度的词汇,由于构成成分的单个词义有助于整词词义的激活,其成分意义的存在对整体词义没有贡献。纵观语义透明度领域的研究历史,国外对于该领域的研究早在20世纪90年代开始,而我国对于语义透明度的研究在2014年以来才显著增长。
一直以来,语言研究领域一直存在着支撑众多复杂文字成分处理理论的一个基本假设:过多分解路径的使用会造成额外的加工处理成本,因此通过直接访问而获取词义的整体路径显然更节省加工时间和认知成本。尽管语义透明度在心理语言学中扮演重要角色,大多数研究仍聚焦于词频等词汇特征,对语义透明度的认识仍较为有限。因此,本文提出“语义透明度作为加工路径的调节阀”这一核心论点:语义透明度动态调节词素分解与整词提取两条加工路径之间的竞争与协作关系。该观点有助于整合看似矛盾的研究发现,例如,为何某些研究支持普遍分解,而另一些研究则支持整体优先[4]。对于语义透明度对词汇语义加工的作用一直是值得探讨的话题。此前有很多研究者从不同地区语言出发对该词汇特征进行大量探讨与研究,但至今对于词汇透明度的作用仍未形成统一观点。本文将从行为实验、眼动追踪及神经语言学三个层面系统梳理相关证据,并结合汉语研究特色,探讨语义透明度在跨语言与跨群体中的加工机制。
此外,语义透明度的研究不仅限于复合词,也涉及派生词等其他复杂词类[5],其基本逻辑一致:透明度越高,词素参与整词建构的作用越显著。汉语作为无空格、高复合能产性的语言,其形声字结构与词素位置不对称性(如“首词素”与“尾词素”的透明度贡献不同)为检验基于拼音文字的理论提供了独特视角。
2. 与阅读相关的存储模型
关于词汇通达,存在三种主要理论模型:分解存储模型、整合存储模型与混合存储模型。分解存储模型主张词汇以独立词素形式存储,通过组合生成整词,节省存储资源[6] [7]。整合存储模型则认为词汇以整词形式存储,整体映射至语义表征,虽加重认知负荷,但加工效率高[8]。混合模型则兼顾词素与整词表征,更具灵活性与解释力[9]。语义透明度作为关键变量,决定了在特定词汇加工中“整词路径”与“分解路径”的权重:高透明词可能同时激活两种路径并相互促进,而不透明词则更依赖整词路径,词素激活受到抑制。
Gao (2022) [10]采用掩蔽启动任务关注了汉语复合词整词与成分词素在词汇识别与处理过程当中的启动效应。反应时的数据显示出汉语母语者对于整词形式目标词的识别要显著快于语素和符号启动的条件,因此相对于可分解的词素而言,整词更可能作为一种更具有优势的存储、检索和加工的单元。他在众多L1研究的基础上,将研究领域推广到了汉语L2者并细分了中级和高级的L2者对于自由语素和黏着语素处理的差异。他认为这种差异主要受到学习者的语言水平以及词汇加工过程中的处理速度的影响。高级学习者由于对于二语熟练度更高,他们所积累相应的语言知识也更加丰富同时不同词汇层次的节点之间的联系强度更加紧密,因此无需通过分解的方式花费额外的成本来对于目标词进行访问而是直接从心理词典中检索相应的整词,这从某种程度而言都与汉语L1者的加工策略具有一致性。同时该研究对于不同熟练度L2者的数据分析也能够从发展的眼光和角度来看待L2词汇习得的进程,研究结果或许能够说明汉语L2者的词汇表征发展所依赖的线索发生了变化,随着对于二语熟练度的提高,学习者从对词素与整词的混合模式的依赖逐渐转变到了依赖整词路径。
一直存在争议的一个问题是:不透明复合词的成分在处理过程中究竟是未被激活还是受到抑制。对于假设成分的语义表征在不透明复合词处理过程当中未被激活的理论而言,需要对处理系统是如何提前判定该成分为不透明成分进行解释,从而能够在时间上防止其语义激活。尽管前人采用了不同的形态处理机制建构了多种模型,但这些模型的结果具有一致性:无论语义透明程度如何,复合词成分的形态意义都可以迅速地自动激活。但随着透明度的降低,整词含义对于词素含义的抑制会增强。
Tsang (2014) [11]认为先前研究的实验设计存在一定的缺陷导致整词对词素含义的抑制可能会失效,因此他在两个掩蔽启动实验讨论了不透明词加工处理过程中早期形态语义激活的路径。他的结果部分与先前将词干作为目标词的发现一致,即不透明启动词促进了透明目标的识别,但透明启动词对不透明目标词的处理没有造成任何影响。他将这种影响的不对称性解释为快速的形态–语义激活是由表面语素形式的分解所导致的:不透明启动词所激活的形态含义与透明目标词意义相关,因此促进作用显著增强。但透明启动词的形态含义与不透明目标词意义却无关,更可能激活其他包含相同词素、链接更为紧密的透明词,这些透明词与不透明目标词相互竞争从而抵消由于词素共享而产生的促进作用。这也能够解释形态–正字法条件下,形态启动对不透明目标词无效。
Libben (1998) [12]探究了语义透明度在形态加工特别是复合词加工中的作用,并认为语义透明度这一概念对于解释复合词如何在头脑中表征和处理是至关重要的。他将复合词的处理过程描述为了一个刺激属性、词汇属性到概念属性的三级加工模型。该模型为心理语言学的发展提供了一个概念框架,并利用了这一框架来解释与复合词处理相关的失语症缺陷,从而得出结论:该种失语症患者的潜在缺陷是由于在表征的概念水平上,刺激间的相互竞争而导致的抑制失败。
Libben在2003年[13]进一步探讨了语义透明度在英语复合词表征与处理中的重要作用,并对复合词单个成分的透明程度进行了详细分析,为今后的复合词透明度研究提供了重要见解。他通过两个实验说明了无论语义透明程度如何,复合词都显示出了形态上的一致性。他的研究发现了复合词的第二成分(中心词)的语义透明度在整词的判断潜伏期、分解模式以及刺激重复效应中发挥了非常重要的作用。
Sandra采用语义启动范式变体——词汇决策实验,从荷兰语出发验证了复合词识别过程中形态分解的假设。结果表明语义启动仅促进了高语义透明度复合词的加工和识别,而在不透明复合词的任务中则未出现促进作用。从而进一步推断了高透明度词受到分解效应的影响,而低透明度词则倾向于整体加工,从一定程度上反驳了自动词法分解概念[4]。在其研究基础之上,Zwitserlood [14]在该方向上针对隐晦词进行了进一步研究,将低透明度复合词细化为完全不透明复合词与部分透明复合词。他通过语义启动词素含义得出结论:与语义完全透明条件与部分透明条件结果不同,完全不透明复合词的词素含义完全无法启动整词含义。因此他得出结论:透明复合词与部分透明复合词存在着与完全不透明复合词不同的加工方式,即:前二者或许经过分解加工,而后者存在整体加工。同时与听觉领域曾经的发现类似的是,Zwitserlood认为视觉进行词汇访问的过程中会有激活多个词汇,而已达到激活阈限的词会为了识别而相互竞争。在众多词汇竞争的过程中,我们对启动词的识别会抑制嵌入词以及与其相关词汇的激活。例如,若启动词为boycott,则在词汇加工的初始阶段词素含义boy也会得到激活,但随后整词意义迅速抑制词素含义。因此不仅boy的含义会受到抑制,与其相关的词汇girl也无法得到促进。这说明复合词整体意义通常是超越部分含义而存在的[14]。但Libben等人[13]基于英语复合词的研究发现透明度不同水平上都存在语义启动效应,这与Sandra之前语素不透明复合词难以通过词汇预分解激活的观点相矛盾。该结果表明了不同透明度水平的词汇都采用了分解处理。乍一看,词汇透明度对于词汇处理不产生影响,但实际上,语义透明度在复合词加工当中起着至关重要的作用。一个复合词的语义透明度不仅与单独语素的透明度有关,还和语素是否处于头部或非头部有关,因此该研究将我们的视角引向了单词素透明度水平上。Libben后续采用语义启动范式研究了语义透明度在词素加工以及复合词加工中的作用,并提出了一个模型草图。在该模型中,复合词加工描述为刺激特性、词汇特性和概念特性。研究发现了启动强度的等级取决于不透明词的部位和单个复合词刺激的成分程度。但当实验材料或程序支持分解或整合加工时,这种优势消失了。然而,彭聃龄等人揭示了存储方式会随着语义透明度程度的不同而发生变化,具体体现在对于单字的认知加工方式上:高语义透明度常采用整体的方式进行加工,而较低的语义透明度则倾向于采用分解的方式进行加工[3]。
过去几十年,对于复杂词汇的加工引起了许多研究人员的强烈兴趣,他们的研究结果以及文献存在着一些有趣的悖论。一些研究人员认为词汇的形态学解析耗时更多,而直接整体访问能够减少含义计算所消耗的认知负荷。因此相较于分解路径而言,直接访问形式所代表的整体路径更受欢迎。然而,尽管分解路径所需成本更多,但仍有许多研究发现表明,在复杂词汇加工过程中形态分解被更多的采用了。吴海燕等对通过HSK三级测试的泰国学生进行实验,结果表明语义透明度对泰国学生学习汉语词汇产生了一定的影响,但对初级水平的学习者影响不大,对中级学习者的影响较为明显:中级学习者在识别不透明词时错误率偏高(这是由词素分解意识泛化引起的)。
3. 行为实验证据:启动范式与反应时指标
行为实验通过启动范式、词汇判断任务等,揭示了语义透明度对加工路径的调节作用。例如,Sandra (1990) [4]采用语义启动范式发现,只有高透明词才出现启动效应,支持不透明词倾向于整体加工。而Libben (2003) [13]则发现不同透明度词均出现语义启动,支持普遍分解假设。这一矛盾可能源于实验设计(如SOA设置、材料透明度分级)与语言特性差异。Tsang (2014) [11]通过掩蔽启动实验,设置SOA为60 ms,发现不透明启动词能促进透明目标词,反之则不能,体现了词素与整词竞争中的不对称性,进一步支持“调节阀”观点。Ji (2011)等人[15]采用词汇决策实验检验复杂结构对英语复合词加工速度产生的影响。研究表明:无论语义透明度如何,复合词的处理速度都快于单形词。之所以能够呈现这种结果,是因为复合词的复杂结构会引发形态分解,从而导致复合词成分的词汇及语义表征的可用性,并试图进行语义整合。这种语义整合有益于透明复合词的处理过程,但却损害不透明复合词的处理。这种损害是由于不透明复合词的计算含义与检索含义发生冲突所导致的。
然而,到目前为止的研究结果并未很好的将形态表征和语义表征相分离。因此我们应该更加充分的利用不同层次的语义透明度、采用不同的实验技术来梳理不同层次加工阶段的表征。那么,透明度究竟是在形态上的启动还是语义上的启动呢?Bentin (1990) [16]通过操纵词汇判断的滞后时间,采用重复启动范式探究形态学和语义相关性对于不同类型滞后时间的贡献程度。结果表明两种不同时间进程的激活来源:短滞后的结果得益于重复和语义启动的相互作用;而在长滞后时间内,形态启动独立于启动词与目标词的语义重叠。而Zwitserlood (1994) [14]的实验表明,对于荷兰复合词而言,若被试在词汇判断任务前看到作为复合词成分的启动词,则对于随后单字词的词汇决策反应时会显著减少。
4. 眼动追踪证据:实时加工的空间与时间动态
作为人类的一种认知加工过程,阅读中大脑的信息加工机制一直吸引众多研究人员深入探索。近些年来,随着认知神经科学研究方法引入心理学领域以及交叉学科的快速发展,采用眼动技术来推断内部认知过程逐渐开始热门起来。语言处理模型发展使得采用眼动这种测量方式记录阅读背后认知过程的在线加工处理成为了可能。眼动技术为在线加工过程提供了时空动态窗口。
E-Z Reader模型强调序列加工与注意分配,该模型提出假设:在我们将注意力分配到该词的视觉特征之时,对于该单词的词汇处理就开始了。研究人员假设在该模型中,由两个阶段构成了词汇处理的整个过程——早期阶段和晚期阶段。E-Z Reader模型为后来的许多研究提供了一个概念框架,探讨了在阅读过程中我们的认知会如何指导眼球运动。
而SWIFT模型支持平行加工与词汇竞争,该模型认为知觉广度之内的所有词能够同时被加工,但由于不同的词汇其特征也不同,因此加工速度仍存在一定差异。并且词汇间存在竞争关系,只有获胜者才能够成为眼跳活动的下一目标。
虽然E-Z Reader模型与SWIFT模型的提出都有其合理性,但以上两种模型的结论都基于拼音文字所提出。而Li等人所建立的中文阅读模型(CRM:汉语阅读中词汇加工与眼动控制整合模型)则针对无空格特点提出“模板匹配 + 竞争切分”机制[17]。该模型针对中文阅读无词间空格这个现象回答了两个问题:1) 由于无词间空格进行词切分,读者在当前阶段如何识别词汇?2) 词间空格通常作为选择下一眼动目标的线索,因此在不具备该线索的情况下我们如何对眼动目标进行选择?为了回答问题1,Li假设模型中存在两个相互独立、实时通信的系统:词汇加工系统和眼动控制系统。此外对于问题2,该模型在交互式激活模型(IAM)的基础上提出三个假设:① 词汇加工与切分是统一的过程:平行激活加工、激活相关词汇、相互竞争。一旦竞争成功并识别就会成功切分。② 汉语词汇识别是一个模板匹配的过程 ③ 关于眼球何时移动,当前词汇的加工作为一种外部影响存在,而自主控制成分是一种内部因素。关于眼球移动到何处,Li将基于加工的策略嵌入到该模型中,他认为我们首先在当前注视点估算预期能够加工的汉字数量,然后再将眼球移动到这些汉字之后进行下一阶段的加工[17]。
Pollatsek [11]发现语素长度与频率影响眼跳目标选择,而Juhasz (2007) [18]操纵透明度和词频,发现注视时间在透明词上更短,说明透明度影响词汇整合阶段。这些眼动指标(如首次注视时间、凝视时间、回视次数)共同表明,语义透明度通过调节词素激活强度,影响眼动控制的“何时”与“何地”。
以上三种模型都有力证明了眼动技术在阅读领域中作为一种重要的研究方向而存在,因此采用眼动技术研究词汇特征影响认知加工过程具有深远意义。
5. 神经语言学证据:ERP与fMRI研究
近年来,神经语言学为语义透明度加工提供了脑机制证据。Morris等人(2007) [2]采用ERP技术发现,透明词在N400成分上表现出更大的词素启动效应,说明语义整合更为顺畅;而不透明词则诱发更负的N400,反映语义冲突。fMRI研究进一步显示,透明词加工更强激活左额下回(与形态分解相关),而不透明词则激活颞中回(与整词检索相关)。这些结果支持语义透明度在早期词形分解与晚期语义整合中均起调节作用,为“调节阀”观点提供了神经基础。
6. 词汇特征对复合词的影响
大量研究的结论可以得出,词汇特征会影响读者阅读过程中的眼动模式。Pollatsek研究了词素加工在阅读中的作用,操纵了复合词成分语素的长度和频率。结果表明语素或许能够控制阅读时的眼球运动、调节单词内部的眼动行为,但对词汇访问产生的影响微乎其微[11]。JUHASZ操纵了复合词的词频和透明度并分析注视时间,揭示了无论词汇透明程度如何都会发生分解[18]。Gilbert [19]采用多个行为实验证明了词汇访问最初是基于整个复合词而展开的,若访问失败则复合词被分解从而单独对各成分词素进行处理。彭聃龄、王春茂通过变化中文复合词的词素累计频率来考察表面频率与透明度对加工速度会有何影响,结果表明词与词素单元在同一层次中表征,并且在下一层次激活[3]。但对于词与词素之间的连接方向而言,透明词呈正性连接而在不透明的条件下结果与之相反。
7. 语义透明度评定方法的演进与研究深化
语义透明度的操作性定义随研究深入不断精细化。早期多采用主观评定,如Sandra (1990) [4]要求被试写出复合词定义,以“成分用于定义整词的频率”作为透明度指标。后续研究引入成分透明度细分,如Zwitserlood (1994) [14]采用5点量表评定复合词与中心词的关联程度,排除中等透明度词以强化实验对比。Libben (2003) [13]进一步将整词透明度与词素透明度分离,要求被试分别评估整词可预测性与词素含义保留程度。近年来,研究者开始利用语料库与计算模型(如潜在语义分析)构建更客观的透明度指标,推动研究向标准化、量化方向发展。
8. 结论
本综述系统回顾了关于词汇特征,特别是语义透明度,如何影响词汇加工的心理语言学研究。通过对大量文献的梳理与整合,我们可以得出以下几个核心结论,并明确未来研究的潜在方向。
首先,语义透明度是塑造词汇加工路径的关键变量,但其作用机制复杂,并非简单的“透明即分解,不透明即整体”。综述表明,无论是拼音文字还是中文,大量的实证研究[13]支持了普遍的、即时的形态分解假设,即读者在遇到复合词时,会自动化地激活其成分词素的表征。然而,语义透明度的核心作用在于调节这些被激活的词素表征与整词表征之间的互动与竞争。对于高透明度词,词素含义与整词含义一致,形成促进性激活,加速了词汇识别[3]。而对于不透明度词,被激活的词素含义与整词含义发生冲突,从而引发抑制过程或导致加工成本的增加[12] [14]。这种抑制与竞争关系完美解释了启动效应中的不对称现象[11],即不透明启动词能促进透明目标词,反之则不能。
其次,眼动技术作为在线加工过程的窗口,为揭示词汇加工的时空动态提供了无可替代的证据。E-Z Reader、SWIFT和中文特有的CRM模型虽然理论立场不同,但都共同强调了词汇特征(如词频、词长、透明度)是驱动眼动控制(何时移动、移向何处)的核心认知信号。Pollatsek (1998) [1]等人关于语素长度和频率影响眼动模式的研究,以及关于透明度与注视时间关系的研究,都将内部认知过程与外显的眼球运动直接联系起来,证实了词汇加工与眼动控制是阅读中密不可分的两部分。
第三,关于复合词在心理词典中的存储方式,混合模型提供了最具解释力的框架,而语义透明度是决定“整词路径”与“分解路径”权重的重要因素。纯粹的分解存储模型与整词存储模型都无法完全解释所有的实验发现。混合模型则成功地容纳了不同透明度的词汇:高透明度词可能同时拥有强健的整词表征和活跃的词素表征,二者协同作用;而不透明词则可能更依赖于整词表征,其词素表征虽被激活但会受到抑制。发展性研究[10]进一步支持了这一动态观点,表明二语学习者随着熟练度提高,其加工策略会从依赖分解的混合模式向更接近母语者的、高效的整词路径转变。
最后,本综述也揭示了当前研究存在的争议与未来的研究方向。第一,评定方法的精细化:语义透明度的评定从主观量表发展到区分整词透明度和成分透明度,未来研究需要继续探索更客观、量化的评定指标,并关注首词素与尾词素透明度可能产生的不同影响[13]。第二,理论模型的整合与验证,现有模型(如Libben的三级加工模型)需要更多的实证支持,特别是利用脑成像技术(如ERP、fMRI)来分离形态、语义加工的不同时间进程和脑区定位,以澄清“透明度效应”究竟发生在加工的哪个阶段。第三,跨语言与跨群体的比较,中文以其无空格、高复合词能产性的特点,为检验基于拼音文字的理论提供了独特视角。未来应加强跨语言比较,并拓展至不同年龄、不同语言水平的群体(如儿童、二语学习者),以构建更具普适性的词汇加工理论。第四,从实验室到应用:语义透明度对词汇习得(如吴海燕等对泰国学生的研究)具有明确的启示。未来的研究应更注重将基础研究发现应用于语言教学、词典编撰及阅读障碍的干预等领域。
综上所述,词汇特征,尤其是语义透明度,绝非一个孤立的属性,而是嵌入在词汇识别、形态分解、语义整合及眼动控制这一复杂认知网络中的核心节点。它像一个“调节阀”,动态地控制着词素与整词两条加工路径之间的信息流量与竞争关系。未来研究的挑战与机遇,在于采用多技术融合、多群体比较的范式,更精细地描绘出这个“调节阀”的工作机制,从而最终揭示人类如何从看似简单的文字符号中高效构建意义的奇妙过程。