1. 引言
人们的日常生活中,每天接受大量的视觉刺激并时刻对这些信息进行加工。加工处理这些刺激信息,对人类生存、适应环境和进行各种生命活动具有重要意义。在众多的视觉刺激中,人脸和字词是人们日常生活中最常见的视觉刺激之一,两者的内部具有高度的相似性。研究者们把人脸和字词刺激称为专家化刺激 (Bukach, Gauthier, & Tarr, 2006) 。尽管这些专家化刺激具有高度的相似性,个体的专家化知识足以化解高度相似性带来识别上的挑战。与其他非专家化刺激相比,人们由于长期识别这些专家化刺激,导致形成了对它们的自动反应偏向 (Gauthier, 2000) 。
事件相关电位(event-related potentials, ERPs)的研究发现,面孔比其他非面孔刺激引发峰值更大的N170,且表现为N170的头皮右侧化( Bentin, McCarhy, Perez, Puce, & Allison, 1996 ; Rossion & Jacques, 2008 )。字词能够比其他非字词刺激如字符串,引发峰值更大的N170,但表现为左侧化(Yun, Holcomb, & Grainger, 2011; Zhao, Li, Lin, Cao, He, & Weng, 2012 )。N170成分是指在个体的视觉认知过程中,刺激呈现150~200 ms (毫秒)后引发的一个早期负波。研究者们认为N170是视觉认知过程中一个相当重要的成分,尤其是对于针对人脸或者字词等专家化物体信息的认知加工。早期N170成分是反映这些加工的敏感性指标。目前,认知神经学家们在视觉认知中N170成分的敏感性、偏侧化等方面的研究已经取得了一定的进展。本文将围绕N170的理论和解释、偏侧化、研究范式、神经机制等方面对人脸和字词N170进行阐述,并尝试探讨N170的本质。
2. N170的发现
N170是由 Bentin 等人在1996年正式提出的。他们的研究通过ERPs技术发现,与其他刺激图片(如动物脸,汽车等)相比,人脸和脸部的某些器官(如眼睛)所诱发的N170更大,并且头皮右半球所诱发的N170显著强于左半球。但是最早关于N170的研究是在1989年,即Botzel和Grusser等人尝试寻找与人脸识别过程相应的ERP成分。他们发现,和其它刺激相比,人脸能够在刺激呈现后大约150 ms诱发一个更偏正的脑电成分,但是没有出现偏侧化。根据ERP的地形图,他们得出结论:人脸辨别的脑电波成分不是在枕叶的脸部选择区,而是在大脑的边缘系统。后续的研究把其称为顶正波(vertex positive potential, VPP) (Jeffreys, 1989) 。对于这两个截然相反的结论, Joyce和Rossion (2005) 等人做了进一步研究,重新选用了参考点(包括鼻子和乳突)。他们发现,N170和VPP能通过相同的神经细胞群所产生的相同偶极排列给予解释,因此它们两个反映的是相同信息加工过程。
3. N170成分的研究
3.1. 人脸识别N170成分的研究
面孔的相关研究早在20世纪开始。1986年,Bruce和Young提出面孔识别的结构编码模型。1996年,Bentin等人要求被试在观看人脸、人的五官、变形人脸、动物脸、手和物体(汽车、家具)这些刺激的同时,默数刺激呈现的次数。结果显示,人脸刺激呈现后172 ms在枕颞部诱发一个明显的负波,且呈现右半球偏侧化,人的五官和变形人脸也诱发了相同的负波,其它刺激均没有。Bentin等人将这一负波命名为N170,此后关于N170的研究涌现。 Le Grand (2003) 等人为了进一步证实面孔识别N170的右偏侧化,选取了视觉正常和视觉剥夺(单侧视觉剥夺和双侧视觉剥夺)的被试,要求被试判断相续呈现的面孔是否相同。结果证明右脑视觉剥夺的被试的面孔认知功能严重受损。研究者还发现,N170成分对人脸识别具有敏感性,与人脸特征的结构有关,但与熟悉度、年龄、性别等因素无关。
尽管有大量实验证据证明N170成分对面部识别加工具有敏感性,但N170成分能否反映面孔加工的特异性一直存在争论。面孔倒置效应(face inversion effect, FIE)为证明“N170对面孔识别具有特异性”这一观点提供了强有力的证据,如倒立的人脸诱发的N170出现峰值增大和潜伏期延长,而倒立的其它物体刺激则没有出现这些现象 (Rossion, Gauthier, & Tarr, 2000; Rebai, Poiroux, Bernard, & Lalonde, 2001) 。 Itier (2006) 等人采用方向判断任务,发现,人脸比汽车房屋等其它图片产生更大的N170,倒立人脸比正立人脸产生更大的N170,且倒立人脸N170的潜伏期要比正立人脸N170的潜伏期晚。然而有研究者认为,人脸的N170倒置效应的本质并非人脸的特异性所致,而是大脑对高度熟悉的物体刺激的普通反应。为此有研究者提出了视觉专家化理论(Visual Expertise Theory),强调人类是人脸识别的专家而非对人脸有特异加工机制。专家化理论的研究者们为了更好地研究专家化刺激的视觉加工,创造出一种名为“Greeble”的人造动物,其成员之间具有较大的家族相似性。 Diamond和Carey (1986) 行为实验采用这类非人脸刺激,发现倒置效应并不是人脸识别所特有的,对某种非人脸刺激(如狗、Greeble)具有专家能力的人在完成实验任务重也会出现倒置效应。 Tanaka和Curran (2001) 的脑电实验还发现,鸟类和狗类专家在识别其所特长的物体时诱发的N170峰值大于非特长物体的N170峰值,这说明N170峰值在视觉加工的早期阶段,个体对特长物体的加工和非特长物体的加工是不一样的,并进一步说明N170效应并不局限于人脸加工。由此可见,专家化理论似乎也可以用于解释人脸加工所表现出的所谓的特异性,但是还需要更多的证据支持。本文推测,人脸和客体刺激的N170取决于同类刺激的相似性。在专家化知识能把握的范围内,刺激的相似密度越高,个体为了化解这种识别上的困难,需要启用的专家化知识就越多,N170的峰值越大。例如,倒立人脸本身有许多相似的倒立人脸,同时和它的正立版本的相似脸也是相似的,因此倒立人脸比正立人脸的相似密度更高,从而加工倒立人脸时需要启用更多的专家化知识,大脑会诱发峰值更大的N170。但是这种推测有待于进一步研究的证实。
3.2. 字词识别N170成分的研究
值得注意的是,字词识别也出现类似人脸识别中N170增大的现象。字词识别的N170成分是第一个对字词材料敏感的脑电成分 (Dehaene, Le, Poline, Le Bihan, & Cohen, 2002) 。和人脸识别的研究相似,字词刺激诱发的N170峰值显著大于其他非字词刺激。有研究者提出应该把字词识别的N170命名为“N170 - P07”,以区别于面孔识别的N170,并且还认为N170反映的是一个亚词汇水平的加工过程 (Dien, 2009) 。关于字词识别的N170,目前有两种互相排斥的解释。其一,专家知觉解释认为,N170反映了早期知觉刺激类型分类阶段中,刺激的正字法信息侦测( Bentin et al., 1999 ; Wong et al., 2005 )。支持这一解释的实验有:含有不发音但出现的位置正常的部件的假字,其诱发的N170和真字一样比随机笔画组合的刺激诱发的N170大 (Lin, Chen, Zhao, Li, He & Weng, 2011) 。其二,语音对应解释认为,N170与正字法表征和语音表征之间的自动连接有关 (Maurer & McCandiss, 2005) 。支持这一解释的实验有:在按声旁一致性分为高一致性(如:谣)和低一致性(如:流)的汉字材料当中,低一致性的汉字比高一致性的汉字诱发更大的N170 (Lee, Tsai, Huang, Hung & Tzeng, 2006) 。不排除词汇前的正字法加工通过语音、语义影响或降低刺激相似度来调节N170,同时说明字词识别的N170可能比面部识别的N170要复杂。
很多研究证据表明,N170与词汇前的正字法加工相关。如, Bentin 等人在1999年首次对字词N170成分进行了研究,采用odd ball实验范式,选取正字法刺激(词字、假词和伪词)和非正字法刺激(符号、形状)为实验材料,结果发现刺激呈现后170 ms左右,两种类型的刺激均在头皮的枕颞区诱发了一个脑电负成分——N170。不同的是,与非正字法刺激相比,正字法刺激诱发了更大的N170,且两者差异在左半球更明显。而正字法刺激的三种不同类型刺激之间的N170峰值差异不显著。 Chauncey,Holcomb和Grainger (2008) 采用启动范式探究N170的成分,其实验结果出现了正字法启动效应,且字体和大小写的改变均对N170的没有影响。这些实验都证明了N170成分反映了正字法的加工过程。
除了拼音文字认知的研究外,汉字认知的N170研究为揭示N170的本质和字词加工过程提供了更多线索。汉字属于象形文字,在构词法、形音义关系和正字法水平上都和字母文字有很大的不同,所以其实验结果也会有差异。就汉字认知的研究结果来看,其偏侧化问题还没有一个较为统一的定论。如 Liu和Perfetti (2003) 发现,汉字能够诱发比英文更负的N170,且其激活区域为双侧的枕区。 Kim,Yoon和Park (2004) 等人采用汉字、韩语、英文和图形作为实验材料进行实验,结果发现汉字和图形诱发的N170均没有出现明显的左侧化。 Lu,Tang,Zhou和Yu (2011) 的实验选用高频汉字,结果发现真字的N170峰值显著强于假字,而且出现了左侧化。 Lin,Chen,Zhao,Li,He和Weng (2011) 后续进一步控制实验条件,选取中文真字、不能发音的假字和假部件为实验材料进行实验,同样出现了左侧化。而 舒德华和王权红(2013) 的结果显示,在低频汉字中,畸变字比清晰字诱发更大的N170,而且右侧头皮枕颞区大于左侧,说明在纯粹的汉字正字法加工研究中,正字法加工主要位于右半球。
前面提到 Lee,Tsai,Huang,Hung和Tzeng (2006) 的实验结果表明N170对声旁一致性敏感。这一实验证据支持“N170与正字法加工和形音转换的水平有关”的观点。最近, Zhou,Fong,Minett,Peng和Wang (2014) 采用启动范式,启动字是分别和靶字部件语音相关和靶字整字语音相关的汉字,要求被试判断启动字和靶字语义是否相关。结果发现,与部件语音相关的启动字能够诱发更大的N170,出现部件干扰效应,即当启动字和靶字的一个部件读音相似时,会诱发更高的N170。而与整字语音相关的启动字并没有引发整字干扰效应。这一结果恰恰反映了部件的语音激活作用,表明了部件语音表征和正字法表征的自动联结。部件相关启动首先会激活靶字部件的读音,当靶字呈现时,通过语音和正字法的自动连接,通过自上而下的影响有利于靶字部首的正字法激活。而整字干扰效应的隐蔽说明在在这一阶段的N170中,整字的正字法表征还没有被激活,恰恰证明了“N170与词汇前的正字法加工相关”这样观点。
4. N170的研究范式
目前对N170的研究范式或被试任务主要有:内隐范式、词汇判断任务、方向判断任务、目标判断任务、学习–再认实验范式、启动范式等。采用不同的研究范式有助于从不同的研究角度探讨、比较N170的成分,以期找出N170的本质。
Bentin,Hammer和Cahan (1991) 采用外显的阅读任务,选取真词、符合正字法规则的假词和非词为实验材料进行实验,发现这三种刺激的N170峰值差异不显著。 Bentin等(1999) 进一步研究,采用内隐的视觉任务,结果发现符合正字法的字词刺激在大脑左侧能够产生更负的N170,而在大脑右侧刚好相反。 Schendan,Ganis和Kutas (1998) 选取真词、假词和不能发音的辅音串进行实验,以期排除语音的影响,证实了N170对正字法的敏感性。 Spironelli和Angrilli (2007) 采用不同的实验任务类型进行实验,发现刺激的物理属性对N170成分无影响,而正字法任务对N170成分的影响显著。
除了正字法对N170有影响外,还有一些研究范式为说明N170可能受字词语义的影响提供了证据。如 Segalowitz和Zheng (2009) 采用词汇判断任务,要求对真词、假词和非词判断。他们一共进行了两个实验,实验一中的所有真词同属于一个范畴,实验二中的真词材料不属于同一个范畴。研究结果发现,实验一中的N170峰值显著大于实验二的N170峰值。进一步分析发现,实验一中的真词所诱发的N170显著大于实验二中的真词诱发的N170,而假词的N170峰值差异不显著,这表明字词加工在170 ms就有词汇通达。 McCarthy和Nobre (1993) 认为,注意的程度会影响N170成分。他们研究发现,受到注意的字词所诱发的N170强于不受注意的字词的N170。 Aranda,Madrid,Tudela和Ruz (2010) 选取性别判断任务,按照线索范式呈现目标刺激(字词、人脸)进行实验。结果发现,注意影响具体类别范式中的N170偏侧化。
启动范式是研究N170的一个重要的研究范式。研究发现,先后呈现两个刺激时,先呈现的刺激会对后呈现的刺激产生影响,从而使后呈现的刺激所诱发的神经激活下降,这种现象被称为启动效应。启动效应能够帮助研究者对不同类型刺激之间的认知加工关系进行研究。 Maurer,Rossion和McCandiliss (2008) 为了比较人脸和英文在N170启动效应上的差异,选取重复范式进行实验。实验要求被试在看到倒立的刺激时进行按键反应,实验材料为人脸和英文,以重复呈现和交替呈现两种方式呈现。数据显示,人脸刺激产生了启动效应而英文刺激没有。其原因可能是人脸拥有相同的一级构形信息(眼睛位于鼻子上方,鼻子位于嘴巴上方),因此先呈现的人脸会促进对后呈现的人脸的加工编码,从而导致其NI7O的激活下降 (Mercure, 2011) 。
5. N170的神经机制
刚出生不久的婴儿已经能够对面孔产生注意,面孔失认症的病人尽管可以描述面孔的特征,但是却没有办法识别面孔,尽管他们识别其他物体的能力可能相当完好。这些事实可能说明在人类的大脑中存在一个先天的面孔特异性神经基础。认知神经学家们做了大量的研究,探讨人脑加工人脸和字词等专家化刺激物体的神经机制。早期对脸盲症病人的研究发现,导致他们面孔加工功能受损或者丧失的原因是其颞枕区受损。利用功能核磁共振成像技术等对N170进行进一步研究,发现了在大脑的梭状回(fusiform gyrus)区域有专门负责面孔识别的面孔特异区域,即梭状回面孔区FFA (fusiform face area) (Kanwisher, 2000; Rajimehr, Young, & Tootell, 2009) 。研究者在研究汉字认知的N170时,也发现在大脑左侧梭状回存在VMFA (Visual Word Form Area)区域。与其他非字词刺激相比,字词刺激能够更大地激活大脑左侧梭状回和枕颞沟区域( Puce, Alison, Asgari, Gore, & McCarthy, 1996 ; Polk et al., 2002 ; Sergent, Ohta, MacDonald, & Zuck, 1994 )。然而这些实验证据并不能直接确定N170的源脑区。大脑左半球被认为是处理言语信息的中枢,而大脑右半球被认为处理空间几何的功能,这种大脑半球优势似乎可以为解释N170偏侧化现象提供证据支持。
6. 研究展望
研究者们对N170进行了大量的研究,取得了一定的进展。但是这仅仅是N170研究的一个起步。目前对N170 的研究,人们主要集中探知面孔和字词的N170成分,证明大脑对面孔识别和字词识别都有特异性,并且对面孔和字词认知的N170成分敏感性研究有了比较一致的结论。很多研究结果表明,人脸比非人脸诱发更负的N170,字词刺激也比非字词刺激诱发更负的N170。然而关于N170 的研究还有很多值得研究者探索的地方。首先,N170的神经机制目前尚无法确定。目前的很多实验特别是脑成像实验发现存在面孔识别的梭状回面孔区(FFA)和视觉文字加工的脑左梭状回区(VMFA),但没有更多的直接证据表明N170的源脑区,文本推测N170并不存在唯一的源脑区,还需要更多的专家化刺激实验去发现和证实。其次,字词N170的偏侧化问题。以往的研究结果显示,字母语言研究中的N170成分比较一致出现了左侧化的结果,但是汉字N170的研究结果发现这种偏侧化是不一致的,有研究发现是双侧化,有的研究则发现是右侧化或者没有出现偏侧化。那么为什么会出现不一样的结果,不同偏侧化是否代表了汉字N170成分的不同功能?这些问题仍需要进一步探讨。其三,目前对N170的本质问题仍没有很清晰的认识。人脸N170成分是否反映面孔加工的特异性?字词N170是否反映了正字法加工过程和形音转换的水平?两者的N170成分是否有相似之处?是否可以用刺激的相似密度去解释N170效应?本文推测,在个体的专家化知识范围内,靶刺激与同类型刺激的相似度越高,需要激活已储存的专家化知识就越多,从而诱发的N170峰值越大,产生自上而下的影响促进靶刺激的激活。解决这些问题可能需要从更深层次的角度去探知N170成分。同时,若期望能够深入的探讨视觉认知的脑神经基础,可能需要依赖更多样化的研究手段和更巧妙的设计方案,从多角度探索视觉认知加工的N170成分。
在今后的研究中,可能有以下几个改进的方面:首先,从多角度去探索视觉认知的N170成分。现有的关于N170的研究多数关注的是人脸和字词认知,并且已经有大量的实验证据证明了大脑对其二者的敏感性。研究者们可以尝试对不同的专家化刺激进行实验,探索N170成分的本质。第二,可以尝试在不同刺激类型之间进行跨类别的研究。一个刺激对另一个刺激加工的影响可能反映出两者之间可能存在某种联系和相似之处。研究者可以尝试关注面孔和字词N170成分之间的关系。这对于理解N170成分有重要意义。第三,汉字的N170研究有待进一步探索。目前,关于汉字N170的偏侧化问题还没有一个相对一致的定论。汉字的正字法效应能够对字词认知的N170成分研究提供更多的证据。除此之外,还需要多考虑实验任务对结果的影响。不同的实验范式对N170的成分会有不同程度的影响。现在关于N170的研究还在初步阶段,探索研究需要研究者们设计更巧妙的实验和付出更多的努力。