1. 引言
在日常生活中,人们能够快速识别文字,进行准确阅读,纵使其字体字形常常有很多变化(Lin et al., 2019)。对于这一功能,人们进行了大量研究,包括行为、神经电生理、神经影像等手段,为探寻其内部机制,目前不少的研究关注于电生理的相关变化上,受物体尤其是人脸加工的影响和启发,通常认为相关变化依赖于物体结构特性。例如,在人脸研究中常用整体加工和部分加工(Tanaka & Farah, 1993; Tanaka, Heptonstall, & Campbell, 2019)、特征加工等进行解释,其中Freiwald等人研究发现不同面孔成分在面孔识别中的重要调控作用(Freiwald, Tsao, & Livingstone, 2009),是近年来人脸认知加工的重要进展。汉字作为众多文字字符(如,英文、数字、汉字等)中,与人脸存在大量相似特性的文字,其具有均匀的形状(正方形)和规范的、直立的方向;由笔画、部件组成,类似于人脸的眼睛和鼻子;有些汉字有镜像对称的配置,跟人脸相似(McCleery et al., 2008)。以往汉字的研究虽也考虑其结构的影响,但大多侧重于对汉字分割刺激、畸形汉字刺激、象形汉字等,没有类似于Freiwald的结构调制方面的研究,因此进行相应的研究将是有益的尝试。
与人脸加工相似,汉字识别加工强调汉字处理是整体的或结构的。整体加工认为每个汉字字符都被视为一个完整的结构化模式,作为字符识别的基本处理单元(Mo, Yu, Seger, & Mo, 2015)。然而在汉字认知识别中不仅有对汉字的整体加工影响的研究,还有部分心理学家强调汉字特征分析对汉字识别的影响。汉字具有复杂的结构,即使是汉字组件或笔画的位置和几何空间结构发生微小变化,也会发生极大的改变(Luo, Chen, & Zhang, 2017)。因此,汉字字形识别过程中存在从部分到整体,自下而上的加工。部分加工强调笔画或部首是相对独立的,汉字字形识别过程中的基本单元是汉字的笔画,因为所有字符都是用笔画组成的(彭聃龄,王春茂,1997)。其中一项研究在控制了汉字字符的笔画数量和频率的情况下,通过命名任务和真假汉字判断任务,证实了笔画对于汉字字符识别至关重要。相对于笔画方面的研究,还有其他研究提出汉字识别是先识别部首,然后将笔画组合来识别汉字(Chen & Yeh, 2015);因此,汉字笔画的空间位置也影响汉字字符的识别(Ding, Peng, & Taft, 2004; Taft, Zhu, & Peng, 1999)。2005年Chen和Yeh的一项研究发现部首分析对于汉字识别的正字法处理是必不可少的(Chen & Yeh, 2015)。还有很多研究者强调汉字加工过程中整体加工和部分加工的关系,认为两种加工方式在识别过程中相辅相成。综上,目前关于汉字识别加工研究的探究主要集中在汉字笔画数的多少、部件的频次或者汉字的分割,假使对汉字笔画的空间布局进行调控,是否也会影响大脑对汉字的加工识别,其相应的神经活动是否受到影响呢?
关于文字认知加工在神经影像学方面的研究发现了文字加工的相关脑区,即视觉词形加工区(visual word form area, VWFA)。该脑区2000年由Dehaene和Cohen在正常受试者和两名胼胝体病变患者中使用功能磁共振成像(fMRI)和事件相关电位技术,发现阅读与左侧枕颞沟部位的激活有关(Cohen et al., 2000)。而事件相关脑电位(ERP)发现,该脑区与视觉对象呈现相关的两个脑电成分是P100和N170 (也称为P1和N1),由位于枕骨和枕颞电极探测得到,其峰值在约100 ms和170 ms处(Bentin, Mouchetant-Rostaing, Giard, Echallier, & Pernier, 1999; Boutsen, Humphreys, Praamstra, & Warbrick, 2006; Rossion, Joyce, Cottrell, & Tarr, 2003)。N170被认为是一个特定类别的成分,它在单词、面孔和其他物体之间的幅度和偏侧化方面存在一致差异(Rossion et al., 2003)。具体而言,与其他物体相比,人脸和单词的刺激更强;并且对于英文单词,它是左侧化的,对于人脸,它是右侧化的,但对于其他物体,它是双侧的(Maurer, Rossion, & McCandliss, 2008; Maurer, Zevin, & McCandliss, 2008; Rossion et al., 2003)。在几项研究中也发现P100显示出类别特异性,但研究人员将这种影响归因于类别特异性的低级物理特征,而不是高级分类特性(Brem et al., 2006; Itier & Taylor, 2002)。尽管有支持整体或部分加工处理的证据,但人们对汉字特征变化的认知加工作用还需进一步深入的研究。
因此,本研究通过采取类似于Doris脸孔特征调控的方式来调控汉字笔画的空间布局形成的特征变化,采用事件相关电位技术,观察左侧枕颞沟外侧视觉词形加工区域(VWFA)的P100和N170的波幅及潜伏期的变化情况,来进一步探究汉字的特征加工对汉字识别的影响。
2. 实验
2.1. 被试
在校大学生30名(其中男14名),年龄在19~26岁之间,平均年龄22.94。所有被试都身体健康、右利手、视力或校正视力正常以及无神经系统疾病,没有进行过类似实验训练的个体。实验采取匿名形式,通过口头方式向被试介绍脑电实验的基本原理,说明不会给被试造成任何身体损害,获得被试知情同意后,开始收集数据。实验结束后,被试获得一定的报酬。
2.2. 实验材料
汉字材料:实验汉字材料是从《现代汉语频率字字典》中选取30个宋体少笔画(笔画数2~6画)组成的独体字,使用Windows专用字符编辑程序进行汉字垂直空间结构局部上下偏移(A型汉字)、水平空间结构局部左右偏移(B型汉字)如图1,并提取各个汉字所对应的规范字体,分别提取图片,共154张图片,分辨率是316 × 385。

Figure 1. Experimental materials for Chinese characters
图1. 汉字实验材料
在实验中一共使用154张图片,其中152张为汉字材料和2张蝴蝶照片,其中蝴蝶图片充当填充材料以维持被试在实验中的注意力。
2.3. 实验设计
汉字为实验材料,采取自变量为3 (刺激类型:A型汉字、B型汉字、正常汉字) * 3 (偏移量:−5、0、5)被试内混合实验设计。
2.4. 实验流程
通过E-prime呈现刺激,本实验共有500个trial,每100个trial休息一次。采用被动观看任务,每个trial流程是先呈现“+”字注视点500毫秒,然后随机呈现一张文字图片300毫秒,空白间隔800毫秒;在实验中为保持被试对实验的注意填充材料采用按键反应,会随机呈现一张蝴蝶图片300毫秒,空白屏直至被试按“N”键,实验流程如图2。
2.5. 实验数据采集
实验中使用惠普台式电脑,采用E-prime3.0编辑程序,并且进行刺激呈现;脑电设备采用根据国际10~20系统扩展的64导电极帽,并使用NeuroscanERP脑电系统记录EEG信号。在左眼上方和下方各放置一个电极用来记录垂直眼电(Vertical Electro-oculography, VEOG),在左右太阳穴附近各放置一个电极记录水平眼电(Horizontal Electro-oculography, HEOG)。电极阻抗保持在5 KΩ以下。连续记录时,滤波带通为0.05~100 Hz,采样率为1000 Hz。以位于左眼上下的电极记录垂直眼电(VEOG),位于眼外侧1.5 cm处的左右电极记录水平眼电(HEOG)。记录中以左侧乳突M1为参考电极,FPz和Fz之间的电极作为接地电极,离线分析时全脑平均进行离线参考。
2.6. 数据分析方法
脑电数据分析使用Matlab软件中eeglab工具进行离线数据分析处理(Yu, Chen, Peng, & Gu, 2022)。简述如下:第一,重新改参考电极为平均参考;第二,高通滤波为0.5 Hz,低通滤波为30 Hz,凹陷滤波范围为49~51 Hz;第三,接着通过肉眼检查脑电数据是否存在坏通道和具有非定型伪迹活动的节段(如出汗),删除这些数据和无用电极,对坏导进行插值处理。然后,通过独立成分分析(Independent Component Analysis, ICA)矫正眨眼、肌电等伪迹,并去除掉不太可能是代表心理任务的成分。为了避免ICA模型的过度拟合,在ICA之前进行PCA。基于记录期间数据质量差如或硬件故障,我们从最终样本中总共排除了6份数据。
根据已有研究以及本实验的ERP波形特征(Qi & Luo, 2022),选取P100、N170两个成分的时间窗进行分析,选取80~140 ms用于P100成分,140~200 ms之间的时间窗口表征N170成分。我们使用在该时间间隔内测量的平均振幅和峰值振幅时的潜伏期来描述这两个分量,这两个值都是左右半球感兴趣区传感器的平均值。
采用SPSS25.0统计软件对ERP波形的测量指标进行重复测量方差分析,ERP数据进行简单效应分析。进行对不满足球形检验的统计效应采用Greenhouse-Geisser法矫正p值。
3. 脑电数据结果
本研究采用5 × 2混合设计的重复测量方差分析,刺激材料(上偏移、下偏移、正常、左偏移和右偏移)以及左右脑区(左边和右边)为被试内因素。因变量为时间相关电位波幅峰值和潜伏期,N170成分平均波幅图和地形图见图3、图4。

Figure 3. Average amplitude of N170 components
图3. N170成分的平均波幅图

Figure 4. Topographic map of N170 components
图4. N170成分的地形图
汉字特征调控的N170成分变化
根据以往研究及脑电数据结果,N170波幅选取P7、PO7、P8、PO8通道的平均波幅进行文字材料特征水平 × 脑区(左侧/右侧) × 电极点(P7/PO7、P8/PO8)三因素重复测量方差分析,结果表明,文字材料特征水平变化主效应显著,F(4,20) = 3.53,p < 0.05,
= 0.42,左偏移的振幅(−1.45 ± 0.35 μV)显著小于正常汉字的振幅(−2.02 ± 0.34 μV, p = 0.040)以及下偏移的振幅(−1.97 ± 0.34 μV, p = 0.007),右偏移的振幅(−1.56 ± 0.38 μV)小于下偏移的振幅(−1.97 ± 0.34 μV, p = 0.009),上偏移汉字与下偏倚汉字的振幅虽小于正常汉字的振幅但差异不显著;还发现左右脑区的主效应显著,F(1,23) = 6.72,p < 0.05,
= 0.23,左侧脑区的振幅(−1.16 ± 0.39 μV)显著小于右侧脑区的振幅(−2.25 ± 0.41 μV, p = 0.031)。电极点主效应及文字材料特征水平、左右脑区及电极点其他交互作用均不显著,p > 0.05。电极点的N170的平均波幅描述性统计结果见表1。

Table 1. The amplitude of N170 at four electrode points P7, PO7, P8, and PO8 (M ± SD, μV)
表1. P7、PO7、P8、PO8四个电极点上的N170的波幅(M ± SD, μV)
对P7、PO7、P8、PO8电极点进行潜伏期的文字材料 × 脑区(左侧/右侧) × 电极点(P7/PO7、P8/PO8)三因素重复测量方差分析,结果表明,文字材料特征水平变化主效应显著,F(4,20) = 5.66,p < 0.01,
= 0.53,左偏移的潜伏期(182.88 ± 2.30 ms)大于正常汉字的潜伏期(178.25 ± 1.87 ms, p = 0.026)以及显著大于下偏移的潜伏期(177.33 ± 1.97 ms, p = 0.005),上偏移汉字与下偏倚汉字的潜伏期与正常汉字的潜伏期差异不显著;左右脑区主效应显著,F(1,23) = 7.22,p < 0.05,
= 0.25,左侧脑区的潜伏期(182.14 ± 1.85 ms)大于右侧脑区的潜伏期(177.53 ± 2.11 ms, p = 0.024)。电极点主效应及文字材料特征水平、左右脑区及电极点其他交互作用均不显著,p > 0.05。电极点的N170的潜伏期描述性统计结果见表2。

Table 2. Latency of N170 at four electrode points P7, PO7, P8, and PO8 (M ± SD, ms)
表2. P7、PO7、P8、PO8四个电极点上的N170的潜伏期(M ± SD, ms)
4. 讨论
本研究通过比较精细和系统的调控汉字结构的变化,观察左侧枕颞沟外侧视觉词形加工区域(VWFA)的N170波幅及潜伏期的变化情况。使用ERP记录来检测对汉字刺激材料不同水平和脑区(左侧与右侧)的神经反应。ERP分析结果表明,在N170成分上,左偏移汉字的波幅明显低于正常汉字,而且上下偏移汉字的波幅与正常汉字的波幅相似;其次,左偏移汉字的潜伏期显著大于正常汉字以及上下偏移的潜伏期;发现左右偏移汉字的刺激小,潜伏期长,识别慢;上下偏移汉字的刺激比左右偏移汉字刺激较高,潜伏期短,识别相对较快,虽然与正常汉字相似但也比其刺激小、识别慢。
4.1. 汉字特征加工分析
从实验结果上看,N170成分受到汉字特征空间布局调控的影响,其中汉字特征调控的左右偏移的振幅低于正常汉字,且左右偏移汉字的潜伏期显著高于正常汉字;而对比左右偏移和上下偏移调控汉字的潜伏期和振幅发现,左右偏移汉字的潜伏期长、振幅小,即,汉字特征空间布局左右偏移调控对汉字识别加工的影响比上下偏移空间布局调控更大。这一结果表明汉字特征空间布局的调控确实对汉字认知加工产生影响,进一步证明汉字特征加工对汉字认知识别的影响。而在以往的研究中,研究者是通过对比正常汉字与伪汉字、控制汉字笔画数及部首位置(罗艳琳,王磊峰,李秀军,彭聃龄,2010)、对正常汉字进行结构的上下分割处理(Paterson, Chen, Bukach, & Wong, 2013)或采用特殊的文字材料(不熟悉的象形文字)通过象形文字相似程度不断变化(Zhang et al., 2011)进行探究,发现这些刺激引发的N170比正常汉字弱,影响汉字视觉识别认知。本实验发现左右偏倚汉字比正常汉字的潜伏期长、振幅小,而上下偏移汉字的振幅虽相对小于正常汉字,但差异不显著,即,左右偏倚调控的影响比上下偏移调控更大,进一步分析原因可能因为汉字字形结构具有几何学上的对称意义,即它的构形笔画或部件以某个线为轴相互折叠后或平移后可以左右或上下重叠(完全重叠或部分重叠),具有冗余信息或重复的视觉信息(陈传锋,2003)。本研究对实验材料进行的左右偏倚调控相对打破了结构对称这一结构意义。而且本研究的实验材料与前人研究不同,是采用独体字进行实验并对汉字特征空间布局进行调控——对汉字特征空间笔画进行左右、上下偏移,实验结果也证实了汉字特征空间布局的变化对汉字认知识别产生影响,这也与前人通过传统的汉字分割(Paterson et al., 2013)、畸形汉字(王权红,2013)、象形汉字(Fan et al., 2015; Zhang et al., 2011)等研究发现相似。本实验与很多语言学家所认为的汉字分独体字和合体字两类独体字的结构成分是笔画,合体字的结构成分是部件的发现类似(傅永和,1991),实验结果也再次验证了,笔画是识别汉字的一个基本单元,且笔画间的特征空间布局起到一定的调制作用。
4.2. 汉字识别脑区偏侧化分析
一些研究人员报道了汉字引发的类似人脸的N170反应,具有明显的右半球优势(Wang, Kuo, & Cheng, 2011),并被认为与整体处理有关。然而,汉字和其他文字(Kim, Yoon, & Park, 2004; Wong, Gauthier, Woroch, DeBuse, & Curran, 2005)并没有引起字母字符(Maurer, Brem, Bucher, & Brandeis, 2005; Rossion et al., 2003)中观察到的典型的N170左偏侧化。这与本实验研究所发现的相对于左侧脑区,右侧脑区N170的振幅更强潜伏期更短,更快的识别汉字刺激的结果类似。汉字的这种右侧化N170与字母文字的左侧化N170结果形成对比,这一结果也与Rossion等人通过执行定向决策任务实验所发现的字母文字偏左侧化N170不一致(Maurer et al., 2008; Mercure, Dick, Halit, Kaufman, & Johnson, 2008; Rossion et al., 2003)。然而在其他汉字的ERP研究中也发现了右侧化N170,比如,Hsiao等人利用源定位分析表明,汉字N1 (N170)的神经发生器存在于右半球的梭状回和颞下回。其他ERP研究发现了双侧N170反应(Hsu, Tsai, Lee, & Tzeng, 2009)。在检查汉字处理的影像学研究中,通常观察到腹侧枕颞区的双侧激活,而字母单词仅激活左腹侧枕–颞系统(Liu, Tian, Li, Gong, & Lee, 2009; Nelson, Liu, Fiez, & Perfetti, 2009; Tan, Laird, Li, & Fox, 2005)。右半球对汉字的更多参与通常归因于识别汉字所需的大量视觉处理。反观本实验通过对汉字(独体字)特征空间布局的调控结果发现N170右偏侧化可能也与汉字整体处理有关。
5. 结论
本文通过对汉字笔画空间布局的系统调控,考察左侧枕颞沟外侧视觉词形加工区域(VWFA)的N170成分波幅及潜伏期的变化情况。结果表明汉字笔画空间布局的调控确实对汉字认知加工产生影响,也再次证实汉字的特征加工在汉字早期视觉加工中起着重要作用;汉字识别脑区不同于字母字符引起N170左偏侧化,而是引起类似于面孔的右半球偏侧化,推测这与汉字识别的整体加工有关。本研究的不足:关于汉字早期视觉加工中整体加工的探究、整体–特征加工两者的关系以及对汉字特征空间布局调控后进行倒置反转是否有影响有待更深一步探究。