1. 问题提出
执行功能是一种非常重要的认知机能,它作为一个拥有着广阔应用前景的研究领域,在近年来的发展中取得了许多显著的研究成果。所谓执行功能(executive function,简称EF)是指那些被试个体对自己的思想、意识和行为进行有意识地监督和控制的各种操作过程,例如对自己情绪的调节、认知反应的灵活性、反应抑制、对将要进行的事情的规划、计划性等等,它的主要成分主要包括三个要素,即工作记忆、抑制性控制、以及认知转换 [1] (认知灵活性),在这其中,抑制性控制成分又被认为是执行功能系统的核心 [2]。
昼–夜Stroop范式是经典Stroop范式的一个变式,也是研究抑制性功能的一个常用手段,但值得注意的是,该研究范式虽然被广泛应用于学前儿童群体,作为测量该群体执行功能的一个重要指标,但对于大学生这个群体而言,使用昼–夜Stroop范式研究执行功能的相关实验研究却几乎没有。
长期以来国内外大多数研究者的研究是单个集中探讨执行功能的影响因素或是Stroop效应的产生机制,或将二者结合有限的应用于学前儿童群体的研究,而事实上,这二者结合应用于大学生群体可能会具有更高的实用价值。
本研究将编制E-Prime程序,调查湖北工程学院大学生在面对视觉语义冲突时,执行功能的受抑制情况,以及将实验得出的结果进行统计分析,做重复测量方差分析,并新引进一个刺激类型的自变量,进一步研究相同含义不同类型的刺激是否会对抑制控制能力产生影响。根据该实验推测执行功能受抑制的影响因素以及是否会造成学前儿童与大学生受抑制程度的不同。
最初始的昼–夜Stroop任务规则简单幼稚,故以往的昼–夜Stroop实验多以3.5岁至7岁的学前儿童为研究对象,且多将儿童的执行功能与心理理论的发展相联系,使用口头报告的方法获得儿童口头报告的反应时与正确率,但仅仅针对儿童的研究是不够的,执行功能在成年人的工作生活中也起着非常重要的作用,所以本研究在原始的昼–夜Stroop任务的基础上新增了一个自变量(刺激类型)以增加任务难度使该任务更加适合成年被试。同时,主试通过被试的言语报告所记录下来的数据可能并不精确,而按键法则是计算机进行数据的记录与处理,更加科学与客观。有利于对大学生在执行任务中执行功能各方面的变化反应进行更细致的观察研究。
与学前儿童不同,大学生群体有着更好的认知复杂性、抑制控制能力以及会运用更多的记忆技巧,记忆水平更高。同时,与学前儿童相比,大学生的执行功能与生活工作也有着更为紧密的联系,有研究表明,大学生群体中常见的拖延,自制力低下,时间管理混乱等现象与执行功能密切相关。通过昼–夜Stroop任务研究大学生执行功能的受抑制情况,以及将受抑制的程度与前人研究过的学前儿童组受抑制程度进行比较,有助于推测影响执行功能的因素以及发现导致学前儿童和大学生在受抑制方面产生差异(或无差异)的原因。
执行功能可以分为广义的执行功能与狭义的执行功能 [3]。
广义的执行功能是指个体的各种认知过程和加工过程的协同配合过程。Baddeley将执行功能定义为:在完成复杂的认知加工任务时,对各种认知过程进行协调,以保证认知系统以灵活,敏捷的方式实行当前某一特定目标的一般性控制机制。其本质就是对其它认知过程进行调节与控制,根本目的就是产生具有目的性,协调有序的行为 [4]。高级认知能力理论的观点认为,所谓执行功能,就是一种特殊的认知机制,或是一种更高级的能力 [5] [6]。但该理论仅仅罗列出了执行功能可能包含的一些成分,却没有进一步解释执行功能及其各种成分是如何获得的。也有研究者从神经心理学的角度来对执行功能加以定义。因“执行功能”这一概念源自对前额叶皮层损伤的研究,研究结果表明,前额叶皮层的损伤会导致一系列神经心理缺陷,如:事情规划、计划、概念的学习与形成、抽象思维、决策、按时间先后或其他标准对事件排序和对动作的监控等方面的障碍,而这些障碍所对应的一系列心理能力就是“执行功能”这一术语最初代表的含义 [7]。执行功能被Tarnel,Adesorn和Benotn等人概括为计划、决策、判断和自我觉知的能力 [8]。大多数这些能力都与前额皮质有关。从本质上讲,执行功能(EF)和前额皮质(PCF)这两个术语经常可以互换使用,但值得注意的是,它们并不完全相同。执行功能不仅仅取决于前额皮质,还取决于其他皮质区域,如边缘系统。一些前额叶皮质受损的患者可能没有功能障碍,而一些患有其他皮质病变的患者可能表现出执行功能障碍。虽然目前关于认知神经机制的研究热衷于大脑的模块化处理,但研究人员倾向于采用定位主义,但这种思维显然不适合执行功能等复杂功能。这种思路显然是不全面的,需要拓宽思路进一步研究。由Zelazo和Frye提出的认知复杂性及控制理论认为,“功能”本质上是一种行为主义概念,是根据其结果达成了什么样的目标来进行定义的,而就执行功能而言,其结果是经过深思熟虑以达成最终的问题解决 [9]。它以问题解决为中心,有机地结合问题解决各个不同的子功能阶段,揭示这些阶段如何作用于结果,然后进一步描述执行功能这样一个复杂功能的特征。该理论强调高级认知加工过程内在的复杂性与层次性,并引导我们进一步研究发生在各个子过程之间的相互作用,从而帮助我们将执行功能领域内的各种不同的研究结果整合起来。
而狭义的执行功能通常则特指抑制控制成分。抑制控制是指按要求压制不合适、不符合当前任务情境要求的反应的能力,该能力被认为是执行功能的核心成分 [10]。心理学上有许多关于抑制的概念,但是抑制并不完全就等同于抑制控制。即,抑制控制在这里不仅仅包含了抑制,还另外包含了激活,它表示的是抑制和激活这一对注意功能。有前人的研究表明,抑制控制能力发展的关键时期是人生的前六年,而且会在3~6岁之间发生显著性变化,即出现转折点 [11]。而当个体的执行功能出现障碍、或发展尚未完善时,通常会表现为持续性错误,即个体持续不断、重复地出现某个按照要求本应受到抑制的行为。而这种持续性的错误就被解释为:它是由于个体抑制机制的不完善、不成熟,而不能抑制与目标冲突的优势反应倾向所造成的。这种解释有其合理之处,但是它也不能对执行功能的所有现象做出解释,也无法从内在区分各种任务引起的困难之间的差别。
Stroop效应是指字词的含义对该字词的颜色的干扰效应,该理论认为,念出刺激字与说出刺激字的颜色是两种不同的认知加工过程 [12]。该结果是由美国心理学家Stroop于1935年做的一个实验而获得。他所使用的刺激材料在意义与颜色上相互矛盾,例如,刺激是用黄色写的“蓝”这个字,要求被试报告刺激的颜色而不是念出刺激的读音,即报告“黄”。结果发现,如果刺激的字义与颜色不一致,则说出字的颜色时会受到字义的干扰。
研究者们做了大量相关方面的研究,提出了许多理论试图来解释这种词色冲突的现象。
相对加工速度理论是产生的最早的 [13] [14]。该理论认为人们对字词的含义的加工和对字色的加工是平行的,但是加工速度不同。人脑对字体颜色的命名总是滞后于对字词意义的理解,因而字词含义总是优先得到加工。所以,当刺激的颜色与含义一致的时候,就会促进对刺激颜色的命名,反之,当刺激的颜色与含义相矛盾时,则会对刺激颜色的命名产生干扰。
自动化理论区分出来自动与控制两种加工方式,强调了个体注意资源的参与在加工过程中起到的作用。理解词义是自动加工而命名词色是控制加工,故当色词矛盾时,会对颜色的理解、命名产生干扰,而对词义的理解则没有影响。
知觉编码理论认为Stroop效应的产生具有阶段特异性 [15]。Logan的平行加工模型则把这种色词矛盾产生的效应看作是一种收集证据进行决策的过程 [16]。
联结主义和神经网络模型又被称为平行分布加工模型(PDP),该模型是对以上几种理论解释的综合,该模型可以解释Stroop效应中的许多种现象 [17] [18]。它认为平行分布加工模型系统中包含了许多条通路,通路中的联结组决定了这条通路的强度,因此,对于通路的选择也就决定了信息加工的速度和准确性。
建构理论对Stroop效应的解释是,Stroop效应的背景,刺激量,刺激顺序以及一致性和任务效果的影响都会影响Stroop效果。该理论强调,参与者选择周围信息的努力可以通过新接收的信息来抵消。如果无关信息非常显著或与相关信息有关,则也可以处理这种无关信息。目标词比其他地方的词更突出,因此有可能影响、调节或改变stroop效应 [19] [20] [21]。
后来的研究者们在研究Stroop范式时衍生出了许多种变式。例如反转Stroop范式、双语Stroop、情绪Stroop以及昼–夜Stroop范式等。
反转Stroop效应 [22] 是指,被试要对刺激字的字义做出判断,而当刺激字的字义与颜色相矛盾时,字体颜色的命名对字义加工产生的干扰现象。即反转Stroop任务的要求与经典Stroop任务相反,要求被试忽略刺激字体的颜色,仅对刺激字的字义作出反应。
双语Stroop [23] 研究的是是同一种语言内部以及双语者在两种不同语言之间的Stroop效应。该效应一般会使用图–文干扰任务和翻译任务去进行研究。
情绪Stroop范式 [24] 关注的是情绪性信息对注意的干扰作用。对于该范式与经典Stroop范式之间的关系及其背后的作用机制,一部分研究者认为经典的Stroop效应和情绪Stroop效应都是由于注意资源的竞争所导致的;而另一部分研究者则认为,经典Stroop效应是由于注意竞争所致,但情绪Stroop效应并不是,该效应中并不存在一致或是不一致的信息,而是由于威胁性的情绪信息导致的认知加工速度的延缓 [25]。
昼–夜Stroop范式也是经典Stroop范式的一种变式,它与经典Stroop任务的共同之处在于,都要求被试去抑制视觉冲突与刺激内容的意义之间的矛盾,而前者又是一种规则任务,因此可以作为衡量执行功能的一个共同、常用而重要的指标 [26]。该范式适用于3岁到7岁的学前儿童,而该年龄段的儿童也刚好处于执行抑制功能发展的关键期 [27]。
Cerstadt、Hong和Diamond等人就曾采用昼–夜Stroop范式(day-night stroop)来考察3.5~7岁的幼儿的执行功能发展状况。实验者拿着若干张画有太阳和月亮的图片,随机呈现给儿童被试,要求被试在第一个任务中看到“太阳”说“夜晚”,看到“月亮”说“白天”;第二个任务中看到“太阳”说“白天”,看到“月亮”说“夜晚”。结果发现,儿童在任务一中反应的正确率显著低于任务二,平均反应时间也出现明显的延长,还有部分被试无论经过多少次的练习,看见太阳的轮廓还是仍然会坚持报告“白天”。这样的结果说明学前儿童的执行抑制功能的发展还有待完善。有研究者提出“执行功能的工作记忆理论”来说明儿童在昼–夜Stroop任务中表现出的这种抑制控制能力发育不完善的现象。该理论强调工作记忆在执行功能发展中的作用,认为工作记忆的存储时间或功能容量的改变将直接导致执行功能的不同表现 [28]。而学前儿童工作记忆的发展,无论是在储存时间,还是在储存容量方面都有待完善。执行功能的各方面的发展也的确在很大程度上依赖于工作记忆的发展,所以儿童在完成任务时会出现Stroop效应。相对加工速度理论也可以解释这种现象,因为对于大多数人来说,“太阳”代表着白天,“月亮”代表着夜晚,这是每一个人的常识性知识,所以,看见“太阳”报告“白天”、看见“月亮”报告“夜晚”是我们的优势反应,而要求被试看到“太阳”报告“夜晚”、看到“月亮”报告“白天”则是一种非优势反应,需要首先抑制我们的优势反应,而3~7岁的学前儿童正处于抑制控制能力发展的关键期,该功能可能发展的尚不完全,故在昼–夜Stoop任务中做出了较差的表现。
综上所述,在梳理了相关研究后我们发现研究Stroop效应和执行功能以及执行功能中的抑制控制能力的非常多,而单独研究昼–夜Stroop这个变式的则很少,仅仅是将其作为测量执行功能指标的工具研究学前儿童的执行功能发展状况,而将它应用于大学生群体执行功能的测量的研究则几乎没有。本文将在前人所做的相关研究的基础上通过统计分析的方法运用昼–夜Stroop范式进一步探讨大学生群体在完成这类任务时执行功能的受抑制情况。
2. 研究方法
2.1. 研究目的
本文所要的研究的是狭义的执行功能,即抑制控制。该成分与我们的日常的生活、学习、工作等息息相关,如果人们不能对无关信息、某些优势反应进行抑制控制,将有限的资源、精力集中于加工、完成当前的任务,那么我们将会什么事也做不成功。
然而,前人采用昼–夜Stroop范式对执行抑制功能的研究仅限于学前儿童,而对于其他年龄段的被试群体(例如老年人、大学生等)执行功能的研究多采用事件相关电位ERP或FMRI技术,而使用昼–夜Stroop范式却几乎没有,对成人与儿童被试使用不同的研究方法得到的数据结果也难以进行直接比较。同时由于成年人相较于学前儿童来说,其认知、控制抑制能力、理解能力等都随着年龄的增长得到了很大的提高,工作记忆能力也得到较大的增长,他们在昼–夜Stroop任务中执行功能的表现也必然会与学前儿童的表现有所不同。但是,在这一方面的实验研究无论国内国外都十分稀少,另外,成年人中许许多多的行为和心理问题,例如拖延,手机依赖、赖床,暴饮暴食,网络成瘾甚至肥胖等等,都与人的执行功能,特别是抑制控制功能有关,抑制功能的缺乏不仅会影响我们的正常生活,甚至还会导致很多认知障碍。
2.2. 研究假设
基于这样的思考,本文要研究的第一个问题是,成年人群体的执行抑制功能在昼–夜Stroop效应中的体现(假设一:被试在昼–夜Stroop任务中的表现会受到匹配状态的影响)。另外,前人所做的昼–夜Stroop实验都是以图片的形式向被试呈现不同的刺激,而未曾采用过其他的刺激形式。已有研究表明,人们对图片与文字的加工速度有差异,且图片与文字对被试起着不同的说服效果。基于此,本文要研究的第二个问题是,在不同刺激类型的昼–夜Stroop任务中,执行功能的受抑制程度的差异(假设二:被试在昼–夜Stroop任务中的表现会受到不同的刺激材料类型的影响)。此外,本文还打算将当前进行的研究的结果与前人的结果相比较,进一步探讨大学生群体与学前儿童在昼–夜Stroop任务中执行功能的受抑制程度差异对比(假设三:成年人在昼–夜Stroop任务中执行功能的受抑制程度要低于学前儿童)。另一方面,以往的昼–夜Stroop实验多以儿童的口头报告形式记录实验的因变量,而主试通过被试的言语报告所记录下来的数据可能并不精确,实验的内部效度可能会受到影响,而按键法则是计算机对被试的完成任务时的按键反应时和准确率进行的记录与处理,更加科学与客观,少受实验者主观因素的影响,也更有利于对成年被试群体在执行任务中执行功能各方面的变化反应进行更细致的观察研究。
2.3. 实验设计
本研究采用2*2的被试内设计,故本实验共有两个自变量,一是刺激材料的类型(彩色图片vs.四字词语),二是指导语要求的被试做出的按键反应与刺激所表达的意义的匹配与否(匹配vs.不匹配)。实验有两个因变量,一是被试的按键反应正确率(ACC),一是被试的按键反应时(RT)。
2.4. 被试
被试选取通过随机选择的58名湖北工程学院本科在校生参加了本实验,女生29人,男生29人,所有被试均为黄种人,母语为汉语。男性平均年龄为20.00 + 1.21岁,女性平均年龄为19.33 + 0.96岁,所有被试的年级分布为大一至大四,包含的专业有文学、理学、哲学、教育学等。所有被试身体健康,视力或矫正视力正常,无色盲色弱,无认知障碍,所有被试均为右利手,且没有参加过类似的实验的经验。在实验实施前向被试解释实验的目的获得了他们的同意,所有被试均为自愿参加,实验结束后每一个被试都获得了一定的报酬。
2.5. 实验材料
实验材料为11张表示白天或黑夜的400*365像素的彩色图片,白天相关的图片5张,图片中含有“太阳”、“蓝天白云”等明显的标志,黑夜相关的图片6张,图片中画有“月亮”、“暗夜中的灯光”等明显的标志。所有图片均来自网络,用Photoshop软件对图片进行处理,使所有图片的大小、分辨率保持一致;11个用来形容白天或黑夜的四字词语,白天相关的词语5个,黑夜相关的词语6个,所有的表示白天的词语都带有“日”、“阳”等字,所有表示黑夜的词语都带有“月”、“夜”等字,明显表示了其形容的时间段,避免了被试文化程度造成对刺激的不同理解,而导致的额外误差。所有词语字号都为48,宋体,所有刺激词均设置为由电脑随机向被试呈现。
2.6. 实验仪器
实验装置,实验刺激随机呈现于14寸纯平彩色电脑显示器正中央,实验程序采用E-prime2.0 (Psychology Software Tool)编写,在联想计算机上运行。被试需要按的反应键为标准电脑键盘上的F键与J键,并且在这两个按键上分别被贴有宋体打印在白纸上,字号为小四的“白天”和“黑夜”的标记,以供被试辨识;运行程序的电脑显示屏分辨率为1366*768。
2.7. 实验程序
程序基本流程图见图1。本实验采用E-prime2.0软件编写昼–夜Stroop实验程序,刺激图片设置为400*365像素,刺激词语为大小48号宋体汉字,视角为2.2˚。刺激字出现前,有黑色的“+”作为注视点,按键后才出现下一个刺激,刺激之间的间隔为500 ms。所有刺激图片与刺激词语均由电脑随机呈现于14英寸的笔记本电脑显示屏中央。所有被试被集中在一间光照良好,温度、湿度适宜的教室里进行任务实验。在确保都完全理解任务规则之后,每一个被试都要求背部挺直,抬头挺胸端坐于笔记本电脑前80 cm处,双手放置在键盘上,完成四个按键反应任务。实验的具体流程如下:实验总共包含四个子任务。在总的指导语之后的任务一中,首先呈现一个子指导语,要求被试仔细阅读的同时主试在一旁附加解释,在确认准确理解了实验要求后,主试退出进行实验的房间,留被试独自在房间内完成任务。被试按空格键进入任务一的练习阶段。首先呈现一个黑色背景下的白色注视点1000 ms,然后呈现属于白天或黑夜的图片刺激。被试按键盘上贴有“白天”或“黑夜”的标签的按键做出反应,若反应错误程序会给予“错误!”反馈,然后呈现下一个图片刺激;若反应正确,则在被试按键后刺激消失,继续呈现下一个刺激。练习一共进行5次,练习刺激由电脑程序随机呈现。练习结束后,实验程序会给予提示,被试根据提示,如判断自己尚未完全熟练实验程序,仍需继续练习,则按q键返回练习阶段,进行新的一轮练习;若被试判断自己已熟悉操作过程,则按p键进入正式实验。正式实验流程与练习流程一致,不同的是试次一共需要进行11次,实验刺激仍然由电脑程序随机呈现。在任务一中,呈现不同类型的图片,通过按键来判断图片代表的含义,若呈现的图片内容是与白天相关的,则被试按键盘上的“白天”键做出反应;若呈现的图片是与黑夜有关的,则被试需要按键盘上的“黑夜”键反应。实验过程中要求被试把左右手的食指分别放在键盘的F键(白天),J键(黑夜)上,这两个按键分别代表着“白天”与“黑夜”的判断。要求被试在实验中集中注意力,注视着屏幕中央,在保持正确率的同时尽量快速的判断刺激图片的内容并作出按键反应;在任务二中,整个实验流程与任务一的实验流程大致一致,不同之处在于被试做出“白天”、“夜晚”的按键反应时,需要被试在看到与白天相关的图片时,按键盘上的“黑夜”键反应,而看到呈现的图片与黑夜相关时,按键盘上的“白天”键反应,即抑制优势反应,做出非优势反应;在任务三当中,呈现给被试的实验刺激由与昼夜相关的彩色图片变为了形容白天或黑夜的四字汉语词语,其余操作流程与任务一完全一致;在任务四当中,实验刺激由与昼夜相关的彩色图片改为了形容白天或黑夜的四字汉语词语,其余流程与任务二完全一致。计算机程序自动记录反应时与正确率。
3. 数据处理
记录反应时,计算出平均反应时和标准差,删除三个标准差以外极端值(小于全部数据的1%)。对其余数据进行进一步分析处理。将实验所得到的经过剔除的剩下的被试数据在SPSS 22.0软件上录入整理,以刺激类型和匹配状态作为自变量进行2 (刺激类型:彩色图片vs.四字词语)*2 (匹配状况:匹配vs.不匹配)的重复测量方差分析,计算正确率,以及反应时的平均数与标准差。
4. 结果与分析
所有被试在不同条件处理下的平均反应时(ms)与平均准确率(%)的基本数据见表1。可以看出不同条件下被试的反应时与正确率存在差异,不匹配条件下被试的反应时要长于匹配条件下被时的反应时;刺激材料为文字时被试的反应时要长于刺激为图片时的反应时。被试反应的正确率在不匹配条件下要略低于匹配条件,而在不同的刺激材料条件下,被试反应的正确率则没有差异。

Table 1. The average response time accuracy rate of subjects in the day-night Stroop task
表1. 昼–夜Stroop任务中被试的平均反应时与正确率
进一步采用SPSS 22.0中的一般线性模型对所得数据进行重复测量的ANOVA分析(被试内变量分别为匹配状况与刺激材料的类型),分析上述差异是否显著。基本数据见表2。结果发现,在反应时上,刺激类型的主效应显著,F(1, 116) = 7.147, p < 0.05,效果量为0.198,说明在不同刺激类型的条件下,被试在昼–夜Stroop任务中做出的反应时间存在着显著差异,相比于刺激材料为四字词语时,被试在彩色图片条件下做出的反应要更加迅速;匹配类型主效应显著,F(1, 116) = 43.272, p < 0.05,效果量为0.599,说明在不同类型的匹配条件下,被试在昼–夜Stroop任务中做出反应的时间存在着差异,相比于在不匹配状态下的反应时间,被试在匹配状态下的反应时间要更加迅速;刺激类型与匹配类型的交互作用不显著,F(1, 116) = 1.002, p >0. 05,效果量为0.033。数据分析结果剖面图见图2。

Figure 2. Stimulus type*projected marginal mean of matching state
图2. 刺激类型*匹配状态的预估边际平均值
5. 讨论
5.1. 结果讨论
实验结果显示,在不同的实验处理条件下,被试的反应时与正确率确实存在着一定的差异。就被试反应的准确率来看,被试反应的正确率在不匹配条件下要略低于匹配条件,而在不同的刺激材料条件下,被试反应的正确率则没有差异,这说明刺激材料的类型对被试的反应准确率并没有影响;但是,从试验的平均反应时间来看,在非一致条件下试验的反应时间比在一致条件下的反应时间长,刺激材料为文字时被试的反应时要长于刺激为图片时的反应时,这说明被试的反应时会收到匹配条件与刺激材料类型的影响,假设一得到证实,假设二得到部分证实;另外,实验数据还显示,尽管被试在不匹配条件下的正确率要低于匹配条件下的正确率,但是没有被试出现看见有关白天的文字或图片持续按“白天”键反应的情况,这一点与部分儿童被试无论经过多少次的练习,看见太阳的轮廓还是仍然会坚持说白天的情况不同,但是由于本实验与前人所做有关儿童的昼–夜Stroop实验材料不同,故二者无法直接比较,所以假设三未得到证实,但该假设依然可以作为未来的研究方向。该结果也为自动化加工理论 [29] 与执行功能的工作记忆理论 [30] [31] 提供了证据,自动化理论强调自动加工和控制加工两个概念之间的区别,自动加工不需要注意的参与,控制加工则需要有意的控制。在昼–夜Stroop任务中看见“太阳”反应“白天”是自动加工,看见“太阳”反应“夜晚”是控制加工,所以刺激含义与指导语要求的按键反应的匹配与否能对不匹配条件下的反应产生促进或干扰,对匹配条件下的反应则不会;而相比于学前儿童,大学生的工作记忆特性无论是存储时间还是存储容量上都要更强。该实验结果还显示了人们对图片材料的反应速度要快于文字材料,这可能是由于我们大脑对图片与文字的认知加工速度不同所致 [32],在该实验中,由于图片比文字能够更加直观明了地表达白天或者夜晚,故被试对图片的认知加工速度要快于对文字的。该实验结果也为相关方面的理论研究进一步提供了证据。
5.2. 创新与不足
本实验采用了计算机按键反应代替了口头报告反应。以前的研究者要求被试用口头报告的方式对呈现给他们的图片刺激进行反应,这种方式得到的数据比较主观,容易同时受到主试和被试因素的影响,信度和效度都受到限制,而使用按键记录反应时的方式得到的资料更加的客观,有利于提高内部效度;本实验采用了2*2的被试内设计,这种实验设计所需的被试数量较少,减少了做实验所需耗费的时间精力,实验设计方便、有效,被试内设计比被试间设计更加敏感,其由被试间的变异性而导致误差的可能性比被试间设计小,被试内设计比被试间设计更有力,能更好地考察不同的实验处理之间的差异,另外,反应时任务存在着明显的个体差异,采用被试内设计就消除了被试之间的个体差异对实验结果所造成的影响;本实验在Cerstadt、Hong和Diamond 等人原有的昼–夜Stroop范式的基础上加入了一种新的刺激类型——四字词语,考察被试在不同的刺激类型的昼–夜Stroop任务中的表现是否也会不同。
本研究依然存在着许多方面的不足。第一,尽管被试内设计消除了个体差异对实验结果的影响,但是被试的反应仍会收到疲劳和练习效应的影响,虽然实验程序中安排了让被试休息的时间,但这并不能完全排除该影响;第二,本研究所选取的被试全部来自于湖北工程学院的在校大学生,而大学生的思维与行为反应与进入社会的其他成年人群体以及已经退休的老年人还是有很大差距的,其代表性程度可能会有所欠缺,另外,本研究也没有控制文化差异、家庭经济状况、种族等额外变量可能会对结果造成的影响,这些都是需要在以后的实验中进一步改进的。未来的研究可以从以下三个方面展开:第一,采用FMRI、ERP、EEG等认知神经科学技术,采用更多的指标研究不同年龄段被试在完成昼–夜Stroop任务时执行功能受抑制的认知神经机制;第二,使用其他的Stroop范式的变式研究不同年龄段被试执行功能的表现,并比较他们之间有什么不同;第三,探索、研究提高个体抑制控制能力的方法,帮助人们更好地完成工作、学习中的种种任务。
6. 结论
本研究采用2 (刺激类型:彩色图片vs.四字词语)*2 (匹配状态:匹配vs.不匹配)的被试内设计研究得出结果:1) 执行功能在昼–夜Stroop任务中的表现会受到刺激含义与按键要求之间的匹配情况的影响;2) 执行功能在昼–夜Stroop任务中的表现会受到任务中呈现的不同的刺激类型的影响;3) 成年人的执行功能在昼–夜Stroop任务中也会受到抑制,但是受抑制程度是否比学前儿童要低则需要进一步研究。