1. 引言
谎言行为普遍存在于社会生活当中,人们时常通过说谎来实现自己的目的。有时谎言的目的是为了帮助他人,是善意的或者危害性较小的,但更多时候谎言是为了获取自我利益,甚至伤害他人的利益,给社会和个人都会带来巨大的消极影响(张宁,张亭玉,张雨青,&吴坎坎,2011)。因此,有效地识别谎言无论对于个人生活或是司法实践来说,都具有重要的意义。正确识别谎言所依赖的基础是说谎者有着与诚实者所不同的心理过程。如果能够明确这些心理过程的差异,以及由此所带来的说谎者特有的认知、情绪、行为反应,那么再通过适当的方法测量这些反应,就能够较好地分辨谎言与事实。虽然研究逻辑非常简单,但研究过程却充满了波折。
一方面,研究者从情绪角度入手,认为说谎者会产生与诚实者不同的情绪反应。具体来说,说谎者不仅会有更高的生理唤醒,还会产生特定类型的情绪感受,例如,会由于担心被发现而产生的害怕,以及由于违反道德而产生的内疚,甚至会由于成功欺骗对方而产生的兴奋(Ekman & Friesen, 1969; Zuckerman, DePaulo, & Rosenthal, 1981)。这种情绪的差异一般可以通过外部行为和生理指标两方面来进行测量。例如,外部行为方面,如注视回避、面部表情、姿态动作等都曾经被认为是识别谎言的线索(Warren, Schertler, & Bull, 2009)。还有研究发现,当人们尝试隐瞒和压抑自己的真实情绪时,依然会呈现出十分短暂且不能自主控制的面部表情,从而泄露人们的真实感受(Haggard & Isaacs, 1966),研究者称这种面部表情为微表情(Ekman & Friesen, 1969)。研究者认为相比于姿势、声音、言语内容等线索,微表情能够帮助人们更有效地识别谎言(申寻兵,隋华杰,&傅小兰,2017)。此外,直接测量人们的生理指标,如血压、脉搏和皮肤电等,由于其相比行为更难以被说谎者精确控制,也受到研究者的广泛关注,并且在司法、医学临床等领域表现出潜在的应用价值(郭晓娟&苏彦捷,2000)。
虽然情绪取向的谎言识别吸引了大量的关注,但其结果却不甚理想。多项元分析发现,谎言识别的平均正确率约为54%,仅仅略高于随机水平(Bond & DePaulo, 2006; Hartwig & Bond, 2011; Vrij, Fisher, & Blank, 2017;梅宏玉&吴嵩,2018),并且有研究发现在去掉部分情绪信息时,即只用录音和文本材料时,被试的判断正确率会高于使用视频材料(包含全部情绪信息)条件下(Maier & Thurber, 1968)。此外,在一项元分析研究中,分析了152种识别谎言的线索,发现了12种效应值相对较大(d > 0.2)的线索,其中仅有3种可被认为是情绪线索(总体紧张性、声音紧张性、音调),其余均为语言线索(DePaulo et al., 2003)。基于这样的结果,部分研究者认为应该更加重视说谎过程中的认知差异,从认知过程和结果上去识别谎言,例如所报告的实际语言内容(吴嵩,蔡頠,孙嘉卿,章哲明,&金盛华,2012;吴嵩,金盛华,蔡頠,&李绍颛,2012)。
除了情绪上的差异,说谎者在认知上也会和诚实者存在较大的区别,表现为说谎者会有更高的认知负荷(Suchotzki, Verschuere, Van Bockstaele, Ben-Shakhar, & Crombez, 2017; Vrij et al., 2017)。首先,说谎者不仅要从记忆中提取相关信息,还需要编造新的虚假信息;其次,说谎者不仅要时刻注意不能让真实信息不经意泄露,还需要注意编造的信息不能和已知的信息相冲突;再次,说谎者要时刻评价自身的行为以及对方的怀疑程度,并根据对方的怀疑及时调整自身的表现,以避免被识别。综合这些考量,说谎者理应比诚实者付出更多的认知努力,并且,许多实证研究也支持这个假设。例如,被试自我报告说谎时会有更高的认知负荷(Caso, Gnisci, Vrij, & Mann, 2005);被试说谎时与认知有关的脑区有更强的激活(Christ, Van Essen, Watson, Brubaker, & McDermott, 2009; Suchotzki, Crombez, Smulders, Meijer, & Verschuere, 2015);并且如果增加认知负荷,说谎者会表现出更多的谎言线索,也更容易被识别(Vrij et al., 2017)。
在认知取向的框架下,最简单也最便利的一个测量指标就是反应时,由于说谎者有更高的认知负荷,因此其回答问题的反应时应该也会更长。虽然很早的时候研究者就开始研究反应时的测谎,但一度陷入僵局,后来由于计算机技术的发展和研究范式的更新,其又重新吸引了研究者的关注,并且在最近十年内取得了一些比较有价值的结果,而反应时技术由于其便利性和廉价性,又具有很高的应用价值,因此及时对其研究方法和成果进行总结分析,具有非常重要的理论和实践意义。本文主要从反应时测谎的理论基础、基本范式、有效性及相关影响因素四个部分对其进行总结和分析,并在此基础上,对未来的研究方向和亟待解决的问题进行讨论。
2. 反应时测谎的理论基础
2.1. 朝向反应理论
朝向反应(orienting response)又称为为朝向反射(orienting reflex),是指个体应对环境中的新异刺激或重要刺激时的反射活动,表现为个体会立刻将注意力转移到目标刺激之上,并带来自主神经系统所引发的一系列生理和行为反应,诸如皮肤电、心率、脑电等(Bradley, 2009)。朝向反射有利于人类对刺激进行深入加工,并做出合适的行为反应。研究者认为这一理论也可以用于测谎,说谎者想要隐瞒的信息对其来说就是重要刺激,也会相应的引发朝向反应,而这种反应能够被多导生理记录仪或脑电仪等仪器检测出来,从而可以作为测谎的指标(Varga, Visu-Petra, Miclea, & Buş, 2014; Verschuere, Meijer, & De Clercq, 2011)。以该理论为基础的隐藏信息测试(concealed information test, CIT)也被广泛应用与研究和实践之中。研究者认为在测谎任务中,由于隐藏信息是重要信息,说谎者会将测谎者所提供的信息与隐藏信息进行比较,一旦匹配就会引发朝向反应,从而会自动将注意力转向该信息,并损害接下来的任务表现,导致反应时间或错误率的提高(Varga et al., 2014)。
2.2. 执行功能理论
执行功能(executive functions)是指在对行为进行认知控制时所需要的一系列认知过程和功能的总和,然而由于执行功能的复杂性,对其的定义和解释存在不同的理论。在谎言识别领域,所产生影响较大的是Miyake等人(2000)所提出的模型,其认为执行功能主要由三个方面组成:对工作记忆内容的持续监控、迅速提取和删除(刷新),不同任务或心理状态之间的转换(转换),以及对行为的抑制(抑制)。说谎行为是多种认知加工的结合的产物,因此其同样需要依靠这三个主要的执行功能(Christ et al., 2009; Debey, Ridderinkhof, De Houwer, De Schryver, & Verschuere, 2015)。首先,说谎者需要在工作记忆中激活、保持事实信息,并生成与事实不同的谎言信息;其次,说谎者必须抑制真实反应,避免泄露真实信息;最后,说谎者所提供信息往往是事实与谎言的结合,因此其需要在说谎和说真话之间进行任务转换。需要的执行功能越多,意味着认知负荷越大,从而体现在行为上则是反应时更长,执行功能理论实际上解释了说谎时认知负荷增加的潜在原因(Suchotzki, 2018; Suchotzki et al., 2017)。有研究发现工作记忆中的真相激活与说谎诚实的任务转换都会增加反应时(Debey, Liefooghe, De Houwer, & Verschuere, 2015; Debey, Verschuere, & Crombez, 2012)。虽然研究者普遍认为执行功能与说谎有关,但依旧未能明确了解其具体的运行方式。例如,也有研究发现视觉工作记忆的能力与谎言和诚实之间反应时的差异呈正相关(George, Mircea, & Laura, 2012; Visu-Petra, Miclea, Buş, & Visu-Petra, 2014),这可能是由于工作记忆更好的被试更可能在记忆中唤起想要隐藏的信息。总之,三种执行功能的研究在谎言识别领域相对比较独立,明确三种功能在说谎过程中的独立及交互作用对于反应时测谎技术来说非常重要,所以未来需要通过更综合的研究来支持该理论。
2.3. 激活–决策–建构–行动理论
根据说谎所涉及的执行功能,研究者提出了一个更为具体的谎言模型:激活–决策–建构模型(Activation-Decision-Construction model, ADCM),该模型认为,说谎行为包括激活、决策、建构三个认知阶段(Walczyk, Roper, Seemann, & Humphrey, 2003)。首先,个体接收并编码问题之后,会激活长时记忆中与问题相关的真实的语义记忆或情景记忆,并将之提取到工作记忆之中。只有在真实记忆被激活之后,其他相关的记忆才会处于待激活状态,以便于构建谎言。其次,在决策阶段,个体根据自身利益选择是否对该问题说谎。最后,一旦决定说谎,个体需要考虑现实社会情境并付出认知努力来构建谎言,而事实和明显不合理的谎言将被抑制。基于该模型的假设,如果人们一开始就决定不说谎,那么将不会经历决策和建构阶段,一旦长时记忆激活就会直接报告,因此其反应时会短于说谎者。此外,当说谎者对某些问题有选择性的说谎时,虽然都会经历决策阶段,但建构阶段所来带的反应时差异同样也可以作为识别谎言的线索。实际上研究发现,不论是是否问题(只存在决策阶段)还是开放性问题(同时存在决策和建构阶段),个体说谎都比说真话有更长的反应时(Walczyk et al., 2003)。随后,研究者在ADCM的基础上提出了更为具体的激活–决策–建构–行动理论(Activation-Decision-Construction-Action theory, ADCAT),该理论在建构阶段后增加了实际表达谎言以及监控说谎过程的行动阶段(Masip, Blandón-Gitlin, de la Riva, & Herrero, 2016; Walczyk, Harris, Duck, & Mulay, 2014)。虽然行动阶段已经不再影响反应时的长短,但ADCAT进一步指出说谎动机和情绪唤起作为调节因素会在决策和构建阶段中发挥作用,高动机和极端情绪都会增加说谎者的认知负荷并延长反应时间(Walczyk et al., 2014)。
2.4. 理论总结
上述三种理论都在认知取向的框架下对谎言的相关机制进行了解释,都预测说谎者的反应时会长于说真话者,为基于反应时的谎言识别技术提供了理论支持,但其侧重点却有所不同。朝向反应理论和执行控制理论都是更为上层的理论,并不是针对谎言识别的具体理论,只是被延伸应用于测谎领域。朝向反应理论主要运用于通过对生理指标的测量来分析个体对重要信息的反应,侧重于解释知情者与非知情者对目标信息的反应存在差异这一现象。执行功能理论则是从上层理论角度提供了可供使用的核心概念,即三种类型的执行功能,为基于反应时的测谎技术提供了坚实的理论基础,也为更为领域内的具体理论指明了方向。于是在执行功能理论的基础之上,ADCAT更加具体地分析了谎言生成的整个认知过程,认为决策和建构两个阶段是导致说谎者反应时增加的具体原因,这不仅为理论研究提供了可以直接检验的假设,也为实际应用中如何通过操纵各种因素提高反应时测谎的有效性提供了很好的切入点。
此外,在解释说谎者的反应时更长这一现象上,不同的理论也有区别。朝向反应认为是由于重要信息吸引了知情者的注意力,从而干扰了后续的反应任务,延长了反应时间。而执行功能和ADCAT两种理论则是认为说谎的过程比说真话更为复杂,有更高的认知负荷,从而导致反应时的延长。执行功能理论从说谎涉及的认知功能的角度来解释说谎的过程,ADCAT则是执行功能理论更进一步的总结,将三种执行功能应用于说谎行为的整个流程,进一步探究了说谎的内在过程,也更加完整具体。
总的来说,三种理论都增加了研究者对说谎潜在过程的了解,强调了说谎和说真话存在的认知负荷差异,为基于反应时的谎言识别的方法提供了理论基础。但当前的研究中仍存在局限,关于谎言理论模型的研究结果仍不能完全确定其潜在机制,比如,说谎的内在过程只能通过外显的生理指标和行为反应来测量,内在的复杂机制很难明确。
3. 反应时测谎的基本范式
出于不同研究的目的,研究者开发了很多基于反应时的测谎范式,其中最主要的有4种,分别是偏向验证理论假设的欺骗区分范式(differentiation of deception, DoD)和谢菲尔德谎言测试(the Sheffield lie test, SLT),偏向实践应用的自传式内隐联想测试(autobiographical implicit association test, aIAT),以及基于反应时的隐藏信息测试(The Reaction Time-Based Concealed Information Test, RT-CIT)和基于联结的隐藏信息测试(Association-based Concealed Information Test, A-CIT)。
3.1. DoD
DoD范式是通过设计两组在情绪体验、重要性、具体性等各方面都相对匹配的问题,然后让被试在一组问题上说谎,在另一组问题上说真话,从而比较说谎和说真话时的生理反应差异(Furedy, Davis, & Gurevich, 1988)。后来,DoD范式被研究者用来进行了有关说谎反应时的研究。例如,在一项研究中(Duran, Dale, & McNamara, 2010),被试被要求根据屏幕指示对一系列问题做出真实或者错误的回答,这些问题都采用相同句式,询问被试是否做过某事,并且说谎的问题与说真话的问题进行了较好的匹配(如:“您曾经吃过披萨吗?”和“您曾经吃过千层面吗?”)。当被试阅读问题时,屏幕上会呈现一个圆圈,当圆圈显示为绿色时,被试对问题做出诚实的回答,当圆圈显示为红色时,被试需要对该问题说谎,所有的问题均为是否问题,被试通过任天堂Wii体感游戏机做出相应的是否选择,其结果发现说谎时需要的反应时间比真实回答更长。当然,DoD范式也可以通过声音或按键等多种方式记录反应时。
3.2. SLT
SLT是与DoD非常相似的一种方法,其主要开发出来应用于核磁共振的相关研究中,以此探究人在说谎时的神经机制,因此其在DoD的基础上进一步强化了实验控制(Spence et al., 2001)。两种范式的差别在于,DoD要求被试对两组问题分别作出诚实或说谎的回答,两组问题是根据特性两两匹配的,而SLT则要求被试在同样的问题上分别做出两次回答,一次是事实,另一次则为谎言。在通常的SLT实验中,被试通过按键回答个人经历相关的是非题,当问题在屏幕上以绿色字体呈现时,被试需要说真话,而以红色呈现时,被试则需要说谎,两种条件随机出现且概率相等。SLT也被用于反应时测谎的研究,例如,有研究者使用SLT,询问被试与个人信息相关的问题(如:你是一个学生吗?)并测量被试回答问题的反应时,其结果发现说谎的反应时长于说真话的反应时(Debey, De Houwer, & Verschuere, 2014)。此外,也有研究者探讨了更倾向于现实情境的谎言识别。在实验中,被试会首先进行模拟偷窃活动(如:走出实验室,去教授的信箱偷走一个含有考试内容的光盘),并利用该范式询问被试与偷窃过程相关的问题(如:你是否偷走了一个光盘?),并记录被试按键回答问题的反应时,其结果也同样发现被试说谎时比说真话时有更长的反应时(Debey et al., 2014; Suchotzki, Verschuere, Crombez, & De Houwer, 2013)。
3.3. aIAT
aIAT是由内隐联想测试(IAT)改编而来,用于检测个体在所报告的自身经历上是否存在说谎(Agosta & Sartori, 2013; Sartori, Agosta, Zogmaister, Ferrara, & Castiello, 2008)。在该测试中,一共设置四类信息,分别是显然正确或错误的两种陈述(如:“我现在正坐在电脑前”和“我现在正在山顶上”),以及有罪陈述与无辜陈述(如:“我偷了试卷”和“我没有偷试卷”)。与IAT一致,实验程序一共分为5个阶段,第1阶段被试需要将正确和错误两种陈述归类到事实(按A键)或者虚假(按J键)两种类别;第2阶段被试需要将有罪和无辜陈述归类到有罪(按A键)或者无罪(按J键)两种类别;第3阶段则同时对四类陈述进行分类,事实和有罪类别均按A键,而虚假和无罪类别则都按J键;第4阶段继续将有罪陈述和无辜陈述分类到有罪或无罪类别,只是按键与阶段2相反,无罪按A键,有罪按J键;最后第5阶段,与第3阶段类似,被试同样对四类陈述都进行分类,只是类别的按键有所不同,事实和无罪类别均按A键,虚假和有罪则都按J键。实验结束后,只有阶段3和阶段5的反应时会纳入统计分析,研究者预期假如被试实施了偷窃行为,其在阶段3中的反应时会比阶段5更短,因为在阶段5中无罪陈述与事实类别会发生冲突。相反,对于没有偷窃的个体,其在阶段5的反应时会比阶段3更短。也就是说,当与谎言相关的陈述(如:是否有偷窃)与“事实”和“虚假”的类别匹配时,反应时更短;而当两者不匹配时,被试产生的内在冲突会导致反应变慢,反应时增长。Sartori等人(2008)设计了6个实验来检验aIAT的有效性,结果发现了一致的结果,aIAT测验能够有效区分说谎者和诚实者。
3.4. RT-CIT
RT-CIT是在隐藏信息测试(Concealed Information Test, CIT)的基础上发展而来。CIT又被称为犯罪知识测试(guilty knowledge test, GKT),常与生理记录仪同时使用,用于检测嫌疑人是否对司法案件知情,只有罪犯能够清楚辨认出与犯罪过程相关的信息,并且表现出不同的生理反应(Lykken, 1959)。比如,在谋杀案中,只有罪犯知道自己使用了何种作案工具(如:刀),那么在看到刀(探测信息)、枪和绳索(无关信息)这三种工具时,罪犯就是唯一能够区分出探测信息和无关信息的人。在传统CIT中,被试需要对所有信息都做出“否”反应,测试者通过分析不同信息呈现后的生理反应,尤其是探测信息与无关信息之间生理反应的差异来判断谎言。根据朝向反应理论,探测信息会诱发个体的朝向反应,表现为皮肤电和心率增加、呼吸抑制、瞳孔放大等(Varga et al., 2014)。
反应时分析中也同样可以使用CIT技术,但考虑到如果对所有信息都做出反应,会使被试形成习惯,在没有加工信息的条件下直接按键,因此RT-CIT对实验范式做出了相应的修正。在RT-CIT中,被试除了需要对探测信息和无关信息做出“否”的按键反应外,还需要对研究者事先给定目标信息做出“是”的按键反应。目标信息的反应时不纳入最终的统计分析,但其正确率可以作为被试是否认真读题的指标,研究者主要关注的是被试在探测信息和无关信息上的反应时差异。RT-CIT认为说谎者或犯案者会对探测信息有更长的反应时,而无辜者在两种反应时上差异不显著。许多研究结果都支持了该假设,知情被试在对探测信息做出否认时,其按键的反应时更长(Noordraven & Verschuere, 2013; Varga et al., 2014)。
3.5. A-CIT
A-CIT是最近通过结合aIAT和RT-CIT两者的优势而开发出的新的反应时测谎范式(Lukács, Gula, Szegedi-Hallgató, & Csifcsák, 2017)。在A-CIT中包括两种类型的刺激,关键信息和诱导信息,关键信息又分为探测刺激和无关刺激。具体来说,以凶器为例,实际的凶器为探测刺激,而其他的凶器则为无关刺激,被试需要通过按键的方式将探测刺激和无关刺激按照“自己的”和“他人的”进行分类。此外,诱导信息为描述自我类别的词语(例如“我的”、“本人的”),被试同样需要将这些词语进行同样的分类。诱导信息的作用在于使被试将类别属性与相应的按键反应之间建立起联系。对于无辜者来说,所有的凶器都不是自己的,因此都应该归为“他人的”类别,而诱导信息则会归为“自己的”类别。而对于说谎者来说,虽然也会努力将所有凶器都归为“他人的”的类别,但由于实际凶器与自我相联系,因此在按键时会出现认知冲突,导致其反应时会变长。A-CIT的优势在于,无辜者在RT-CIT中可能会受到对探测信息知情的影响,表现出朝向反应,而A-CIT是让被试对信息的归属进行分类,因此即使被试事先就对探测信息有所了解,也不会影响最后的反应时差异,避免了由于信息泄露所带来的测谎失败。在Lukács等人(2017)的实验二中,虽然事先就告诉被试所有的关键信息,但说谎者依旧在探测信息上有更长的反应时。而与aIAT相比,A-CIT可以使用更简洁的词汇而非句子,可以涵盖更多的选项内容,也能用于测试还未知的隐藏信息(例如:计划中的犯罪地点)。
4. 反应时测谎的有效性
4.1. 决策方式
从本质上说,反应时只是个体的行为反应,是测谎的一种指标,它并不能直接告诉我们究竟是否有人在说谎,如何利用反应时数据做出最终的判断决策,或者说如何确定判断的临界值是需要解决的重要难题。
最简单的一种方法是事先主观确定,即事先人为选定一个特定值作为判断依据,将被试的反应时与特定值比较大小,从而进行分类决策,最直观的临界值即为0。例如,在RT-CIT任务中,用探测信息的反应时减去无关信息的反应时,如果差值大于0则认为是说谎,否则就认为是无辜。在aIAT任务中也是类似,如果无罪陈诉与事实类别不匹配时的反应时减去匹配时的反应时大于0则认为是说谎,否则就认为是无辜。当然,除了0以外,研究者也可以设定任意自己认为合适的值作为临界值,但这种临界值设定的方法过于主观,对最后的结果影响较大。
此外,在研究中,也有研究者通过统计分析来计算一个最合适的临界值。例如,将被试分成两个同质的组,首先在第一组反应时的基础上通过逻辑回归建立相应的模型方程或临界值,然后在第二组中使用该临界值来进行判断,并计算判断的正确率。在各种统计方法中,目前研究者较为认可的是通过接受者操作特征(receiver operating characteristic, ROC)曲线来确定临界值。在谎言识别研究中,ROC曲线是以正确识别说谎者的比率为纵坐标(灵敏度,sensitivity),以错误将诚实者认为是说谎者的比率为横坐标(特异性,1-specificity),以不同判断标准下所得到的不同的坐标点相连而画出的曲线图。因此,从理论上说,ROC曲线可以反映出各种判断标准下的正确率,从而可以找出最佳临界值点,以及此时相应的判断正确率。此外,更为重要的一点是ROC曲线下的面积(area under ROC curve, AUC)可以直观地反映出在考虑了各种判断标准后,该谎言识别技术其本身在判断谎言上的优劣。AUC理论上是范围0到1的值,但在不考虑数据方向性的前提下,其取值在0.5到1之间。当AUC为0.5时,表明分类是完全随机的,识别技术没有任何作用,而AUC取值越大代表所使用的识别技术越优。因此,使用AUC不仅可以与随机猜测水平进行比较,也可以在不同反应时技术之间进行比较,甚至于将反应时技术与其他生理测谎技术进行比较。
4.2. 有效性的证据
反应时测谎范式最早常常是与测谎仪配合使用,根据生理指标的变化来判断是否说谎,但这种方式也存在一定的局限。例如,没有研究发现说谎具有确切且唯一的生理反应,诚实者也可能会因为害怕被误判或者对探测信息知情而产生紧张或焦虑的情绪和生理反应。虽然反应时测谎技术一定程度上排除了这种相似生理反应的影响,但它的有效性也受到一些争议。有研究者总结了常用的一些测谎线索,并进行了两项元分析研究,但其结果却表明,说谎者和诚实者在访谈情境下的反应时并没有显著的差异(DePaulo et al., 2003; Zuckerman et al., 1981)。但是,有研究者认为,导致这一结果的可能原因是由于访谈情境并不是最优的测试反应时的环境,反应时技术应该通过计算机来实现会更加标准化(Verschuere, Suchotzki, & Debey, 2015)。最近,一项新的元分析检验了基于计算机条件下的四种反应时测试范式(DoD, SLT, aIAT, RT-CIT)是否能有效识别谎言,其中16个实验运用了DoD范式、55个实验运用了SLT范式、9个实验运用了aIAT范式,34个实验运用了RT-CIT范式(Suchotzki et al., 2017)。其结果发现,总体上反应时技术较为有效,说谎与诚实在反应时上的差异的效应值d为1.256,即使在控制发表偏差之后,其总体效应值也达到了1.049。具体而言,DoD范式的效应值最大(d = 1.350),aIAT最小(d = 0.822),SLT (d = 1.287)和RT-CIT (d = 1.297)则处于中间位置。此外,Visu-Petra等人(2011)的研究发现,CIT范式的生理测量和反应时测量在测谎的正确率上相似,而且也有研究表明通过任务反应时和正确率来测谎,比ERP和测谎仪测谎效应更大(Allen, Iacono, & Danielson, 1992; Verschuere, Crombez, Degrootte, & Rosseel, 2010)。
还有研究发现,反应时测谎技术不仅能够有效识别对已经发生的行为的说谎,还能够在对行为意向的说谎中起到相似的积极作用(Noordraven & Verschuere, 2013; Suchotzki et al., 2013)。此外,反应时测谎技术的另一个优势在于,其练习效应不明显,研究结果显示,即使间隔数天,多次进行反应时测谎任务,说谎与诚实两种条件下的反应时之差也没有显著减小(Vendemia, Buzan, & Green, 2005)。因此即使在现实生活中人们常就某个信息数次说谎或作证,该技术还是能有效甄别出说谎行为。
5. 影响反应时测谎的因素
5.1. 反测谎策略
根据反应时测谎的理论基础,人们在说谎的时候需要更多认知加工,所以研究者通常以被试的反应时长短作为被试是否说谎的参考依据。但是,由于反应时测谎技术都是基于被试的自主反应,被试在一定程度上能够按照自己意愿操控反应时的快慢。也就是说,如果被试了解反应时测谎的原理,那么他们可能会故意减慢说真话时的反应,这种反测谎的策略可能会极大地降低反应时技术的有效性。
Suchotzki等人(2017)对17项关于反测谎策略的研究进行了元分析,在这些研究里被试被明确告知需要采取反测谎策略,甚至直接告知其具体的方法。其总体结果发现是否使用反测谎并不会对最终结果产生显著性的影响。然而,这并不能说明反测谎策略是无用的,而是表明反测谎发挥作用也依赖于其他的一些因素。例如,反测谎策略需要被试对测试有明确的了解,有较好的智力水平,且对电脑操作较为熟练,不成熟的反测谎行为会导致效应减小,但不足以伪造测试结果。有研究发现,仅仅提高被试说谎的动机并不能降低反应时测谎的有效性(Kleinberg & Verschuere, 2016; Suchotzki & Gamer, 2019),而是否告诉被试具体的反测谎方法才会对最终的结果产生显著的影响(Agosta, Ghirardi, Zogmaister, Castiello, & Sartori, 2011)。而在Suchotzki等人(2017)总结的17项研究中,也有7项研究发现使用反测谎策略反而会提高识别谎言的正确率。这些研究表明,反测谎策略并非无用,而是易受其他因素的影响。
考虑到反测谎策略会极大阻碍反应时测谎技术的应用,研究者也希望找出一些方法来减少反测谎策略的影响。一种思路是识别被试是否采用了反测谎策略,例如分析诚实反应的反应时是否过长,分析练习反应和正式反应的反应时差异等(Agosta et al., 2011);另一种思路则是阻止被试使用反测谎策略,例如设定较短的反应窗口(Verschuere, Prati, & Houwer, 2009)。
5.2. 认知负荷
从认知加工的角度出发,研究者普遍认为说谎会比诚实占用更多的认知资源,因此有效增加被试的认知负荷,会使说谎变得更加困难,也会进一步增加说谎和诚实在认知和行为上的差异,因此也就能提高识别谎言的正确率。在面对面或者视频的谎言识别任务中,研究者一般采用要求倒序讲述、要求保持目光接触、询问意料之外的问题、同时进行双任务等方式来增加认知负荷,也在一定程度上发现增加认知负荷能够提高识别谎言的正确率(Levine, Blair, & Carpenter, 2018; Vrij et al., 2017)。
反应时技术作为一项认知取向的谎言识别方法,也存在通过增加认知负荷来提高识别正确率的可能性,且由于反应时较为灵敏,其可能比传统方法更易受认知负荷的影响。因此,研究者们也开始探索和检验认知负荷在反应时测谎中的作用,并取得了一些积极的结果。有研究者采取双任务范式,发现在完成RT-CIT任务同时完成一项与执行功能相关的分心任务,能够显著地增加说谎者在探测信息和无关信息上反应时的差异(Visu-Petra, Varga, Miclea, & Visu-Petra, 2013)。
除了传统的增加认知负荷的方法之外,考虑到反应时测谎中理论和范式的特殊性,也可以设定相应独特的方法。例如在RT-CIT中,被试需要对目标信息做出“是”反应,而对探测信息和无关信息做出“否”反应,因此增加被试在两类反应上转换的难度也可以相应提高被试的认知负荷。有研究发现,同时增加RT-CIT任务中目标信息的熟悉度和数量可以显著加大被试在探测信息和无关信息上的反应时之差,也就是说能够更有效地识别谎言(Suchotzki, De Houwer, Kleinberg, & Verschuere, 2018)。相反,如果在反应时任务中增加说谎试次所占的相对比例(例如增加探测信息的数量或者减少无关信息的数量),则会在一定程度上减少被试的认知负荷,并最终降低反应时测谎的效力(Suchotzki, Verschuere, Peth, Crombez, & Gamer, 2015; Van Bockstaele, Wilhelm, Meijer, Debey, & Verschuere, 2015)。
然而,最近有研究者对22项关于认知负荷的研究进行了元分析,其结果并没有发现增加认知负荷能够有效提高反应时技术测谎的效力(Verschuere, Köbis, Bereby-Meyer, Rand, & Shalvi, 2018)。不过由于文章数量较少,其并没有进行调节变量的分析,且由于其纳入了一些并不能看作是增加认知负荷的文章(例如自我损耗),因此其结论有待进一步验证,更加深入的分析不同方式的认知负荷将能较好地解决目前研究的争论。
6. 未来的研究展望
6.1. 优化范式
相比于其他类型的测谎技术,反应时测谎存在许多优势。首先,相比于传统的面对面主观测谎,反应时测谎的指标更加客观,且适合大规模同时施测;其次,相比于生理技术测谎(例如多导生理记录仪、脑电仪等),反应时测谎更加便捷和经济,只需要普通的计算机就可以完成。基于这些优势,反应时测谎技术本应有很大的发展潜力和空间,但是目前常用的反应时测谎范式在测谎应用上都存在一定程度的局限。DoD和SLT主要运用于研究说真话和说谎之间在认知过程上的差异,并非是针对测谎。在这两个范式中,被试需要根据指导语的要求来决定在某一阶段说真话还是说谎,由于说谎者不会按照相应的要求反应,因此这两种范式很难运用到真实的测谎任务中。aIAT范式的缺点是试次设置过于复杂,需要编制足够多且相互匹配的正确陈述和错误陈述,此外更为重要的是,aIAT的判断正确率在所有的反应时范式中是最低的。RT-CIT范式则要求只有说谎者对探测信息知情,但在现实生活中,探测信息常常由于各种原因而泄露,并且有时连测谎者也不知道探测信息究竟是什么,这都会在一定程度上降低RT-CIT的效力,因此RT-CIT的使用情境实际上非常有限。最后,虽然A-CIT整合了RT-CIT和aIAT的优势,但其要求对信息按照“自己的”和“他人的”进行分类,这在很多情境下可能并不适用,且由于其是较新的方法,也缺乏充足的有效性证据。综上所述,未来关于反应时范式的研究应该更进一步整合多种方法的优势,设置更加简单异行、且能够适用多种情境的方法,并在更为现实的生活情境中检验这些方法的可靠性和有效性。
6.2. 细化说谎的认知过程
虽然研究者普遍认为说谎会有更多的认知负荷和更长的反应时间,但对其中的具体认知过程和心理机制则并没有明确的定论。不仅不同的理论对于说谎的认知过程的解释具有差异,同样的理论也发现了完全不同的证据。例如执行功能理论认为说谎需要占用更多的执行功能,那么相应的执行功能更强应该有更高的说谎能力,但是以往研究则发现说谎者执行功能中的工作记忆能力越高却越容易被识破(Visu-Petra et al., 2014)。这些矛盾的证据表明虽然各个理论对于说谎的认知过程提出了总体的假设,但对于过程中每种认知功能具体起到的作用却依旧不明确,而这种空白或者模糊对于反应时测谎的研究和应用来说形成了极大的阻碍。首先,理论的不明确导致很难解释相互矛盾的结果,也难以评估反应时测谎的适用情境及其在每种情境下的有效性。其次,理论的不明确导致很难发挥反应时测谎的最大效力。一般来说在明确说谎认知功能的前提下,有针对性地加大说谎者的认知负荷,会提高反应时测谎的效力,但是目前的元分析却没有发现认知负荷的积极作用,这就是由于没有针对具体的说谎认知过程有针对性地提高相应的负荷,导致出现了很多相反的结果。因此,未来关于反应时测谎的理论研究应该更加具体化,对说谎过程中起到关键左右的具体的认知功能进行探索和研究,甚至对于不同谎言类型(例如:对于意图的说谎或者对于行为的说谎)的具体的认知过程进行比较和分析。
6.3. 指标的标准化
影响反应时测谎应用的另一个重要问题是指标的标准化。指标标准化的第一个问题是纳入哪些指标。传统的方法是直接使用反应时的平均数作为判断依据,但使用单一指标已经越来越受到谎言研究的质疑,而整合多个指标并最终形成总体的判断逐渐变成共识。目前看来,在反应时测谎中能够同时考量的指标还包括反应时的标准差、反应的正确率等,有研究同时考虑反应时的平均时、反应时的标准差、反应的一致性三项指标时,其结果发现能够有效提高区别谎言和事实的正确率(Walczyk, Mahoney, Doverspike, & Griffith-Ross, 2009)。指标标准化的第二问题是判断标准的确定。在实验研究中尚可以通过被试分组的方式,以第一组的结果来统计出最佳判断点,但现实应用中则不具有这样的条件。因此建立和检验相对标准化的最佳判断点可以有效地促进反应时测谎的发展。一个有趣的尝试是使用说谎与诚实反应时之差的效应值大小作为判断依据,因为效应值同时考虑了平均数和标准差,且不易受样本量大小的影响,相对来说比单纯使用平均数更加可靠。有研究发现当以Cohen’s d值为0.2~0.3作为判断点时,能够取得最好的判断正确率(Noordraven & Verschuere, 2013; Verschuere & Kleinberg, 2016)。当然,由于这类研究相对偏少,且没有在多种条件下反复验证,因此还需要有更多的研究才能确定最佳判断点的取值范围,以及其是否会受其他情境因素的影响。
6.4. 人格测验中的应用
人格测验作假一直都是研究者和企事业单位关注的重要问题,也相应开发了多种测量作假的方法(刘茜,徐建平,&许诺,2013),而反应时测谎作为一种便捷的方法与人格测验具有高度的契合,能够很好地运用于人格测验作假测试之中。由于技术的发展,现代企业招聘中的人格测验通常采用网络进行,因此具备了测量反应时的基础,而在人格测验上的说谎同样会带来相应的认知负荷,延长反应时间。并且以往有研究发现通过网络进行的RT-CIT测试也能取得较好的识别谎言的正确率(Kleinberg & Verschuere, 2016; Verschuere & Kleinberg, 2016)。因此,反应时测谎从理论上看是可以运用在人格测验中的,但在实际应用上又面对许多急需解决的问题。例如,人格测验的作假与其他的说谎是否具有一致的认知过程,如何在人格测验中设置合适的基线对照,如何避免人格测验中所存在的惯性反应带来的影响等。未来的研究可以聚焦于这些问题,从实际出发,探索如何在特定情境下应用反应时来进行测谎,扩大反应时测谎的应用范围和价值。
NOTES
*通讯作者。