焦虑障碍对奖赏和惩罚学习的影响及其机制
The Effect of Anxiety Disorder on Reward and Punishment Learning and Its Mechanism
DOI: 10.12677/ap.2025.157418, PDF, HTML, XML,   
作者: 黄俊龙, 罗跃嘉:成都医学院心理学院,四川 成都
关键词: 焦虑障碍奖赏学习惩罚学习脑电磁共振Anxiety Disorder Reward Learning Punishment Learning EEG FMRI
摘要: 焦虑障碍是心理健康领域备受关注的重要议题。研究表明,焦虑障碍会显著影响患者的认知功能,特别是在注意力、记忆力和决策制定等核心认知加工领域。学习能力对于人类适应环境并实现持续发展至关重要,而焦虑可能对此产生负面影响,尤其在奖赏和惩罚学习过程中表现出来。然而,目前还不清楚焦虑障碍如何干扰这些关键的认知神经机制。本综述旨在系统梳理现有文献中关于焦虑障碍人群在奖赏和惩罚学习方面的研究成果,包括行为学、电生理学和神经影像学等方面的研究。本文旨在从奖赏和惩罚学习的角度出发,深入探究焦虑障碍对学习机制的影响,阐明学习过程中焦虑障碍所特有的认知神经基础,为未来焦虑障碍的临床诊断和治疗提供新的理论指导,并期望开发出更有效的干预策略。
Abstract: Anxiety disorders represent a critical issue within the field of mental health. Research has demonstrated that these disorders significantly impair cognitive functions, particularly core cognitive processes such as attention, memory, and decision-making. Learning ability is essential for human adaptation and sustained development, and anxiety may detrimentally affect this capacity, especially evident during reward and punishment learning. However, the specific mechanisms by which anxiety disorders disrupt these key cognitive and neural processes remain unclear. This review systematically synthesizes existing literature investigating reward and punishment learning in individuals with anxiety disorders, encompassing findings from behavioral investigations, electrophysiological studies, and neuroimaging evidence. By focusing on the perspective of reward and punishment learning, this paper aims to provide an in-depth exploration of how anxiety disorders impact learning mechanisms, elucidate the distinct cognitive and neural underpinnings characteristic of anxiety during the learning process, and offer new theoretical guidance for the future clinical diagnosis and treatment of anxiety disorders. Ultimately, this work seeks to inform the development of more effective intervention strategies.
文章引用:黄俊龙, 罗跃嘉 (2025). 焦虑障碍对奖赏和惩罚学习的影响及其机制. 心理学进展, 15(7), 184-196. https://doi.org/10.12677/ap.2025.157418

1. 引言

焦虑障碍是一种常见的精神障碍,患者以极度的恐惧和焦虑以及与这些症状相关的行为异常为特征,美国《精神障碍诊断与统计手册》第五版(DSM-5)中把它分为分离性焦虑障碍、选择性缄默症、社交焦虑障碍、惊恐障碍、广场恐惧症、特定恐惧症和广泛性焦虑障碍(APA, 2013)。焦虑障碍在我国有着较高的流行率,最近一次全国性调查显示在我国的精神障碍疾病中,焦虑障碍的患病率最高,终身患病率约为7.6% (Huang et al., 2019)。焦虑障碍的出现和持续,给家庭和社会带来巨大的治疗成本。

在交互多变的世界中,适度的焦虑对个体的生存和发展具有一定的适应性,促使人们能够敏锐地避免潜在的威胁和干扰。除此之外,人们还需要通过不断地学习才能够实现对所处环境的适应和促进自身的发展。强化学习(Reinforcement Learning)作为指导个体通过观察环境和反馈来学习如何做出最优决策的最常用的一种学习形式,其中,奖赏学习和惩罚学习是强化学习中最常见的两种形式,奖赏学习指导个体以寻求更多奖赏而不断累计经验,惩罚学习指导个体以规避惩罚而不断进行学习,这两种学习形式对于个体促进发展和维持生存具有重要意义(Sutton & Barto, 2018)。然而,在适应环境的学习过程中,过度的焦虑以及焦虑障碍的存在会对个体的学习能力带来干扰,主要表现在影响个体在学习过程中所涉及的注意力分配、结果评估、应对策略等功能(Cohen et al., 2011)。

因此,本文旨在探讨焦虑影响学习的认知神经机制,梳理焦虑障碍的成因,及其在奖赏学习和惩罚学习中认知功能的缺陷和神经功能的紊乱,探寻焦虑及焦虑障碍影响的学习机制,有助于更全面地对焦虑障碍进行诊断以及寻找有效的治疗方法。

2. 焦虑障碍的成因

焦虑作为一种负性情绪状态,它是人类在面对不确定性情景时,为应对潜在的威胁,在主观上感到的紧张、忧虑、烦恼,同时伴随自主神经系统的激活(Bekker et al., 2003)。高焦虑个体对威胁信息具有明显的注意、记忆偏向,以及对模糊信息进行负面解释的偏向(Mathews & MacLeod, 2005)使人们在充满未知的生活中更容易产生过度的应激反应。

在引发焦虑障碍的外部环境因素方面,Grupe & Nitschke (2013)提出焦虑的不确定性和预期加工模型(uncertainty and anticipation model of anxiety, UAMA)认为,焦虑障碍产生的重要原因是由于无法忍受环境中的不确定性。在不确定的环境中,焦虑障碍患者往往对不确定结果产生威胁性预期和对环境中的非安全信息产生过度的注意偏向和行为规避。在这种特异性的认知行为模式下,焦虑与不确定环境之间的相互作用,焦虑障碍人群在不确定性的环境中更容易诱发焦虑,从而产生为减少不确定性的非适应性行为,例如担忧、寻求安慰、反复检查、过度警惕等行为(Grupe & Nitschke, 2013) (Brown et al., 2017) (McEvoy & Mahoney, 2012),最终导致焦虑障碍症状的维持和恶化。

除了由外部的应激环境因素的影响以外,焦虑障碍还与自身无法忍受不确定性的特质、过度的诱发焦虑状态和认知神经功能等内部因素具有高度相关(Shackman et al., 2016)。例如,高特质焦虑人格在不确定的环境中更容易产生惩罚威胁的预期,从而导致过度的焦虑(Blanchard & Blanchard, 1989) (McNaughton & Corr, 2008),也是一种患焦虑障碍的潜在因素。另外,焦虑障碍人群大脑活动异常以及不同脑区之间的功能网络连接的紊乱也是焦虑障碍产生的生物学因素,例如,在奖赏学习任务中,焦虑障碍个体纹状体对奖赏反馈的反应减弱(Delgado et al., 2000) (White et al., 2017)。在奖赏预期中,焦虑患者的尾状核(caudate nucleus)和壳核(putamen)内的活动减弱。而焦虑障碍个体在面对具有威胁性的惩罚结果时,则表现出杏仁核活动的过度活跃(Rosen & Schulkin, 1998),表明焦虑障碍的学习异常有特定的神经基础。另外,Sylvester等人(2012)整理出大量相关文献发现,基于功能性磁共振技术的支持下,相比健康人群,焦虑障碍个体在学习过程中负责检测冲突和认知控制变化需要功能的突显网络(salience networks)活动增强;负责对新异刺激的注意的腹侧注意网络(ventral attention networks)活动增强;负责进行情绪调节、未来计划等认知功能的默认网络(default mode networks)活动减弱;负责认知控制能力的执行控制网络(executive control networks)活动减弱(Sylvester et al., 2012)。证明焦虑障碍个体具有特异性的功能网络模式。

因此,无论从外部不确定环境的诱因,还是个体无法忍受不确定的特质及神经基础,焦虑障碍的产生和维持均与在未知环境中的学习有密切的联系。

3. 焦虑障碍影响奖赏学习和惩罚学习的学习机制

学习是人类在进化适应所处环境过程中必不可少的一种能力,而焦虑障碍的发展则会对个体的适应性学习带来显著的影响,这些对学习带来干扰性的焦虑作用又会加剧个体在所处环境中的焦虑情况,形成一种恶性循环。因此,基于学习的角度探讨和总结焦虑障碍的异常具有重要的研究价值。根据经典的强化学习理论,学习往往是由个体追求奖赏的动机驱动的。从生存和发展的角度看,学习旨在优化个体的决策行为,使得决策结果尽可能符合预期。在奖赏学习过程中,个体需要在未知环境中掌握行为与奖赏之间的具体关系,以便最大化奖赏的获取(Bach & Dolan, 2012)。惩罚学习与奖赏学习相似,是一种个体对其行为不良后果进行编码的能力,也是塑造人类行为的重要基础。它不仅有助于优化决策过程和风险评估,还是促进个体适应不断变化环境的核心机制。通过施加惩罚,如罚款、批评或监禁等,惩罚学习促使个体在特定情境下调整自己的行为。这种有效的惩罚学习能够显著减少个体可能对自身造成伤害的潜在行为,从而提高其生存概率以及环境适应能力(Fehr & Fischbacher, 2003) (Henrich et al., 2010)。对于奖赏学习和惩罚学习之间的差异,有研究发现个体在奖赏学习和惩罚学习之间所采取的策略存在差异,个体在奖赏学习过程中更偏向采取灵活性较高的“基于模型”策略,在惩罚学习过程中更偏向采取灵活性较低的“目标坚持”策略,且焦虑程度更高的个体对“目标坚持”策略的依耐性更强(Sharp et al., 2022)。表明惩罚学习背景本身对个体学习能力存在影响,并且这种影响会受到焦虑的作用而加剧。

对此,基于双因素理论的观点认为,奖赏强化会增强奖赏获得行为的频率,惩罚强化会降低惩罚获得行为的频率。然而,相比单因素理论的观点,双因素理论认为奖赏强化和惩罚强化对行为频率的影响具有非对称性,奖赏和惩罚对行为的影响存在差异性。这种观点在后续的研究中得到了验证,Kubanek等人(2015)通过包含加分奖赏和减分惩罚的按键选择任务范式发现,随着加分值的提高,参与者重复获得加分行为的频率越高,但面对减分任务时,参与者重复获得减分行为的频率虽低于50%的基线水平,但其行为重复频率却并不会随着减分值的提高而越低(Kubanek et al., 2015)。该理论的验证性结果对于研究焦虑作用下的奖赏学习和惩罚学习机制具有重要的参考意义。

焦虑对奖赏学习和惩罚学习的影响,涉及注意、结果评估等认知过程的改变及其对应的神经功能变化。因此,本文梳理焦虑人群以及焦虑障碍患者分别在奖赏和惩罚学习研究中特异性的行为表现和神经生理活动,厘清焦虑的奖赏和惩罚学习的机制。

3.1. 焦虑障碍影响奖赏学习的认知机制

强化学习理论认为,学习是由追求奖赏的动机所驱动的。奖赏学习是个体在所处环境中习得行为与奖赏的特定关系,从而使自身在决策过程中获得最大化奖赏的方法,对维持人们适应环境和促进发展具有重要意义(Peterson et al., 2011)。在经典的爱荷华赌博任务范式(Iowa Gambling Task)中,Miu等人(2008)发现高焦虑个体更偏向于选择高概率低奖赏的保守选项,而放弃选择低概率高奖赏的选项(Miu et al., 2008),表明高焦虑个体难以采取最优策略,难以促使自身累计奖赏的最大化。同样,在风险规避的气球模拟风险任务中(Balloon Analog Risk Task; BART),当个体给气球打气的次数越多,将得到的奖赏金额也越多,但也伴随气球爆炸使所得奖赏清零的风险性也越大(Lauriola et al., 2014)。研究发现,随着个体的焦虑和担忧水平越高,他们过早放弃给气球打气的可能性越大,最终导致失去更多的潜在奖赏(Maner et al., 2007)。类似的研究也发现,焦虑水平与寻求积极强化相关的行为趋近系统(Behaviour Approach System, BAS)呈负相关关系(McNaughton & Corr, 2004),这意味这焦虑障碍个体对待奖赏刺激相关积极强化物的敏感性较弱,在奖赏决策中更加保守,难以实现奖赏最大化的目标。

除此之外,在后续的研究中,Jiang等人(2017)则采用简单的“概率学习”任务范式研究高特质焦虑人群的奖赏学习能力。该范式让高特质焦虑人群在80%:20%的获胜概率选项比的不确定决策环境中通过前期决策的经验积累逐步形成奖赏累计最大化的行为策略。结果发现,在学习过程的前期阶段,高特质焦虑组选择优势选项的比率显著少于低特质焦虑组,表明受特质焦虑的影响,个体需要进行更多的试错才能掌握选项和奖赏之间的概率关联(Jiang et al., 2017)。

上述研究总体表明焦虑障碍与特质焦虑在不同程度导致个体的奖赏学习行为受损,使其在奖赏学习过程中偏离奖赏累积最大化的目标。并且,短暂的焦虑状态也会对个体的奖赏学习带来一定的影响,在未知的环境中,尤其是在波动性较大的不确定环境中,受短暂状态焦虑影响的个体难以做出有效的奖赏学习决策(Hein et al., 2021),具体表现为难以清楚认识环境中的奖赏概率波动和根据环境的变化调整寻求奖赏的行为策略,表明即使是健康人群,其适应学习能力也会受暂时性焦虑情绪的影响。

3.2. 焦虑障碍影响惩罚学习的认知机制

惩罚学习作为强化学习的另一种形式,使个体在现实世界中“吃一堑,长一智”。然而,焦虑个体在惩罚学习中同样存在异常。强化敏感性理论中与规避惩罚强化物相关的行为抑制系统(Behaviour Inhibit System, BIS)提到,BIS更高的个体为了达到避免遭受惩罚的目的,会出现更强烈的抑制性行为(Smits & Boeck, 2006)。而个体的焦虑水平与BIS的敏感性存在正相关关系(Grey & McNaughton, 1982) (Craig et al., 2009)。研究中也发现,焦虑障碍患者更偏向于从消除厌恶刺激,而不是愉快的刺激来改变行为(Corr, 2013) (McNaughton & Gray, 2000)。即使在惩罚风险较低的情况下,焦虑个体还是表现出了过度回避行为(Charpentier et al., 2017)。然而,较高的惩罚敏感性并非是完全非适应性的,Jean-Richard-Dit-Bressel等人(2021)发现对惩罚敏感和不敏感的个体在检测和学习厌恶结果的意志控制力上存在显著差异,对惩罚不敏感的个体在惩罚学习过程中不能有效习得行为与惩罚之间的概率性关系。简而言之,当个体的惩罚敏感性不足时,也会导致自身难以从遭受惩罚的结果中去学习,再一次面临规避惩罚的决策时也难以实现规避惩罚的目标。而高焦虑或焦虑障碍人群则往往存在过高的惩罚敏感性。Browning等人(2015)发现,高特质焦虑群体在惩罚学习任务中,难以根据行为与惩罚之间概率关联的变化而及时调整有效规避惩罚的决策策略(Browning et al., 2015)。之后研究发现,焦虑个体更偏向于根据即时结果来学习规避惩罚,对惩罚结果的学习率更高(Aylward et al., 2020)。对此,Aylward等人(2020)同样以规避惩罚为目标的实验范式研究焦虑人群的惩罚学习机制的实验结果发现,在以规避电击为目标,伴随波动性的不确定的学习环境中,初步的实验结果分析发现焦虑障碍人群在惩罚学习任务中的惩罚学习率更高,意味着该类人群能够更快地从惩罚等负性结果中进行学习,更容易根据最近的负性结果来调整更新自身的行为。然而,在进行深入的分析后发现,焦虑障碍人群的高惩罚学习率同时还伴随着高失效参数(lapse)和高衰退参数(decay),反映该类人群在更容易因负性结果而更新行为的同时,也更容易遗忘过往早期的行为经验。

从现实角度看,在面临潜在惩罚背景中的回避行为具有一定的适应性意义,然而,有研究指出特质焦虑作用下的个体在现实生活中往往存在过度泛化的回避行为,包括在无关惩罚或相对安全的环境中(Klein et al., 2020)。并且,高特质焦虑个体的过度回避行为会随着年龄的增长而加剧,例如,老年个体伴随着焦虑程度提高与相关认知功能衰退的叠加,其在日常决策和社交生活中体现出的回避倾向更为显著。该研究明确地从年龄角度指出了焦虑障碍产生的主要因素。

因此,高焦虑及焦虑障碍人群具有更高的惩罚敏感性,对惩罚概率的高估和对惩罚结果的过度回避,并产生对行为的过度抑制。而这种对于惩罚过度敏感的认知行为模式在决策者面对随机性较强的不确定性决策背景具有一定的适应性,但难以促使决策者基于过往经验总结出最有效的规避惩罚行为策略。然而,单靠观察焦虑障碍个体在高波动性不确定环境中的表现还不足以准确认识其学习机制,未来研究还需结合不同不确定环境背景探讨焦虑障碍人群的学习行为在所处环境中是否具有适应性作用。

4. 焦虑障碍影响学习的神经机制

从神经层面的角度,事件相关电位技术(Event Related Potential, ERP)依靠毫秒级的时间分辨率,能够帮助获取有效表征焦虑障碍个体特异性学习机制的神经标志物,能够更加客观地揭示焦虑维持和恶化的风险因素(Weinberg et al., 2016)。另外,功能性磁共振成像(functional magnetic resonance imaging, fMRI)技术结合ERP技术,分别借助其更高空间分辨率与更精确时间分辨率的优势,对于研究焦虑及焦虑障碍影响下的奖赏学习和惩罚学习相关的特异性神经环路有着极高的科学价值。

4.1. 焦虑障碍影响奖赏学习的神经机制

4.1.1. 焦虑障碍奖赏学习相关的电生理研究

奖赏正波(Reward-related P300, RewP)是一种在奖赏反馈后250~350 ms之间达到峰值的正ERP成分,反映了对比奖赏反馈和惩罚反馈之间差异的处理过程,该成分对反馈的效价敏感,并且相对于消极反馈,积极反馈会诱发更大的RewP成分(Proudfit, 2015)。因此,该成分作为反映大脑奖赏活动非常敏感的一种生理指标,对于探索焦虑障碍对奖赏学习的作用机制具重要的研究价值。例如,高特质焦虑和患广泛性焦虑障碍的儿童诱发的RewP的成分更小(Gu et al., 2010) (Kessel et al., 2015),符合焦虑障碍的奖赏敏感性弱的特性。然而,另外研究发现,社交焦虑儿童在面对社会性反馈时会诱发更大的RewP成分(Bar-Haim et al., 2009) (Lahat et al., 2018),对此,考虑到金钱奖赏和社会奖赏之间反馈性质上的差异,除反馈效价之外,RewP的大小也会受到反馈性质的调节。并且,不同年龄阶段的个体存在的对不同类型反馈的重视度差异可能也是导致RewP成分大小差异的重要原因。因此,RewP成分作为检验焦虑障碍对奖赏学习的客观指标,未来的研究也可以从不同类型奖赏反馈的角度探讨不同阶段焦虑障碍人群的奖赏学习机制异常之处。

奖赏线索可以指导个体决策后对奖赏产生预期,有利于个体在学习的过程中实现最大化奖赏的目标。Cue-P3成分作为在呈现线索刺激后300~600 ms的一种正ERP成分,被认为反应了个体对奖赏刺激的注意分配(Novak et al., 2016)。然而,在奖赏学习中仅发现抑郁症患者的Cue-P3的波幅更小(Song et al., 2019) (Wang et al., 2021),结合焦虑障碍和抑郁症具有一定的共病性(Kalin, 2020),焦虑障碍患者基于奖赏预期的学习异常是否也体现在Cue-P3成分上在未来的研究中值得探讨。

上述两种电生理指标,在研究关于特殊人群在奖赏学习机制中,可以分别作为探索其结果评估和动机程度的神经生物学证据。然而,这类指标在已有的研究中主要被应用于抑郁类人群的研究中,而对于焦虑及焦虑障碍人群的应用研究则相对空缺(Arias-Carrión & Pöppel, 2007)。

4.1.2. 焦虑障碍奖赏学习相关的神经基础研究

焦虑障碍也影响了奖赏学习的大脑环路。大脑的奖赏系统包含了不同的大脑结构,例如中脑(midbrain);腹侧纹状体(ventral striatum);眶额叶(orbital frontal)和中前额叶皮层(mesial prefrontal) (Cox & Witten, 2019) (Berke, 2018)。在奖赏反馈中,无论在静息态还是学习任务中,焦虑障碍个体的纹状体对奖赏的反应减弱)。在奖赏预期中,焦虑障碍个体的尾状核(caudate nucleus)和壳核(putamen)内的活动减弱,这意味着焦虑障碍预期得到奖赏的动机减弱。例如,Bashford-Largo等人(2021)通过观察患广泛性焦虑障碍的青少年在趋近/回避任务范式中的大脑神经活动发现,在涉及奖赏相关的大脑区域中,相比控制组青少年,广泛性焦虑障碍青少年面对奖赏时在尾状核、壳核、中扣带回/中央旁小叶以及额上回和额中回这些区域的活动更弱,并且他们的这些脑区域在面对奖赏和惩罚之间所表现出的差异反应更弱,表明了病理性焦虑对个体在处理奖赏相关信息方面的功能破坏。然而,其他研究发现,当面对潜在价值更高的奖赏线索时,广泛性焦虑个体的尾状核和壳核的活动表现出比健康人群更高的激活程度(Benson et al., 2015),表明奖赏预期的大小可以调节焦虑障碍对奖赏的学习。另外,伏隔核(nucleus accumben)也作为大脑奖赏系统的重要区域,针对社交焦虑人群的研究也发现,在进行社会性奖赏预期时,高社交焦虑个体的伏隔核活动迟钝(Beltzer et al., 2019)。

另外,Grupe和Nitschke (2013)从神经系统的角度,对焦虑影响奖赏学习的机制提出了猜想。他们指出:根据强化学习理论,大脑内的扣带前回皮层(anterior cingulate cortex, ACC)负责评价实际结果与决策则预期结果的差异性,当遇到与预期不符的负反馈时会在ACC内诱发“预期错误信号”,同时指导个体即使调整决策策略。但是,焦虑情绪所引起的生理变化会干扰ACC的激活,致使高焦虑个体不能准确地对结果进行预期。除此之外,在联结学习过程中起重要作用的杏仁核活动也会受到焦虑水平的影响,促使高焦虑者的杏仁核过度活跃,导致其在奖赏学习过程中的联结学习能力受损。

腹侧被盖区(VTA)的多巴胺神经元在构建人类对刺激和奖赏之间的联系中起着重要的介导作用。已有许多研究发现原始奖赏和社会性奖赏能够有效激活该区域的多巴胺神经元(Hernandez & Hoebel, 1988),并且,当通过训练或实验性的操纵将中性刺激与奖赏建立关联后,个体在面临中性刺激时同样会激活VTA的多巴胺神经元(Galaj & Ranaldi, 2018)。因此,对于奖赏学习的研究而言,该区域的激活程度可以作为神经探测点,反映个体在强化学习过程中对奖赏强化的认知关联程度。

上述研究提到了焦虑障碍个体在奖赏加工中多个关键脑区(纹状体、前额叶皮层、ACC、VTA)存在神经活动异常的证据。然而,目前仍然存在局限性,这些研究结果存在不一致性,其中可能受多种调节变量(奖赏类型、任务)和被试类型的影响。另外,虽然实证研究分别发现了涉及焦虑障碍个体在奖赏学习中的关键脑区,但缺乏一个整合多巴胺能系统、预期错误计算(ACC/VTA)、情绪调节(杏仁核)以及目标导向行为(PFC-纹状体环路)的神经计算模型来解释焦虑如何具体破坏奖赏学习过程。对此,未来的研究需要更细致地考虑各类调节变量,通过利用多模态方法(如结合fMRI与EEG)并发展更精细的计算模型来填补焦虑障碍人群神经活动与行为异常之间的鸿沟。

4.2. 焦虑障碍影响惩罚学习的神经机制

4.2.1. 焦虑障碍与惩罚学习相关的电生理研究

反馈相关负性(FRN)是在结果反馈后250~400 ms之间达到峰值的成分(Walsh & Anderson, 2012),FRN成分反映了实际结果与预期结果差异,当个体面对出乎意料的结果时,会比预期结果时诱发的FRN成分更大(Ferdinand et al., 2012),与惩罚反馈相关密切(Sambrook & Goslin, 2015)。在货币赌博的任务中,高焦虑个体在面对惩罚反馈时比低焦虑个体的FRN更小(Balconi & Crivelli, 2010)。对此,基于强化学习理论的解释,人们在不确定的环境中,会根据实际结果和预期结果之间的差异而产生一种预期误差(PE),并利用这种误差来指导后续的学习和行为(Ferdinand et al., 2016),而这种预期误差也相当于一种个体对结果的意料程度,结合焦虑人群对未来容易持悲观态度的特征,当面临负性结果时,反而会更符合他们的预期(He et al., 2017)。P3也是一种在结果反馈呈现后400~600 ms之间达到峰值的正向波(Whitton et al., 2015),在决策的过程中,P3成分的变化反映了人们对根据结果而调整信息的程度(San Martín et al., 2013)。另外,该成分还与注意力分配策略的调整和行为抑制有关(Glazer et al., 2018) (Bruin et al., 2000)。当焦虑障碍在抑制与任务无关的刺激时,其P3成分会显著更小(Huster et al., 2013),这意味着焦虑障碍患者可能习得最优化决策策略的过程中,难以有效地抑制与任务无关刺激的干扰。另外,在Xia等人(2021)的研究发现,在概率逆转的实验范式中,高特质焦虑人群比低特质焦虑人群在奖赏学习过程中存在更差的学习行为表现,具体表现为,高特质焦虑人群在面对金钱遗漏的结果后,在之后做出行为变更的几率更小,同时在该情况下所探测到的P3更小。一定程度上反映了在高特质焦虑的影响下,个体很难灵活调整策略以在未来决策中获得更好结果,同时,高特质焦虑人群在概率逆转实验范式中的P3也与其行为表现存在一定关联,表明P3在一定程度上可以反映个体在不确定环境中的决策灵活性(Xia et al., 2021)。

关联性负变波(contingent-negative variation, CNV),是一种伴随着“警告刺激”而出现的与动作准备相关的负波,是注意和觉醒的心理生理学标志。CNV可以分为早期和晚期两部分,分别在动作前500 ms和1500~2000 ms这两段时间产生,该成分被认为其峰值和波幅受到动机和努力程度的影响,例如在接受奖惩时的波幅增强(Bechor et al., 2019)。而已有研究表明,高焦虑人群在面对惩罚刺激时,CNV的振幅更大,验证了高焦虑人群对消极刺激会分配更多的注意力资源(Zhang et al., 2017),说明高焦虑人群早在惩罚学习的预期阶段已经出现注意资源分配不均。

4.2.2. 焦虑障碍与惩罚学习相关的神经基础研究

杏仁核、腹侧纹状体和眶额叶皮层与惩罚学习有关(Carretié et al., 2009)。焦虑障碍个体在面对具有威胁性的惩罚结果时,表现出杏仁核活动的过度活跃(Gottfried et al., 2002) (Gottfried et al., 2003),这表明焦虑障碍个体在不确定的惩罚学习与异常的情绪反应有关。腹侧纹状体和眶额叶皮层,是负责个体注意力资源分配和对未来事件提供主观价值的重要脑区(O’Doherty et al., 2002) (Tobler et al., 2006)。对此,焦虑的不确定性和预期加工模型提出,焦虑障碍个体对威胁性刺激所表现出杏仁核的高度激活,会介导腹侧纹状体和眶额叶皮层的活动,使其对潜在的惩罚刺激将分配更多的注意力和产生高估厌恶结果发生的主观预期,使得焦虑障碍个体形成威胁性注意偏向和过度警惕的认知行为模式,在以规避惩罚为目的的学习过程中调用过多的认知资源,导致学习的异常(Ghashghaei & Barbas, 2002) (Haber & Knutson, 2010)。

预期误差作为促进个体强化学习的重要条件,而腹侧纹状体、腹内侧前额叶皮层和后扣带皮层作为反馈过程中的预期误差信号传导的重要区域(Clithero & Rangel, 2014)。对此,White等人(2017)通过观察广泛性焦虑障碍个体在完成规避厌恶刺激的任务时的脑成像结果发现,相比健康个体,广泛性焦虑障碍个体在反馈阶段的预期误差与腹内侧前额叶皮层、腹侧纹状体和其他涉及决策的脑区的活动之间的相关性明显降低,并且他们在面对惩罚时的预期误差与双侧豆状核/壳核的活动之间的相关性也明显降低,结合他们基于强化学习能力受损的行为表现,反映了焦虑障碍个体在运用预期误差来指导后续行为进行学习的相关功能脑区存在异常,导致相应功能脑区介导预期误差失效,使个体难以整合过往的成败经验进行有效学习。

背侧前扣带回作为大脑系统中处理负面情绪的中心节点(Shackman et al., 2016),同时也是计算不确定环境下适应学习率来促进强化学习的重要脑区(Rushworth et al., 2011)。对此,Piray等人(2019)通过社会性概率逆转任务范式探索高社交焦虑个体的学习适应性的研究发现,在面对情绪(愤怒面孔)线索时,低社交焦虑个体的背侧前扣带皮层活动与其学习率呈现出明显的相关关系,而高社交焦虑个体则不存在这种相关性,结合该类人群在学习任务中行为的低动态性特征,表明了高社交焦虑作用下的个体在适应学习过程与背侧前扣带回皮层活动之间的断层现象。一定程度上反映了焦虑对个体面对厌恶性刺激进行适应性学习的干扰作用。

腹侧被盖区不仅是表征奖赏学习的重要区域,同样对惩罚学习也具备一定的表征功能,有研究表明,腹侧被盖区和被内侧前额叶皮层的神经活动能够有效反映个体的行为与惩罚风险之间的关系(Park & Moghaddam, 2016)。在伴有惩罚风险的奖赏学习任务中,持续的暴露在易诱发焦虑的压力环境中会使得前额叶皮层中的多巴胺进行敏感性的释放(Del Arco et al., 2017)。当个体在纯粹的奖赏学习任务中,其腹侧被盖区与被内侧前额叶的活动具有一定的同步性,而当奖赏学习任务中加入惩罚的偶发因素后,个体腹侧被盖区和被内侧前额叶的活动同步性明显减弱。但是提出该结论的研究主要通过比较实验对象在伴有和不伴有潜在惩罚的奖赏学习任务中的实验结果所发现,而这些脑区在完全以规避惩罚为目的的惩罚学习过程中的活动如何,未来还需深入的研究来证实。

同样,上述关于焦虑障碍人群的电生理和神经基础的研究也存在着由于任务类型和被试类型的差异而导致研究结果存在差异性,难以整合为一套能够有效解释焦虑障碍人群惩罚学习机制异常的神经计算模型。总而言之,未来研究可以基于分离性的角度,结合更精细的计算模型来分别探讨焦虑障碍人群在奖赏学习和惩罚学习过程中独特性的计算行为和认知神经机制,构建有效的焦虑障碍人群的奖赏学习和惩罚学习机制模型。

5. 研究展望

梳理焦虑影响奖赏学习和惩罚学习相关的研究,焦虑及焦虑障碍在认知上表现出对奖赏的低敏感和惩罚的高敏感可能是其产生学习障碍的原因。从神经机制的角度上,也发现焦虑个体与奖赏和惩罚学习有相关的电生理成分和神经基础,主要表现为与奖赏相关的电生理成分和脑区功能减弱,与惩罚相关的电生理成分以及相关脑区功能增强。虽然焦虑对奖惩学习取得了一定的研究进展,但仍有如下问题值得探讨:

首先,焦虑障碍个体具有无法忍受不确定性的特点,在不确定环境中难以习得最优的决策,进而导致病理性担忧和广泛性焦虑障碍(Sharp et al., 2022),而现实中,人们常需要在不确定的环境中进行学习和决策。现有研究中,被试通过指导语被动地对行为与反馈的关系进行学习。而在不确定环境中,个体主要通过与环境的交互进行主动学习。并且,不确定环境也存在多样性的特征,例如,实证研究中常用的简单概率学习任务和概率反转学习任务分别以低波动性和高波动性的不确定性环境为学习背景,而这种存在波动性差异的不确定环境也与个体不同程度学习率适配(低波动性不确定环境以较低学习率为适应性学习;高波动性不确定环境以较高学习率为适应性学习) (Browning et al., 2015; Aylward et al., 2020)。因此,结合人类在不确定环境中进行学习和决策的普遍性和不确定环境自身的复杂性,焦虑障碍个体在不确定环境中如何主动地学习奖赏和惩罚有待深入考察。

其次,焦虑障碍在奖赏和惩罚学习过程中有着共同的神经基础,在奖赏和惩罚学习任务中均涉及杏仁核、纹状体和眶额叶的活动。然而,有关奖赏学习方面的大部分研究主要以抑郁类人群为研究对象,并普遍发现抑郁类人群的多巴胺信号减弱和对奖赏信号不敏感(Pedersen & Frank, 2020)。考虑到焦虑障碍和抑郁具有高共病率的情况,后续研究还需要量化导致焦虑人群在奖赏学习方面的异常结果中抑郁特质的作用,尽可能厘清焦虑与抑郁对奖赏学习以及惩罚学习的影响。另外,还需考虑强化物多性质的特征,奖赏和惩罚的大小、时间(预期或反馈)、类型(金钱或社会刺激)对焦虑个体的学习及其相应的脑机制产生何种影响仍需深入考察,也值得探讨。

再次,以往对焦虑障碍的认知行为模式的研究,大多对行为反应的平均,往往难以对心理加工过程进行精细划分。而新兴的计算模型(如强化飘移扩散模型,Reinforcement Learning Drift Difussion Model),整合了强化学习模型和漂移扩散模型两者的优势,不仅利用每个试次的信息拟合学习率,也可以量化谨慎性、反应偏好等心理过程(Ratcliff et al., 2016) (Robichaud et al., 2019)。可以利用计算模型精确展露焦虑障碍影响学习的认知过程。

最后,焦虑障碍患者在学习过程中,其异常的学习行为表现背后同时往往还伴随着电生理活动和脑区域活动的异常。经颅磁刺激(Transcranial Magnetic Stimulation, TMS)作为一种可针对性调节大脑具体区域神以及相关功能网络神经活动的一种技术,对于焦虑障碍的治疗具有重要意义(Cheng et al., 2022)。但同时,认知行为训练作为一种低成本、低创性的行为疗法,针对焦虑障碍患者学习过程中的注意力、结果评估等方面具有良好的校正效果(Goldin et al., 2007)。未来研究可尝试使用经颅磁刺激对奖赏和惩罚学习共有的神经基础(杏仁核、纹状体和眶额叶)进行干预,结合认知行为训练,以提高焦虑个体的学习能力,使其重新适应环境,提高生活质量。

参考文献

[1] American Psychiatric Association (APA) (2013). Diagnostic and Statistical Manual of Mental Disorders: DSM-5. American Psychiatric Association.
[2] Arias-Carrión, Ó., & Pöppel, E. (2007). Dopamine, Learning, and Reward-Seeking Behavior. Acta Neurobiologiae Experimentalis, 67, 481-488.
https://doi.org/10.55782/ane-2007-1664
[3] Aylward, J., Hales, C., Robinson, E., & Robinson, O. J. (2020). Translating a Rodent Measure of Negative Bias into Humans: The Impact of Induced Anxiety and Unmedicated Mood and Anxiety Disorders. Psychological Medicine, 50, 237-246.
https://doi.org/10.1017/s0033291718004117
[4] Bach, D. R., & Dolan, R. J. (2012). Knowing How Much You Don’t Know: A Neural Organization of Uncertainty Estimates. Nature Reviews Neuroscience, 13, 572-586.
https://doi.org/10.1038/nrn3289
[5] Balconi, M., & Crivelli, D. (2010). FRN and P300 ERP Effect Modulation in Response to Feedback Sensitivity: The Contribution of Punishment-Reward System (BIS/BAS) and Behaviour Identification of Action. Neuroscience Research, 66, 162-172.
https://doi.org/10.1016/j.neures.2009.10.011
[6] Bar-Haim, Y., Fox, N. A., Benson, B., Guyer, A. E., Williams, A., Nelson, E. E. et al. (2009). Neural Correlates of Reward Processing in Adolescents with a History of Inhibited Temperament. Psychological Science, 20, 1009-1018.
https://doi.org/10.1111/j.1467-9280.2009.02401.x
[7] Bashford-Largo, J., Aloi, J., Zhang, R., Bajaj, S. et al. (2021). Reduced Neural Differentiation of Rewards and Punishment during Passive Avoidance Learning in Adolescents with Generalized Anxiety Disorder. Depression and Anxiety, 38, 794-803.
https://doi.org/10.1002/da.23150
[8] Bechor, M., Ramos, M. L., Crowley, M. J., Silverman, W. K., Pettit, J. W., & Reeb-Sutherland, B. C. (2019). Neural Correlates of Attentional Processing of Threat in Youth with and without Anxiety Disorders. Journal of Abnormal Child Psychology, 47, 119-129.
https://doi.org/10.1007/s10802-018-0424-8
[9] Bekker, H. L., Legare, F., Stacey, D., O’Connor, A., & Lemyre, L. (2003). Is Anxiety a Suitable Measure of Decision Aid Effectiveness: A Systematic Review? Patient Education and Counseling, 50, 255-262.
https://doi.org/10.1016/s0738-3991(03)00045-4
[10] Beltzer, M. L., Adams, S., Beling, P. A., & Teachman, B. A. (2019). Social Anxiety and Dynamic Social Reinforcement Learning in a Volatile Environment. Clinical Psychological Science, 7, 1372-1388.
https://doi.org/10.1177/2167702619858425
[11] Benson, B. E., Guyer, A. E., Nelson, E. E., Pine, D. S., & Ernst, M. (2015). Role of Contingency in Striatal Response to Incentive in Adolescents with Anxiety. Cognitive, Affective, & Behavioral Neuroscience, 15, 155-168.
https://doi.org/10.3758/s13415-014-0307-6
[12] Berke, J. D. (2018). What Does Dopamine Mean? Nature Neuroscience, 21, 787-793.
https://doi.org/10.1038/s41593-018-0152-y
[13] Blanchard, R. J., & Blanchard, D. C. (1989). Antipredator Defensive Behaviors in a Visible Burrow System. Journal of Comparative Psychology, 103, 70-82.
https://doi.org/10.1037/0735-7036.103.1.70
[14] Brown, M., Robinson, L., Campione, G. C., Wuensch, K., Hildebrandt, T., & Micali, N. (2017). Intolerance of Uncertainty in Eating Disorders: A Systematic Review and Meta‐Analysis. European Eating Disorders Review, 25, 329-343.
https://doi.org/10.1002/erv.2523
[15] Browning, M., Behrens, T. E., Jocham, G., O’Reilly, J. X., & Bishop, S. J. (2015). Anxious Individuals Have Difficulty Learning the Causal Statistics of Aversive Environments. Nature Neuroscience, 18, 590-596.
https://doi.org/10.1038/nn.3961
[16] Bruin, K., Kenemans, J. L.,Verbaten, M. N. et al. (2000). Habituation: An Event-Related Potential and Dipole Source Analysis Study. International Journal of Psychophysiology, 36, 199-209.
https://doi.org/10.1016/s0167-8760(99)00114-2
[17] Carretié, L., Albert, J., López-Martín, S., & Tapia, M. (2009). Negative Brain: An Integrative Review on the Neural Processes Activated by Unpleasant Stimuli. International Journal of Psychophysiology, 71, 57-63.
https://doi.org/10.1016/j.ijpsycho.2008.07.006
[18] Charpentier, C. J., Aylward, J., Roiser, J. P., & Robinson, O. J. (2017). Enhanced Risk Aversion, but Not Loss Aversion, in Unmedicated Pathological Anxiety. Biological Psychiatry, 81, 1014-1022.
https://doi.org/10.1016/j.biopsych.2016.12.010
[19] Cheng, Y., Kuo, P., Su, M., & Huang, W. (2022). The Efficacy of Non-Invasive, Non-Convulsive Electrical Neuromodulation on Depression, Anxiety and Sleep Disturbance: A Systematic Review and Meta-analysis. Psychological Medicine, 52, 801-812.
https://doi.org/10.1017/s0033291721005560
[20] Clithero, J. A., & Rangel, A. (2014). Informatic Parcellation of the Network Involved in the Computation of Subjective Value. Social Cognitive and Affective Neuroscience, 9, 1289-1302.
https://doi.org/10.1093/scan/nst106
[21] Cohen, M. X., Wilmes, K. A., & van de Vijver, I. (2011). Cortical Electrophysiological Network Dynamics of Feedback Learning. Trends in Cognitive Sciences, 15, 558-566.
https://doi.org/10.1016/j.tics.2011.10.004
[22] Corr, P. J. (2013). Approach and Avoidance Behaviour: Multiple Systems and Their Interactions. Emotion Review, 5, 285-290.
https://doi.org/10.1177/1754073913477507
[23] Cox, J., & Witten, I. B. (2019). Striatal Circuits for Reward Learning and Decision-Making. Nature Reviews Neuroscience, 20, 482-494.
https://doi.org/10.1038/s41583-019-0189-2
[24] Craig, K. J., Chamberlain, S. R., Stein, D. J. et al. (2009). The Neuropsychology of Anxiety Disorders. In D. J. Stein, E. Hollander, & B. O. Rothbaum (Eds.), Textbook of Anxiety Disorders (pp. 87-102). American Psychiatric Publishing, Inc.
[25] Del Arco, A., Park, J., Wood, J., Kim, Y., & Moghaddam, B. (2017). Adaptive Encoding of Outcome Prediction by Prefrontal Cortex Ensembles Supports Behavioral Flexibility. The Journal of Neuroscience, 37, 8363-8373.
https://doi.org/10.1523/jneurosci.0450-17.2017
[26] Delgado, M. R., Nystrom, L. E., Fissell, C., Noll, D. C., & Fiez, J. A. (2000). Tracking the Hemodynamic Responses to Reward and Punishment in the Striatum. Journal of Neurophysiology, 84, 3072-3077.
https://doi.org/10.1152/jn.2000.84.6.3072
[27] Fehr, E., & Fischbacher, U. (2003). The Nature of Human Altruism. Nature, 425, 785-791.
https://doi.org/10.1038/nature02043
[28] Ferdinand, N. K., Becker, A. M. W., Kray, J., & Gehring, W. J. (2016). Feedback Processing in Children and Adolescents: Is There a Sensitivity for Processing Rewarding Feedback? Neuropsychologia, 82, 31-38.
https://doi.org/10.1016/j.neuropsychologia.2016.01.007
[29] Ferdinand, N. K., Mecklinger, A., Kray, J., & Gehring, W. J. (2012). The Processing of Unexpected Positive Response Outcomes in the Mediofrontal Cortex. The Journal of Neuroscience, 32, 12087-12092.
https://doi.org/10.1523/jneurosci.1410-12.2012
[30] Galaj, E., & Ranaldi, R. (2018). The Strength of Reward-Related Learning Depends on the Degree of Activation of Ventral Tegmental Area Dopamine Neurons. Behavioural Brain Research, 348, 65-73.
https://doi.org/10.1016/j.bbr.2018.04.012
[31] Ghashghaei, H. T., & Barbas, H. (2002). Pathways for Emotion: Interactions of Prefrontal and Anterior Temporal Pathways in the Amygdala of the Rhesus Monkey. Neuroscience, 115, 1261-1279.
https://doi.org/10.1016/s0306-4522(02)00446-3
[32] Glazer, J. E., Kelley, N. J., Pornpattananangkul, N., Mittal, V. A., & Nusslock, R. (2018). Beyond the FRN: Broadening the Time-Course of EEG and ERP Components Implicated in Reward Processing. International Journal of Psychophysiology, 132, 184-202.
https://doi.org/10.1016/j.ijpsycho.2018.02.002
[33] Goldin, P. R., McRae, K., Ramel, W., & Gross, J. J. (2007). The Neural Bases of Emotion Regulation: Reappraisal and Suppression of Negative Emotion. Biological Psychiatry, 63, 577-586.
https://doi.org/10.1016/j.biopsych.2007.05.031
[34] Gottfried, J. A., O’Doherty, J., & Dolan, R. J. (2002). Appetitive and Aversive Olfactory Learning in Humans Studied Using Event-Related Functional Magnetic Resonance Imaging. The Journal of Neuroscience, 22, 10829-10837.
https://doi.org/10.1523/jneurosci.22-24-10829.2002
[35] Gottfried, J. A., O’Doherty, J., & Dolan, R. J. (2003). Encoding Predictive Reward Value in Human Amygdala and Orbitofrontal Cortex. Science, 301, 1104-1107.
https://doi.org/10.1126/science.1087919
[36] Grey, J. A., & McNaughton, N. (1982). The Neuropsychology of Anxiety: An Enquiry into the Functions of the Septo-Hippocampal System. Oxford University Press.
[37] Grupe, D. W., & Nitschke, J. B. (2013). Uncertainty and Anticipation in Anxiety: An Integrated Neurobiological and Psychological Perspective. Nature Reviews Neuroscience, 14, 488-501.
https://doi.org/10.1038/nrn3524
[38] Gu, R., Huang, Y., & Luo, Y. (2010). Anxiety and Feedback Negativity. Psychophysiology, 47, 961-967.
https://doi.org/10.1111/j.1469-8986.2010.00997.x
[39] Haber, S. N., & Knutson, B. (2010). The Reward Circuit: Linking Primate Anatomy and Human Imaging. Neuropsychopharmacology, 35, 4-26.
https://doi.org/10.1038/npp.2009.129
[40] He, W., Qi, A., Wang, Q., Wu, H., Zhang, Z., Gu, R. et al. (2017). Abnormal Reward and Punishment Sensitivity Associated with Internet Addicts. Computers in Human Behavior, 75, 678-683.
https://doi.org/10.1016/j.chb.2017.06.017
[41] Hein, T. P., de Fockert, J., & Ruiz, M. H. (2021). State Anxiety Biases Estimates of Uncertainty and Impairs Reward Learning in Volatile Environments. NeuroImage, 224, Article ID: 117424.
https://doi.org/10.1016/j.neuroimage.2020.117424
[42] Henrich, J., Heine, S. J., & Norenzayan, A. (2010). The Weirdest People in the World? Behavioral and Brain Sciences, 33, 61-83.
https://doi.org/10.1017/s0140525x0999152x
[43] Hernandez, L., & Hoebel, B. G. (1988). Food Reward and Cocaine Increase Extracellular Dopamine in the Nucleus Accumbens as Measured by Microdialysis. Life Sciences, 42, 1705-1712.
https://doi.org/10.1016/0024-3205(88)90036-7
[44] Huang, Y., Wang, Y., Wang, H., Liu, Z., Yu, X., Yan, J. et al. (2019). Prevalence of Mental Disorders in China: A Cross-Sectional Epidemiological Study. The Lancet Psychiatry, 6, 211-224.
https://doi.org/10.1016/s2215-0366(18)30511-x
[45] Huster, R. J., Enriquez-Geppert, S., Lavallee, C. F., Falkenstein, M., & Herrmann, C. S. (2013). Electroencephalography of Response Inhibition Tasks: Functional Networks and Cognitive Contributions. International Journal of Psychophysiology, 87, 217-233.
https://doi.org/10.1016/j.ijpsycho.2012.08.001
[46] Jean-Richard-Dit-Bressel, P., Lee, J. C., Liew, S. X., Weidemann, G., Lovibond, P. F., & McNally, G. P. (2021). Punishment Insensitivity in Humans Is Due to Failures in Instrumental Contingency Learning. eLife, 10, e69594.
https://doi.org/10.7554/eLife.69594.sa2
[47] Jiang, D., Zhang, D., Chen, Y., He, Z., Gao, Q., Gu, R. et al. (2017). Trait Anxiety and Probabilistic Learning: Behavioral and Electrophysiological Findings. Biological Psychology, 132, 17-26.
https://doi.org/10.1016/j.biopsycho.2017.10.010
[48] Kalin, N. H. (2020). The Critical Relationship between Anxiety and Depression. American Journal of Psychiatry, 177, 365-367.
https://doi.org/10.1176/appi.ajp.2020.20030305
[49] Kessel, E. M., Kujawa, A., Hajcak Proudfit, G., & Klein, D. N. (2015). Neural Reactivity to Monetary Rewards and Losses Differentiates Social from Generalized Anxiety in Children. Journal of Child Psychology and Psychiatry, 56, 792-800.
https://doi.org/10.1111/jcpp.12355
[50] Klein, Z., Shner, G., Ginat-Frolich, R., Vervliet, B., & Shechner, T. (2020). The Effects of Age and Trait Anxiety on Avoidance Learning and Its Generalization. Behaviour Research and Therapy, 129, Article ID: 103611.
https://doi.org/10.1016/j.brat.2020.103611
[51] Kubanek, J., Snyder, L. H., & Abrams, R. A. (2015). Reward and Punishment Act as Distinct Factors in Guiding Behavior. Cognition, 139, 154-167.
https://doi.org/10.1016/j.cognition.2015.03.005
[52] Lahat, A., Benson, B. E., Pine, D. S. et al. (2018). Neural Responses to Reward in Childhood: Relations to Early Behavioral Inhibition and Social Anxiety. Social Cognitive and Affective Neuroscience, 13, 281-289.
[53] Lauriola, M., Panno, A., Levin, I. P., & Lejuez, C. W. (2014). Individual Differences in Risky Decision Making: A Meta‐analysis of Sensation Seeking and Impulsivity with the Balloon Analogue Risk Task. Journal of Behavioral Decision Making, 27, 20-36.
https://doi.org/10.1002/bdm.1784
[54] Maner, J. K., Richey, J. A., Cromer, K., Mallott, M., Lejuez, C. W., Joiner, T. E. et al. (2007). Dispositional Anxiety and Risk-Avoidant Decision-making. Personality and Individual Differences, 42, 665-675.
https://doi.org/10.1016/j.paid.2006.08.016
[55] Mathews, A., & MacLeod, C. (2005). Cognitive Vulnerability to Emotional Disorders. Annual Review of Clinical Psychology, 1, 167-195.
https://doi.org/10.1146/annurev.clinpsy.1.102803.143916
[56] McEvoy, P. M., & Mahoney, A. E. J. (2012). To Be Sure, to Be Sure: Intolerance of Uncertainty Mediates Symptoms of Various Anxiety Disorders and Depression. Behavior Therapy, 43, 533-545.
https://doi.org/10.1016/j.beth.2011.02.007
[57] McNaughton, N., & Corr, P. J. (2004). A Two-Dimensional Neuropsychology of Defense: Fear/anxiety and Defensive Distance. Neuroscience & Biobehavioral Reviews, 28, 285-305.
https://doi.org/10.1016/j.neubiorev.2004.03.005
[58] McNaughton, N., & Corr, P. J. (2008). The Neuropsychology of Fear and Anxiety: A Foundation for Reinforcement Sensitivity Theory. In P. J. Corr (Ed.), The Reinforcement Sensitivity Theory of Personality (pp. 44-94). Cambridge University Press.
https://doi.org/10.1017/cbo9780511819384.003
[59] McNaughton, N., & Gray, J. A. (2000). Anxiolytic Action on the Behavioural Inhibition System Implies Multiple Types of Arousal Contribute to Anxiety. Journal of Affective Disorders, 61, 161-176.
https://doi.org/10.1016/S0165-0327(00)00344-X
[60] Miu, A. C., Heilman, R. M., & Houser, D. (2008). Anxiety Impairs Decision-Making: Psychophysiological Evidence from an Iowa Gambling Task. Biological Psychology, 77, 353-358.
https://doi.org/10.1016/j.biopsycho.2007.11.010
[61] Novak, B. K., Novak, K. D., Lynam, D. R., & Foti, D. (2016). Individual Differences in the Time Course of Reward Processing: Stage-Specific Links with Depression and Impulsivity. Biological Psychology, 119, 79-90.
https://doi.org/10.1016/j.biopsycho.2016.07.008
[62] O’Doherty, J. P., Deichmann, R., Critchley, H. D., & Dolan, R. J. (2002). Neural Responses during Anticipation of a Primary Taste Reward. Neuron, 33, 815-826.
https://doi.org/10.1016/s0896-6273(02)00603-7
[63] Park, J., & Moghaddam, B. (2016). Impact of Anxiety on Prefrontal Cortex Encoding of Cognitive Flexibility. Neuroscience, 345, 193-202.
https://doi.org/10.1016/j.neuroscience.2016.06.013
[64] Pedersen, M. L., & Frank, M. J. (2020). Simultaneous Hierarchical Bayesian Parameter Estimation for Reinforcement Learning and Drift Diffusion Models: A Tutorial and Links to Neural Data. Computational Brain & Behavior, 3, 458-471.
https://doi.org/10.1007/s42113-020-00084-w
[65] Peterson, D. A., Lotz, D. T., Halgren, E., Sejnowski, T. J., & Poizner, H. (2011). Choice Modulates the Neural Dynamics of Prediction Error Processing during Rewarded Learning. NeuroImage, 54, 1385-1394.
https://doi.org/10.1016/j.neuroimage.2010.09.051
[66] Piray, P., Ly, V., Roelofs, K., Cools, R., & Toni, I. (2019). Emotionally Aversive Cues Suppress Neural Systems Underlying Optimal Learning in Socially Anxious Individuals. The Journal of Neuroscience: The Official Journal of the Society for Neuroscience, 39, 1445-1456.
https://doi.org/10.1523/JNEUROSCI.1394-18.2018
[67] Proudfit, G. H. (2015). The Reward Positivity: From Basic Research on Reward to a Biomarker for Depression. Psychophysiology, 52, 449-459.
https://doi.org/10.1111/psyp.12370
[68] Ratcliff, R., Smith, P. L., Brown, S. D., & McKoon, G. (2016). Diffusion Decision Model: Current Issues and History. Trends in Cognitive Sciences, 20, 260-281.
https://doi.org/10.1016/j.tics.2016.01.007
[69] Robichaud, M., Koerner, N., & Dugas, M. J. (2019). Cognitive Behavioral Treatment for Generalized Anxiety Disorder: From Science to Practice. Routledge.
[70] Rosen, J. B., & Schulkin, J. (1998). From Normal Fear to Pathological Anxiety. Psychological Review, 105, 325-350.
https://doi.org/10.1037/0033-295x.105.2.325
[71] Rushworth, M. F., Noonan, M. P., Boorman, E. D., Walton, M. E., & Behrens, T. E. (2011). Frontal Cortex and Reward Guided Learning and Decision-Making. Neuron, 70, 1054-1069.
https://doi.org/10.1016/j.neuron.2011.05.014
[72] Sambrook, T. D., & Goslin, J. (2015). A Neural Reward Prediction Error Revealed by a Meta-Analysis of ERPs Using Great Grand Averages. Psychological Bulletin, 141, 213-235.
https://doi.org/10.1037/bul0000006
[73] San Martín, R., Appelbaum, L. G., Pearson, J. M., Huettel, S. A., & Woldorff, M. G. (2013). Rapid Brain Responses Independently Predict Gain Maximization and Loss Minimization during Economic Decision Making. The Journal of Neuroscience, 33, 7011-7019.
https://doi.org/10.1523/jneurosci.4242-12.2013
[74] Shackman, A. J., Tromp, D. P. M., Stockbridge, M. D., Kaplan, C. M., Tillman, R. M., & Fox, A. S. (2016). Dispositional Negativity: An Integrative Psychological and Neurobiological Perspective. Psychological Bulletin, 142, 1275-1314.
https://doi.org/10.1037/bul0000073
[75] Sharp, P. B., Russek, E. M., Huys, Q. J., Dolan, R. J., & Eldar, E. (2022). Humans Perseverate on Punishment Avoidance Goals in Multigoal Reinforcement Learning. eLife, 11, e74402.
https://doi.org/10.7554/elife.74402
[76] Smits, D. J. M., & Boeck, P. D. (2006). From BIS/BAS to the Big Five. European Journal of Personality, 20, 255-270.
https://doi.org/10.1002/per.583
[77] Song, W., Li, H., Guo, T., Jiang, S., & Wang, X. (2019). Effect of Affective Reward on Cognitive Event‐Related Potentials and Its Relationship with Psychological Pain and Suicide Risk among Patients with Major Depressive Disorder. Suicide and Life-Threatening Behavior, 49, 1290-1306.
https://doi.org/10.1111/sltb.12524
[78] Sutton, R. S., & Barto, A. G. (2018). Reinforcement Learning: An Introduction. MIT Press.
[79] Sylvester, C. M., Corbetta, M., Raichle, M. E., Rodebaugh, T. L., Schlaggar, B. L., Sheline, Y. I. et al. (2012). Functional Network Dysfunction in Anxiety and Anxiety Disorders. Trends in Neurosciences, 35, 527-535.
https://doi.org/10.1016/j.tins.2012.04.012
[80] Tobler, P. N., O’Doherty, J. P., Dolan, R. J., & Schultz, W. (2006). Human Neural Learning Depends on Reward Prediction Errors in the Blocking Paradigm. Journal of Neurophysiology, 95, 301-310.
https://doi.org/10.1152/jn.00762.2005
[81] Walsh, M. M., & Anderson, J. R. (2012). Learning from Experience: Event-Related Potential Correlates of Reward Processing, Neural Adaptation, and Behavioral Choice. Neuroscience & Biobehavioral Reviews, 36, 1870-1884.
https://doi.org/10.1016/j.neubiorev.2012.05.008
[82] Wang, X., He, K., Chen, T., Shi, B., Yang, J., Geng, W. et al. (2021). Therapeutic Efficacy of Connectivity‐Directed Transcranial Magnetic Stimulation on Anticipatory Anhedonia. Depression and Anxiety, 38, 972-984.
https://doi.org/10.1002/da.23188
[83] Weinberg, A., Meyer, A., Hale‐Rude, E., Perlman, G., Kotov, R., Klein, D. N. et al. (2016). Error‐Related Negativity (ERN) and Sustained Threat: Conceptual Framework and Empirical Evaluation in an Adolescent Sample. Psychophysiology, 53, 372-385.
https://doi.org/10.1111/psyp.12538
[84] White, S. F., Geraci, M., Lewis, E., Leshin, J., Teng, C., Averbeck, B. et al. (2017). Prediction Error Representation in Individuals with Generalized Anxiety Disorder during Passive Avoidance. American Journal of Psychiatry, 174, 110-117.
https://doi.org/10.1176/appi.ajp.2016.15111410
[85] Whitton, A. E., Treadway, M. T., & Pizzagalli, D. A. (2015). Reward Processing Dysfunction in Major Depression, Bipolar Disorder and Schizophrenia. Current Opinion in Psychiatry, 28, 7-12.
https://doi.org/10.1097/yco.0000000000000122
[86] Xia, L., Xu, P., Yang, Z., Gu, R., & Zhang, D. (2021). Impaired Probabilistic Reversal Learning in Anxiety: Evidence from Behavioral and ERP Findings. NeuroImage: Clinical, 31, Article ID: 102751.
https://doi.org/10.1016/j.nicl.2021.102751
[87] Zhang, Y., Li, Q., Wang, Z., Liu, X., & Zheng, Y. (2017). Temporal Dynamics of Reward Anticipation in the Human Brain. Biological Psychology, 128, 89-97.
https://doi.org/10.1016/j.biopsycho.2017.07.011