1. 引言
在课堂教学、团队协作等真实社会场景中,个体时常需要快速解读周围群体的整体情绪氛围,以调整自身行为。这种能力对于社会适应至关重要。然而,面对多张面孔,人类的注意资源有限,无法精细加工每张面孔的情绪细节(Whitney & Leib, 2018)。那么,个体如何形成对群体情绪的概括印象?这种印象是准确的吗?
早期情绪识别研究多聚焦于孤立面孔。近年来,“集群编码”理论的兴起,将关注点转向了群体水平的情绪统计表征(如平均情绪强度)。研究发现,个体能够快速(50 ms内)且相当准确地提取面孔集合的平均情绪(Haberman & Whitney, 2009)。但越来越多的证据表明,这种加工并非完全客观,而是存在一定的认知偏差,其中最引人关注的是“情绪放大效应”,即个体倾向于高估群体平均情绪的强度(Goldenberg et al., 2021)。
与此同时,研究范式与视角也在不断拓展。一方面,研究者开始探索在时间压力较小的自由观看情境下,个体如何采样并整合多源情绪证据进行决策(Ngai et al., 2024)。另一方面,为提高研究的生态效度,研究者们开始关注身体姿势、语音等非面部线索的整合,因为真实社交中的情绪感知是面孔、身体姿势和语境共同构成的整体。
本文旨在对群体情绪感知,特别是其偏差与整合机制的研究进行系统综述。我们将首先梳理集群编码的理论基础与情绪放大效应的核心发现;其次,深入探讨放大效应的认知机制争议及影响因素;接着,综述研究从快速感知到决策过程、从静态面孔到多线索整合的拓展;最后,评述现有局限并展望未来方向。
2. 理论基础与核心发现:集群编码与情绪放大效应
2.1. 集群编码:高效社会认知的基础框架
集群编码是指个体对一组刺激的整体统计特征进行快速感知和汇总的能力(Whitney & Leib, 2018)。它不同于格式塔知觉,其核心在于提取集合的统计属性,如平均值、方差,而非整体结构。在视觉加工的不同层次上,个体可以提取低级特征的平均值,如一组圆圈的平均大小,也能提取高级社会信息的平均值,如一组面孔的平均情绪。在社会情绪感知领域,集群编码具体体现为情绪面孔集群编码,即个体能够快速获得多张面孔所表达情绪的平均水平(Haberman & Whitney, 2009)。
关于其加工机制,当前主要有两种理论视角。一是分散式注意模型,认为系统通过对多个信息源进行平均来降低噪声,从而获得稳定的整体估计(Baek & Chong, 2020)。二是选择性注意或加权平均模型,该模型指出,在整合过程中,系统并非平等对待所有刺激,而是对某些特征显著或具有社会重要性的项目分配更多的注意权重。例如,在情绪面孔集合中,情绪更强烈的面孔可能吸引更多注意,从而在计算平均情绪时被赋予更高的权重,这直接导致了情绪强度被高估的放大效应(Goldenberg et al., 2021)。这两种机制的竞争与协作,构成了集群编码的基础,而加权平均模型中注意的非均匀分配,为理解情绪感知偏差埋下了伏笔。
集群编码的效率和准确性受多种因素影响。加工对象特征方面,集合内刺激的变异性、空间布局和呈现时间都会影响统计摘要的精度。文化因素方面,东西方文化在整体与局部加工倾向上的差异,可能导致集群编码表现的系统性不同。此外,注意的调节作用至关重要:主动的注意指向能引导个体聚焦于特定目标子集,而自动化的注意偏向,如对威胁或高唤醒刺激的注意捕获,则会显著改变信息加权的格局,是影响最终感知输出的核心认知动因。
2.2. 情绪放大效应:一种系统性的感知偏差
情绪放大效应是指观察者对群体平均情绪强度的估计值显著高于实际均值的现象。该效应在快乐和愤怒情绪中均被发现,但其背后的认知动因仍存在核心理论争议(Goldenberg et al., 2021)。
这一争议聚焦于驱动注意权重不均衡分配的根本原则。一般性注意偏向理论认为,视觉系统对任何高情绪强度的刺激都存在普适性加工优势,导致其在集群编码中被赋予更高权重;特异性威胁驱动理论则强调,对愤怒等威胁性情绪的放大,源于进化塑造的对威胁信号的优先注意和加工机制,具有特定的适应意义。Goldenberg et al. (2021)的研究通过眼动追踪支持了注意偏向的作用,发现对高情绪面孔更长的注视时间与更大的放大效应相关。然而,该研究主要对比了快乐和愤怒,未能充分检验上述理论争议,要厘清机制,未来研究亟需检验放大效应是否在不同情绪类别,如悲伤、恐惧、厌恶中表现出差异模式。
情绪放大效应并非一成不变,其表现受到多种因素的调节。首先,任务与刺激特征是重要的外部调节变量。例如,Goldenberg et al. (2021)的研究发现,放大效应会随着群体面孔数量的增加而增强,且更长的刺激呈现时(在一定范围内)可能加剧而非减弱这一效应,这提示了注意加工的时间动态性。此外,刺激的变异性、空间位置以及不同的实验反应范式(如调整法vs.迫选法)都可能影响效应的测量和大小。
其次,情绪本身的属性是核心的调节维度。除了基本的效价(积极/消极)差异外,情绪的威胁性水平被认为是关键。研究发现,对高威胁性情绪(如愤怒)的放大效应可能更为显著,这支持了威胁驱动理论。而对于悲伤这类低威胁性、内向型的消极情绪,其加工可能更依赖于分配注意或共情机制,其放大效应模式可能与愤怒不同,甚至出现衰减,这为检验一般性与特异性理论提供了切入点(Baek & Chong, 2020)。
再者,个体差异不容忽视。具有不同心理特质的个体可能表现出差异化的情绪感知偏差。例如,社交焦虑个体对群体中的威胁性情绪(如愤怒)存在更强的注意固着,可能导致更显著的负性情绪放大。临床研究进一步揭示,自闭症谱系障碍(ASD)个体在需要快速整合多面孔信息以形成整体情绪印象的“集群编码”任务中可能存在困难。这种困难可以从预测编码的理论框架来理解:ASD个体在利用先验知识对复杂社会刺激(如多张面孔)进行高效“统计摘要”时可能存在障碍,其表现可能更依赖于对单一线索的序列化加工,而非快速的整体表征,这可能导致其对群体情绪的感知效率和模式与典型发展群体不同(Keysers et al., 2024)。文化背景也塑造着感知模式,例如强调整体思维的东方文化个体与强调个体思维的西方文化个体可能在集群编码任务中有不同表现。
3. 研究深化与视角拓展
3.1. 机制探析:从注意偏向到决策整合
情绪放大效应的核心认知机制源于注意资源在群体面孔间的非均匀分配。主流理论认为,由于高情绪强度面孔具有更高的感知与社会显著性,它们更易捕获并维持个体的注意,从而在集群编码的统计摘要过程中被赋予更高的权重,最终导致对整体情绪的高估。这一过程通常由“加权平均模型”所刻画,即个体的整体情绪估计并非所有面孔强度的算术平均,而是各面孔强度以其所获注意权重为系数的加权平均。
然而,注意对最终判断的影响路径并非单一直接,而是可能贯穿一个包含多阶段的、动态的认知加工链条。近年来研究开始揭示这一链条的复杂性,特别是在区分“信息采样”与“决策整合”两个关键阶段上取得了进展。Ngai et al. (2024)的研究为此提供了富有启示的证据。在他们的范式中,个体有充足时间自由观看多张情绪面孔后进行整体分类判断。眼动数据清晰显示,个体在采样阶段存在强烈的注意偏向,其注视点显著更多地落在情绪最极端(最快乐和最恐惧)的面孔上。这与Goldenberg et al. (2021)在快速呈现范式中观察到的、对高情绪面孔注视时间更长的现象内在一致,共同印证了极端情绪信息在视觉搜索中的“吸引力”。
但Ngai等人的发现其新颖之处在于决策整合阶段。通过计算建模比较,他们发现最能预测个体最终判断的模型并非是纳入注视时间或次数加权的模型,而是简单的“平等加权平均模型”。这意味着,尽管视觉系统在搜集信息时“偏心”地采集了更多极端证据,但在大脑整合这些证据以做出“整体更快乐还是更恐惧”的决策时,却似乎采用了一种更为“公正”的策略,倾向于淡化采样偏差的影响,对所有面孔的证据贡献进行近乎平等的整合。
这一发现揭示了群体情绪感知机制的灵活性:“加权平均”可能更多地表征了在时间压力下快速形成印象的自动化过程;而在允许审慎加工的决策任务中,可能存在一个双过程机制——先是基于显著性的自动化注意采样,而后是受目标驱动的、旨在优化决策的整合过程,后者可能涉及工作记忆的重新校准或认知控制的介入。这为情绪放大效应的产生条件提供了重要边界:当加工时间极端受限、任务指向快速估测时,注意偏差更可能直接体现为感知偏差;而当资源相对充足时,系统则可能启动偏差校正机制。
未来研究需借助更精细的范式与计算工具来深入剖析这一复杂机制。例如,漂移扩散模型(DDM)可通过拟合反应时与正确率,定量分离自动信息积累速率与受控决策阈限,从而检验上述双过程假设。同时,贝叶斯建模框架可以帮助我们探索,个体在进行群体情绪判断时,是否以及如何利用关于情绪分布的先验知识(如“群体情绪通常较为温和”)来修正由注意采样带来的极端似然估计,从而实现后验决策的稳健性。厘清这些子过程及其边界条件,是构建群体社会认知完整理论模型的关键。
3.2. 线索整合的生态视角:超越面孔的群体情绪感知
现实世界中的群体情绪感知是一个多线索信息整合的过程。个体不仅可以快速扫描多张面孔,同时也接收并整合来自身体姿势、动作、语音语调,甚至环境语境等多种线索,以形成对群体情绪氛围的判断。为逼近真实社交的复杂性,研究视角正日益从对单一线索(如面孔)的考察,拓展至对多线索整合机制的探索。
首先,在动态的社会互动情境中,感知者能够整合听觉与视觉线索来判断互动整体的情绪氛围。研究发现,即使在仅呈现简化生物运动点光源和语音的模拟互动中,观察者也能有效利用视听信息来评估互动双方的整体情绪,且语音线索在其中通常被赋予更高的决策权重(Petrini et al., 2015)。这证明,脱离具体面部细节的动作线索与声音的结合,也可能足够支持感知者对互动单元情绪的有效判断。
其次,在高生态效度的特定情境(如体育竞赛)中,感知者可以高效利用身体姿势线索来推断情绪。基于静态比赛图像的研究表明,当观察者判断运动员的输赢情绪时,相较于面部表情,其身体姿势为感知者提供了更明确、加工更迅速的效价信息(王丽丽等,2018)。这提示我们,在群体场景中,感知者对整体身体姿态的解读可能是其快速形成情绪印象的重要途径。
再者,身体姿势作为强大的非言语线索,其作用远不止于独立表达情绪。它能够调节感知者对面部表情的解读,并且特定的姿势形态(如扩张与收缩)本身承载着稳定的社会动机与权力信息(Carney et al., 2010)。这种“情绪–姿势”在社会认知层面的内在匹配性,可能通过增强认知流畅性,进一步调节感知者在整合多线索时的注意分配与权重计算,从而影响最终的群体情绪印象。同时,个体在非言语表达风格上的差异(如姿势与人格特质关联)提示,线索的整合过程可能受到感知者与表达者双方特质的共同塑造(Wainio-Theberge & Armony, 2024)。
最后,从神经机制角度看,这种多线索的整合能力依赖于一个健全且自动化的神经加工系统。对特殊人群(如精神分裂症患者)的研究揭示,其社会情绪感知的困难部分源于在整合面孔与声音情绪线索上存在特异性缺陷,这是由于前注意阶段的早期加工异常(de Gelder et al., 2005)。近期研究进一步指出,精神分裂症患者的视听多感官整合障碍具有特定的模式。在行为层面,最典型的特征是时间绑定窗口的扩大,即患者对跨模态刺激在时间上同步性的容忍度更高,这可能导致对复杂社会线索(如言语和表情)的整合精确性下降。神经生理学证据表明,这种障碍与早期感觉加工阶段的异常密切相关,例如在整合视听信息时,患者与整合相关的早期ERP成分振幅显著降低(Borgolte et al., 2024)。有趣的是,一些研究发现,患者在行为上表现出整合增益的减少,但某些神经电生理指标上却未发现同等程度的损害(Tang et al., 2025)。这共同提示,患者的障碍可能并非基础整合能力的完全丧失,而更多体现在对多源信息的精细加工、适应以及利用整合信息优化决策的后期环节受损,这种功能障碍与社会认知缺陷密切相关。这反过来说明,健康个体能够快速、自动化地整合多种情绪线索,这正是我们能在复杂群体中迅速捕捉情绪氛围的神经基础。
综上所述,对群体情绪的感知远不止于对面部信息的“集群编码”,而是感知者主动、灵活地整合身体动作、语音语调等多种线索,并受社会认知知识调节的复杂过程。将身体姿势、语音等线索纳入研究范畴,并关注其整合的认知与神经机制,是提升群体情绪感知研究生态效度、深化理解真实社会互动的必然方向。
3.3. 社会意义与现实影响
群体情绪感知的偏差机制不仅是一个基础的认知科学问题,更在现实社会场景中具有广泛而深刻的影响。理解这些偏差,有助于我们洞察诸多社会心理现象背后的认知根源。
具体而言,情绪放大效应可能在公共危机与管理中加剧群体性情绪的扩散。例如,在紧急事件中,个别人表现出的高强度恐惧或愤怒,会因注意偏向而被优先加工,导致观察者高估整体群体的恐慌程度,这种被放大的集体情绪印象可能加速非理性行为的蔓延(Goldenberg et al., 2021)。在组织与网络环境中,这种偏差同样关键。领导者若因感知偏差而误判团队情绪,可能做出不当决策;而在网络舆情中,对极端情绪内容的注意偏向会扭曲人们对整体舆论氛围的判断,加剧观点极端化。研究表明,对群体情绪的整体感知能显著预测个体对该群体的后续行为意向(Mackie et al., 2024),这直接证明了其现实影响力。
因此,群体情绪感知中的偏差机制,是连接认知与社会行为的重要纽带。未来研究通过揭示并校准这些偏差,对于促进有效的危机沟通、组织管理及健康的网络舆论环境具有明确的实践价值。
4. 研究局限与未来展望
当前研究在逼近真实社会情境方面仍面临局限。生态效度方面,多数范式依赖静态面孔,未能整合身体姿势、语音等多种线索。理论深度方面,对情绪放大效应的机制解释尚存争议,且尚缺乏能够统一刻画从注意采样到多线索加权整合全过程的计算模型。研究广度方面,对个体与文化差异的系统性探索仍显不足。
未来研究可以从以下几个方向寻求推进:第一,发展生态化范式,利用多通道动态刺激与虚拟现实等技术模拟真实群体互动。第二,深化计算与神经机制整合,构建如分层贝叶斯模型等计算框架,并结合神经科学技术揭示其脑机制。第三,拓展应用与普适性,加强跨群体、跨文化研究,并探索其在社会情绪障碍干预等领域的应用潜力。
5. 结论
群体情绪感知是个体适应复杂社会情境的核心能力。研究表明,“集群编码”这一高效统计摘要机制在快速提取群体情绪的同时,会因注意资源对高情绪或威胁性信号的偏向性分配,产生情绪放大的系统性感知偏差。然而,认知系统对此展现出灵活性,即注意在信息采样与决策整合阶段可能存在策略性分离,且真实世界的情绪判断依赖于对面孔、身体姿势、语音等多种社会线索的动态整合。未来研究需在提升生态效度的基础上,通过跨学科方法深化对上述认知与神经机制的理解,从而更完整地揭示人类社会情绪感知的图景。
基金项目
省级大学生创新训练项目,消极情绪集群编码的差异化放大效应:从面孔集群编码到身体姿势的调节机制(S202510445067)。