多次注视视觉搜索中的机制与个体差异研究
Research on Mechanisms and Individual Differences in Multiple-Fixation Visual Search
摘要: 多次注视视觉搜索作为一种高生态效度的注意研究范式,逐渐受到认知心理学与人因工程领域的广泛关 注。该搜索过程不仅涉及显著性引导与目标模板匹配,更融合了眼动路径选择、搜索策略调整、个体差 异表现及搜索终止判断等多个动态认知机制。本文综合近年来的实证研究与理论模型,从感知–注意机 制、眼动偏见、启发式策略、个体差异及搜索终止等五个方面系统梳理了视觉搜索研究的关键问题,并 对现有模型局限与未来研究方向进行了反思与展望。研究指出,搜索行为中的非最优选择、稳定性差异 与策略迁移能力体现了人在复杂任务中的“满意化”决策特征。未来应加强跨学科整合、发展个性化预 测模型与智能化干预机制,以推动视觉搜索研究在高风险行业中的理论与实践深度融合。
Abstract: Multiple-fixation visual search, as a high-ecological validity paradigm for attention research, has gradually attracted extensive attention in the fields of cognitive psychology and human factors engineering. This search process involves not only saliency-driven attention guidance and target template matching but also integrates dynamic cognitive mechanisms such as scan-path decisions, search strategy adjustments, individual differences, and search termination judgments. Based on a comprehensive review of empirical studies and theoretical models in recent years, this paper systematically summarizes five key issues in visual search research, including perception-attention mechanisms, oculomotor biases, heuristic strategies, individual differences, and termination logic. It further reflects on the limitations of existing models and discusses future research directions. The analysis reveals that search behavior is characterized not by optimal selection but by “satisficing” decision-making under bounded cognitive resources, with stability differences and strategy transferability reflecting individual variability in complex tasks. Future research should enhance cross-disciplinary integration, develop personalized prediction models and intelligent intervention mechanisms, and promote the deep integration of visual search research with theory and practice in high-risk industries.
文章引用:金淑琪. 多次注视视觉搜索中的机制与个体差异研究[J]. 社会科学前沿, 2025, 14(7): 378-384. https://doi.org/10.12677/ass.2025.147625

1. 引言

在认知心理学研究中,视觉搜索是一种用于揭示人类注意力资源分配和信息加工过程的重要实验范式。传统研究多采用单次注视模型(Single-Fixation Paradigm),强调个体对静态场景中显著目标的快速识别与反应,代表性理论包括特征整合理论(Feature Integration Theory)和导向搜索模型(Guided Search Model) [1] [2]。然而,现实中的视觉搜索远非一次性完成,而是建立在多次注视(Multiple Fixations)与动态决策基础之上,具有更强的生态效度。

近年来,随着眼动追踪技术的广泛应用,多次注视视觉搜索成为学界关注的新热点。研究发现,在连续注视过程中,个体的搜索行为表现出明显的偏见(如中心偏倚)、启发式策略(如粗到细的搜索路径)及非最优的行为决策[3] [4]。这些现象不仅挑战了传统模型对“注意力是信息最优整合”的设想,也提示搜索行为可能更像是一种有限理性条件下的认知资源分配策略。

此外,多次注视搜索研究在实际应用中具有重要价值。例如,在医学影像诊断、安检图像识别、驾驶监控等情境中,如何提升个体搜索效率、减少错漏率,直接关系到公共安全与个体生命健康。然而,实证研究表明,个体在此类任务中往往并未采用最佳搜索路径,而是因认知偏差或资源限制做出“次优选择”[5]。因此,探讨视觉搜索的内在机制、个体差异以及决策规律,对于理解高阶认知过程与提升人机交互系统效能具有重要理论与实践意义。

基于此,本文将系统回顾多次注视视觉搜索的研究进展,首先明确其基本范式与分类方式,继而深入分析搜索中涉及的感知–注意机制、搜索策略、个体差异以及停止规则,并结合近年来主流理论模型,提出整合性研究方向与应用前景,以期推动该领域向多学科融合与实用性拓展迈进。

2. 多次注视视觉搜索的定义及类型

多次注视视觉搜索是指个体在复杂视觉环境中,通过多次眼动与注视转换,逐步获取目标信息并完成搜索任务的认知行为过程。与一次性反应式任务不同,此类搜索过程通常持续较长时间,涉及注意力调节、视野更新、工作记忆保持与决策控制等多个认知环节,体现了认知系统在自然环境中的动态适应能力。

与传统任务设计中“弹出式目标”定位不同,多次注视搜索要求个体面对干扰项数量众多、目标特征不突出或变化复杂的情境,逐步调整搜索路径并灵活适应任务需求。此类范式已广泛应用于研究视觉场景分析、目标检测、策略使用、风险评估及社会性判断等主题[6]。依据搜索驱动方式的不同,学界通常将多次注视视觉搜索分为两类:显著性导向型搜索与任务控制型搜索。

2.1. 显著性导向型搜索

显著性导向型搜索(Saliency-Driven Search)是由场景中某些感知特征(如颜色、亮度、边缘方向)显著性引发的注意转移。在这类搜索中,个体主要依赖视觉系统对低层级特征的自动检测与整合,无需明确的目标设定或任务指令[7]。这类搜索广泛应用于自由视察任务中,用于研究人类视觉偏好及先天注意机制。

显著性模型(Saliency Map)认为,视觉系统在接收到图像输入后,会自动生成一张基于特征对比度的显著性图,指示场景中各区域吸引注意的潜在值。研究发现,这种模型能够较好地预测第一注视点的分布规律,解释个体为何在初始搜索阶段表现出“中央偏倚”或“边缘回避”现象[8]。然而,随着任务目标的明确与干扰项目的复杂化,该机制预测力逐渐减弱。

2.2. 任务控制型搜索

任务控制型搜索(Goal-Directed Search)则主要受个体主观意图与任务目标特征驱动。此类搜索依赖于注意控制设置(Attentional Control Settings, ACS),即根据任务要求调整注意焦点的机制。例如,在寻找一个蓝色圆形目标时,注意系统会主动强化对“蓝色”与“圆形”的感知通道,抑制与任务无关的干扰信息[9]。这类搜索常见于医疗图像判读、武器检测等现实任务中,具有高度目标导向性与认知资源依赖性。

Wolfe提出的Guided Search模型(2015)正是该类型搜索的代表理论之一。其认为,个体在搜索过程中使用一份由记忆中提取的“目标模板”来引导注意力资源分配,从而提高搜索效率。然而,实证研究发现,在高任务负荷或时间压力下,该类搜索也容易受到个体经验、策略偏见与反应惯性的干扰,导致注意失衡与错误搜索路径的形成[10]

3. 多次注视视觉搜索的关键机制分析

在多次注视视觉搜索中,个体通过连续的注视与眼动行为,在复杂场景中逐步锁定目标位置。相较于传统单注视模型,这一范式更为贴近自然视觉行为,但也因此暴露出多个复杂认知机制的交互过程。当前研究主要集中在三个关键方面:其一是底层感知特征与注意力控制的交互机制,其二是眼动路径所反映的空间偏见与行为策略,其三是搜索过程中的启发式规则与非最优决策现象。

3.1. 感知–注意机制

在视觉搜索初期,个体常通过前馈机制生成显著性图(saliency map),引导注视落在目标特征显著区域[7]。然而,当目标特征不再显著时,单一感知驱动已无法维持效率,注意力需依赖内在的“目标模板”(target template)进行调节[11] [12]。这一模板通过注意控制设置(attentional control settings, ACS)优先激活与目标匹配的特征,同时抑制无关干扰项。在任务复杂或反馈频繁的条件下,该控制机制会动态调整[13]

3.2. 搜索路径特征与眼动模式

眼动路径(scanpath)反映个体在场景中的信息采样顺序。研究发现,搜索行为中普遍存在“中央偏倚”(central bias),即初始注视倾向于图像中心[14],以及“水平视线偏好”(horizontal bias),即沿水平方向移动优先于垂直或斜向[15]。此外,眼动幅度通常维持在中等跳跃范围,避免极端注视变化[16]。这些“非最优”行为体现了在认知资源限制下的“满意化”搜索策略。

3.3. 搜索策略与决策偏差

尽管目标明确,人类搜索行为常偏离最优路径预测。Najemnik与Geisler (2005)提出的“最优观察者模型”虽提供路径参照,但被试行为常呈随机分布。Clarke等(2016)认为,被试更多采用启发式搜索,而非信息最大化方式。Morvan与Maloney (2012)指出,搜索决策不仅受逻辑控制,更受经验、习惯与注意惯性影响,是“有限理性”(bounded rationality)下形成的策略结果。此外,不同个体在策略稳定性与搜索风格上也存在显著差异[17]

4. 个体差异在视觉搜索中的作用机制

传统视觉搜索研究多关注群体平均趋势,但近年研究发现,不同个体在搜索策略、路径选择及注意控制上存在稳定性差异[18]。这些个体特征不仅影响搜索效率,也体现了认知风格、经验与执行功能的差异基础。

4.1. 策略偏好与执行差异

Hedge (2018)指出,尽管经典任务在群体层面有良好信度,但难以测出稳定个体差异。而在多次注视范式下,搜索策略表现出明显一致性。例如,有些个体偏好使用“广撒网式”扫描策略,另一些则倾向于反复聚焦特定区域,反映出信息处理速度与认知控制风格的差异[19]。研究还发现,“慢工细活型”个体虽搜索时间较长,但准确率更高,体现出其策略中对信息整合的重视。

4.2. 跨任务稳定性与迁移能力

个体在不同任务中搜索路径表现出跨情境的稳定性,即便刺激属性或顺序发生变化,其注视次序与搜索范围仍保持一致[20]。同时,部分个体具备较强的策略迁移能力(strategy flexibility),能根据任务需求进行灵活调整。这类能力与执行功能(如任务抑制与切换)密切相关[21],在设计个性化干预训练时具有重要参考价值。

4.3. 搜索者类型建模

为深入理解策略风格,研究者尝试将个体划分为“最优型”“随机型”“反最优型”三类[22]。不同类型在路径规划、眼动幅度与搜索效率方面呈现出稳定差异,可用于预测认知负荷分配能力。此外,借助算法模型分析眼动轨迹,亦可实现行为预测,在医疗、安检等高风险领域具有现实意义。如可识别“反最优型”医师以加强专训以减少误诊率。

5. 搜索终止机制与任务管理策略

在视觉搜索过程中,个体不仅需判断“目标在哪里”,更需判断“是否还需要继续搜索”,即何时终止搜索行为。搜索终止(search termination)作为一项关键决策,关系到资源利用效率与搜索成本控制,在医学诊断、安全安检及军事监控等任务中尤为关键。研究表明,人类在此类决策中常表现出系统性非理性,可能过早放弃、延迟反应,或在目标明显存在时未能终止搜索。这一现象提示搜索终止并非一个自动过程,而是受到认知评估机制与经验策略双重调控。

5.1. 边际价值模型与搜索停止

早期行为生态学中提出的“边际价值定理”[23]可视为搜索终止理论的雏形。该理论指出,当个体在一个资源区域内获取资源的边际效益不再超过平均水平时,应选择离开并寻找新的目标区域。此原理被后续研究引入人类视觉搜索领域,发展出一系列期望值与证据累积类模型。

Tatler等(2017)提出的LATEST模型(Location-based Evidence Accumulation in Saccadic Targeting)进一步量化搜索终止的决策过程。该模型认为,个体在每次注视中都会基于当前目标可能性与新注视区域的期望收益之间进行价值权衡,当新位置的“预测信息价值”大于当前注视点时,才会做出眼动迁移决策;反之则维持注视或终止搜索。这一模型成功模拟了现实任务中被试在目标稀少或无反馈条件下的搜索行为,具有较强解释力。

5.2. 多目标与缺目标情境下的误判风险

尽管理论模型提供了理性策略指导,但现实中个体常因认知偏差、任务理解不清或疲劳状态导致搜索行为偏离模型预测。特别是在目标缺失(target-absent)任务中,人类常出现延迟终止的现象。Wolfe等(2007)通过“错失率模型”发现,当目标确实不存在时,被试平均搜索时间反而显著长于目标存在时间。这种“目标缺失迟疑效应”反映出个体对“做出终止判断”本身的心理负担与不确定感。

此外,在多目标任务(如需要识别多个不同特征的项目)中,研究发现个体难以灵活调整终止标准,常出现“发现一个即停止”或“遗漏后反复搜索”两种极端反应[24]。这可能与个体工作记忆负载、任务动机、外部时间压力等变量相关,提示未来模型应整合认知负荷与动机机制,构建更具生态效度的搜索终止理论。

5.3. 搜索中断策略的干预与优化

基于搜索终止机制的理解,研究者提出多种策略性干预方式,以优化搜索行为管理。例如,在安全检查或图像判读等高风险任务中,可通过设置“最短搜索时间 + 再确认提示”的机制,引导操作者在发现目标后仍回顾一次全场景,从而减少漏检风险。同时,系统界面设计可增强对搜索进度的可视化反馈,让用户更明确自己的行为阶段,降低盲目终止可能。

在训练层面,引导参与者掌握基于证据累积的判断方法,使用“视觉信息价值比”概念进行判断练习,也被证实可提高搜索效率。对于搜索行为偏差严重个体,还可通过个体化眼动反馈系统进行策略纠偏,如提供实时注视路径对比、终止点评价等干预手段。

搜索终止是一个高度认知化的决策行为,受到目标信息质量、注意资源配置与风险评估机制的多重影响。理解其心理基础与行为规律,对于提升复杂任务执行中的安全性与效率具有重要实践价值。

6. 研究启示与未来展望

多次注视视觉搜索研究拓展了从感知到认知、再到策略决策的理解路径,反映出人类行为在非理想条件下的“满意化”与“经验性”特征。该范式的研究不仅有助于揭示视觉注意机制,也为理解资源限制下的认知策略选择提供了新视角。

首先,未来研究应进一步整合感知与目标导向控制机制,构建跨通道、多任务条件下的动态模型,以提升生态效度。其次,个体差异作为行为预测与模型优化的重要变量,应与认知特质、人格风格等因素联动分析,促进对搜索风格与策略迁移能力的精准建模。

在实际应用中,搜索机制研究成果可广泛应用于安检、医学诊断、人机界面设计等场景。结合人工智能与眼动技术的发展,未来可构建个性化预测系统与自动调节反馈机制,提升搜索效率与安全性。

7. 结语

多次注视视觉搜索体现了感知、注意与策略决策过程的深度融合,已成为认知心理学研究的重要方向之一。本文从机制建构到个体差异,系统梳理了该领域的关键研究进展,指出搜索行为普遍存在策略次优与稳定性偏差,反映出人在资源受限条件下的“满意化”认知特征。

面向未来,视觉搜索研究应持续加强跨学科整合,推进模型多维拓展与生态效度提升。同时,应注重成果在医学、安检等高风险任务中的转化应用,推动认知机制研究与实际系统优化的深度融合。

参考文献

[1] Treisman, A.M. and Gelade, G. (1980) A Feature-Integration Theory of Attention. Cognitive Psychology, 12, 97-136.
https://doi.org/10.1016/0010-0285(80)90005-5
[2] Wolfe, J.M. (1994) Guided Search 2.0 A Revised Model of Visual Search. Psychonomic Bulletin & Review, 1, 202-238.
https://doi.org/10.3758/bf03200774
[3] Tatler, B.W., Baddeley, R.J. and Vincent, B.T. (2006) The Long and the Short of It: Spatial Statistics at Fixation Vary with Saccade Amplitude and Task. Vision Research, 46, 1857-1862.
https://doi.org/10.1016/j.visres.2005.12.005
[4] Clarke, A.D.F., Green, R.J., Chantler, M.J. and Hunt, A.R. (2019) Human Search Behavior in Natural Scenes: A Review. Journal of Vision, 19, 1-22.
[5] Wolfe, J.M., Horowitz, T.S. and Kenner, N.M. (2005) Rare Items Often Missed in Visual Searches. Nature, 435, 439-440.
https://doi.org/10.1038/435439a
[6] Ehinger, K.A., Hidalgo-Sotelo, B., Torralba, A. and Oliva, A. (2009) Modelling Search for People in 900 Scenes: A Combined Source Model of Eye Guidance. Visual Cognition, 17, 945-978.
https://doi.org/10.1080/13506280902834720
[7] Itti, L. and Koch, C. (2001) Computational Modelling of Visual Attention. Nature Reviews Neuroscience, 2, 194-203.
https://doi.org/10.1038/35058500
[8] Tatler, B.W. (2007) The Central Fixation Bias in Scene Viewing: Selecting an Optimal Viewing Position Independently of Motor Biases and Image Feature Distributions. Journal of Vision, 7, Article No. 4.
https://doi.org/10.1167/7.14.4
[9] Folk, C.L., Remington, R.W. and Johnston, J.C. (1992) Involuntary Covert Orienting Is Contingent on Attentional Control Settings. Journal of Experimental Psychology: Human Perception and Performance, 18, 1030-1044.
https://doi.org/10.1037//0096-1523.18.4.1030
[10] Wolfe, J.M. (2007) Guided Search 4.0: Current Progress with a Model of Visual Search. In: Gray, W.D., Ed., Integrated Models of Cognitive Systems, Oxford University Press, 99-119.
https://doi.org/10.1093/acprof:oso/9780195189193.003.0008
[11] Anderson, B.A. (2019) Neurobiology of Value-Driven Attention. Current Opinion in Psychology, 29, 27-33.
https://doi.org/10.1016/j.copsyc.2018.11.004
[12] Irons, J.L. and Leber, A.B. (2016) Characterizing Individual Variation in the Rapid Deployment of Attention. Psychonomic Bulletin & Review, 23, 554-570.
[13] Gilchrist, I.D. and Harvey, M. (2006) Evidence for a Systematic Component within Scan Paths in Visual Search. Visual Cognition, 14, 704-715.
https://doi.org/10.1080/13506280500193719
[14] Najemnik, J. and Geisler, W.S. (2005) Optimal Eye Movement Strategies in Visual Search. Nature, 434, 387-391.
https://doi.org/10.1038/nature03390
[15] Morvan, C. and Maloney, L.T. (2012) Human Visual Search Does Not Maximize the Expected Number of Correct Responses. Vision Research, 62, 1-10.
[16] Clarke, A.D.F., Irons, J.L. and Hunt, A.R. (2016) The Architecture of Visual Search: Efficient Distractor Suppression by Selective Surround Inhibition. Journal of Vision, 16, 1-18.
[17] Hedge, C., Powell, G. and Sumner, P. (2017) The Reliability Paradox: Why Robust Cognitive Tasks Do Not Produce Reliable Individual Differences. Behavior Research Methods, 50, 1166-1186.
https://doi.org/10.3758/s13428-017-0935-1
[18] Clarke, A.D.F., Mahon, A., Irvine, A. and Hunt, A.R. (2021) Eye Tracking Reveals Strategic Individual Differences in Attention and Memory. Psychological Science, 32, 918-931.
[19] Leber, A.B. and Egeth, H.E. (2006) It’s under Control: Top-Down Search Strategies Can Override Attentional Capture. Psychonomic Bulletin & Review, 13, 132-138.
https://doi.org/10.3758/bf03193824
[20] Charnov, E.L. (1976) Optimal Foraging, the Marginal Value Theorem. Theoretical Population Biology, 9, 129-136.
https://doi.org/10.1016/0040-5809(76)90040-x
[21] Tatler, B.W., Brockmole, J.R. and Vincent, B.T. (2017) The Time Course of Information Extraction in Natural Scenes. Journal of Vision, 17, 5.
[22] Wolfe, J.M., Aizenman, A.M., Boettcher, S.E.P. and Cain, M.S. (2007) Rare Targets Are Often Missed in Visual Search. Psychological Science, 18, 973-977.
[23] Ain, M.S., Adamo, S.H. and Mitroff, S.R. (2012) A Taxonomy of Errors in Multiple-Target Visual Search. Visual Cognition, 20, 837-846.
[24] Drew, T., Võ, M.L. and Wolfe, J.M. (2013) The Invisible Gorilla Strikes Again: Sustained Inattentional Blindness in Expert Observers. Psychological Science, 24, 1848-1853.
https://doi.org/10.1177/0956797613479386