1. 引言
随着20世纪50年代和60年代生育高峰出生人口陆续进入老年阶段,加上人口预期寿命的不断增长,我国已经进入老年人口迅速增长期,人口老龄化加速[1]。为应对中国人口老龄化带来的挑战,《“健康中国2030”规划纲要》指出要把健康摆在优先发展的战略地位,将促进健康的理念融入公共政策制定实施的全过程,实现健康与经济社会良性协调发展[2]。然而当前,我国人口发展呈现新生人口不足、存量人口老化、人口结构失衡、区域人口增减分化等趋势性特征,老龄化是其中制约人口高质量发展的重要阻碍因素,给中国未来的经济与社会发展带来不确定性[3]。近十年来,中国老年人群轻度认知障碍总体患病率为19%,且呈现逐年增长趋势[4]。认知老化不仅影响老年人的生活质量,严重时甚至影响日常生活[5]。引发老年人健康问题和认知功能下降的主要原因可能是老年人的感知觉能力的衰退,因为在日常生活中,视觉和听觉是我们两种主要的感觉方式。事实上,大约94%的传入信息来自视觉和听觉两个感官通道。这些信息通常是冗余或互补的。能够有效地将视觉和听觉通道的信息进行整合,使之成为一个统一且连贯的知觉过程,被称为视听觉整合(Audiovisual Integration, AVI) [6]。
目前已有的认知训练任务分为两种,一种是可以嵌套进日常生活场景中的训练任务,另一种是基于注意力、认知控制能力、记忆力等认知能力提高的训练任务。已有研究表明,认知训练对轻度认知患者的改善有限。Barbara Carretti等人的研究中,采用工作记忆训练遗忘型轻度认知障碍患者,要求实验组完成言语工作记忆训练,而控制组则学习关于记忆的知识。结果发现只有实验组在视觉工作记忆、卡特尔智力测验和长时记忆任务上获得了提高[8]。Tappen等人采用可以嵌套进日常生活场景中的训练任务,结果发现,实验组在训练任务上的表现显著提高,特别是记忆任务的表现,但是这种提高并没有迁移到别的认知能力上[9]。此外,Lorig和Olchik等人都使用了记忆策略训练对轻度认知障碍患者进行认知干预,但是都没有获得显著的提高[10] [11]。这些阴性结果的产生可能与训练方案的设置、研究质量控制等相关。基于工作记忆提高的训练任务通常难度较大,老年前期人群难以完成,从而造成了阴性结果。那么,若采用更为简单易懂的认知训练任务,老年前期人群的认知能力能否更为有效地提高?
而有的研究表明视听知觉学习可以有效改善老年人的感知能力,特别是视听整合能力。Powers等人和Stevenson等人通过研究训练任务,发现带有反馈的知觉学习可以显著有效且持久地提高对视听刺激的时间敏锐度,即时间绑定窗口(temporal binding window, TBW)得到了显著缩小,甚至无需听觉的训练[12] [13]。Niear等人和Setti等人也通过知觉学习缩小TBW [14] [15]。随着知觉学习研究的进一步发展,McGovern等人发现老年人在进行视听同时任务训练后,TBW能有效地缩小[16]。此外,Ren等人的研究表明,经过连续五天的视听知觉学习,老年人在视听觉的敏感性和反应速度均获得了提高,并且P300的AVI振幅提高[17]。Weiping Yang等人研究发现,视听知觉学习增强了健康老年人的P300成分,且视听知觉学习可能比单模态视觉或听觉训练更有利于老年人认知能力的提高[18]。此外,当无关刺激干扰减少时,视听觉训练甚至能提高一般认知能力。由此可知,视听知觉学习增强了老年人的P300成分,且有效缩短了TBW。
综上所述,目前很多老年前期人群认知干预研究主要是基于工作记忆,由于任务难度较大,一般处于老年前期阶段的人很难完成,所以其收益甚微。因此,本研究将使用简单的静态简笔画与其对应的听觉刺激作为知觉学习的材料,另外,采用视听觉辨别任务来评估知觉学习对老年前期人群视听整合能力的改善,从而探讨知觉学习对老年前期人群感知能力的影响。基于前人研究结果,本研究预期,知觉学习能够有效改善老年前期人群的感知能力,特别是视听整合能力。
2. 方法
2.1. 被试
实验最终募集20位老年前期被试(平均年龄:60.25 ± 5.02岁)参与实验。所有被试均招募于贵州省贵阳市花溪大学城及其周边社区。所有被试听力或矫正听力正常,视力或矫正视力正常,无精神疾病史,未曾有脑部损伤记录。实验完成后,所有被试均按约定得到了相应的报酬。
2.2. 实验装置和材料
实验程序的编写和数据的采集均采用E-prime 3.0。刺激呈现在Dell SE2719HR型号的液晶显示器上,可视尺寸为27英寸,分辨率为1920 × 1080像素,刷新率为60 Hz。实验在黑暗、隔音的环境下进行,屏幕背景为灰色。被试眼睛距离屏幕中心约60 cm。
使用E-Prime 3.0进行程序的编写和数据的采集。20名被试均完成前测和后测的任务。随机将20名被试分为两组,一组为实验组,另一组为控制组。实验组进行持续7天的知觉学习任务,控制组进行连续7天的脑保健知识学习。
2.3. 实验设计和程序
2.3.1. 知觉学习
Figure 1. The paradigm of perceptual learning
图1. 知觉学习流程图
知觉学习中视觉刺激是静态简笔画,听觉刺激为与视觉刺激语义一致的刺激,大小为65 dB。使用Matlab对视觉刺激进行等比例的高斯模糊和对听觉刺激进行等比例的信噪比的调节。将视觉刺激和听觉刺激依据难度各分为10组(10%, 20% … 100%),每组包括20个视听觉语义一致性刺激与20个视听觉语义不一致性刺激,共40个试次(不包含练习阶段10个试次),耗时约3分钟。训练按照进三退一的原则从中等难度(50%)开始,每天1小时,连续7天。
实验程序如图1所示。屏幕中央首先出现一个持续时间约为1000 ms的黑色“+”注视点。紧接着,视觉刺激在屏幕中央得以呈现,同时通过左右扬声器的左右声道呈现听觉刺激,约100 ms。当视听觉语义一致刺激出现时,被试点击左键做出反应;当视听觉语义不一致刺激出现时,被试点击右键做出反应。为了避免练习效应的影响,将两个刺激之间的时间间隔(Interstimulus Interval, ISI)设置为1500~2000 ms。
2.3.2. 视听觉辨别任务
本研究通过视听觉辨别任务来评价知觉学习对老年前期人群视听感知能力的影响。在视听觉辨别任务中,本研究采用六种不同的刺激类型。实验刺激如图2(B)所示。具体来说,将垂直正弦Gabor视标作为视觉目标刺激,而水平正弦Gabor视标则是作为视觉标准刺激。在听觉方面,目标刺激表现为强度60 dB的白噪音,而标准刺激则表现为强度60 dB的纯音。视觉和听觉目标刺激的结合将作为视听觉目标刺激,而视觉和听觉标准刺激的结合则是作为视听觉标准刺激。
Figure 2. (A) Possible sequences of audiovisual target stimuli and audiovisual standard stimuli in the audiovisual dis crimination task; (B) Type of stimulus
图2. (A) 视听觉辨别任务中视听觉目标刺激和视听觉标准刺激的可能序列;(B) 刺激的类型
实验程序如图2(A)所示。实验开始时,一个白色的注视点,形状为“+”符号,出现在屏幕中央,持续约1000 ms。随后,在注视点正下方的位置,会短暂地呈现视觉、听觉或者视听觉双重通道刺激,持续时间大约100 ms。一旦目标刺激出现,被试需要点击左键进行反应。为了减少练习效应的影响,每两种刺激之间的时间间隔被设定在1800 ms至3000 ms之间。在正式实验之前,参与者会进行一次练习,练习中包含所有六种刺激,每种刺激呈现两次,共计12个试次,并且每个试次之后都会提供反馈,确保被试能准确理解实验流程。
2.4. 实验设计和程序
首先,剔除被试响应错误的试次。接着,为防止被试快速猜测以及反应过慢导致结果出现偏差,将剔除以下两种试次:一是反应时间超过200 ms至1200 ms范围的试次;二是超出平均反应时间正负2.5个标准差的试次。最后,分别计算每个被试的正确率和反应时,并使用SPSS 21.0软件进行了重复测量方差分析。
其次,为了检测冗余效应,使用累积分布函数(CDFs)分析各条件的反应时间(10 ms为单位),并对每个被试的数据建立独立的竞争模型(Race model)。竞争模型是基于单通道视觉和单通道听觉的累积分布函数结合来计算的。然后将视觉和听觉双通道的累积分布函数与竞争模型的累计分布函数作差,即视觉和听觉双通道的累积分布函数与竞争模型的累计分布函数在RT范围内(本研究为200~1200 ms)每10 ms上的概率差异[19]。若在给定RT范围内,实际视觉和听觉双通道的累积分布函数显著大于预测的竞争模型的累计分布函数,即显著违反竞争模型,则代表发生多感觉整合效应[20]。
3. 结果
为了分析实验组和控制组在视听觉辨别任务前、后测中的正确率和反应时,本研究进行了2 (组别:实验组、控制组) × 2 (测验时间:前测、后测) × 3 (刺激类型:视觉、听觉、视听觉)的重复测量方差分析。
3.1. 正确率
考察击中率,本研究结果如表1所示:在测验时间方面,其主效应显著,F(1, 18) = 7.607,p < 0.05,
= 0.297,前测的正确率(96.99%)显著低于后测的正确率(98.05%)。主效应在刺激类型方面表现显著,F(2, 17) = 9.664,p < 0.05,
= 0.532。具体来说,当视听觉目标刺激被呈现时,被试的正确率达到了98.02%。这一成绩显著优于仅呈现听觉目标刺激时的正确率(97.88%),也显著优于仅呈现视觉目标刺激时的正确率(96.67%),体现了跨通道处理的优势。而组别的主效应未达到显著性水平,F(1, 18) = 0.155,p = 0.699,
= 0.009。统计学分析显示,实验组的正确率为97.68%,而控制组则为97.37%,这两个正确率在统计学上并无显著差异。在交互效应的考察中,发现组别因素和测验时间因素之间并不存在显著的交互效应,F(1, 18) = 4.283,p = 0.053,
= 0.192。组别因素和刺激类型因素的交互效应不显著,F(2, 17) = 0.023,p = 0.977,
= 0.003。测验时间因素和刺激类型因素的交互效应不显著,F(2, 17) = 0.243,p = 0.787,
= 0.028。测验时间因素、刺激类型因素和组别因素三者交互效应不显著,F(2, 17) = 0.161,p = 0.853,
= 0.019。
3.2. 反应时
考察反应时,本研究结果如表1所示:在测验时间方面,其主效应不显著,F(1, 18) = 1.339,p = 0.262,
= 0.069。前测任务的反应时(546.58 ms)和后测任务的反应时(529.78 ms)无显著性的时序差异。刺激类型的主效应表现显著,F(2, 17) = 213.387,p < 0.001,
= 0.962。在视听觉目标刺激呈现时,被试的反应时间表现为478.62 ms。对比仅呈现视觉目标刺激时的反应时间(539.92 ms)与仅呈现听觉目标刺激的反应时间(595.99 ms),其表现出了显著的速度优势。然而,在组别方面,主效应的表现并不显著,F(1, 18) = 0.001,p = 0.975,
= 0。反应时数据显示,实验组的反应时间为537.83 ms,而控制组则为538.54 ms。在统计学意义上,这两者无显著性差异。在考察交互效应时,组别因素和测验时间因素之间并未达到显著性水平,F(1, 18) = 0.268,p = 0.611,
= 0.015。组别因素和刺激类型因素的交互效应不显著,F(2, 17) = 2.003,p = 0.166,
= 0.191。测验时间因素和刺激类型因素的交互效应不显著,F(2, 17) = 0.200,p = 0.980,
= 0.002。测验时间因素、刺激类型因素和组别因素三者交互效应不显著,F(2, 17) = 0.134,p = 0.875,
= 0.016。
Table 1. Reaction time (RT) and accuracy (ACC) of participants in the pre-test task and post-test task
表1. 前测任务和后测任务中被试的反应时(RT)与正确率(ACC)
|
|
视觉刺激 |
听觉刺激 |
视听觉刺激 |
|
|
RT (ms) |
ACC (%) |
RT (ms) |
ACC (%) |
RT (ms) |
ACC (%) |
实验组 |
前测 |
558.29 |
96.95 |
604.49 |
97.84 |
487.16 |
97.84 |
后测 |
535.10 |
96.78 |
581.40 |
98.08 |
460.51 |
98.56 |
控制组 |
前测 |
536.92 |
95.50 |
605.85 |
97.04 |
486.78 |
96.79 |
后测 |
529.39 |
97.43 |
592.23 |
98.56 |
480.05 |
98.88 |
3.3. 竞争模型
Figure 3. A direct comparison of the audio-visual combination model with the predictive competitive model
图3. 视听觉结合模型与预测竞争模型的直接比较
首先,本研究在200至1200 ms的反应时间范围内,以10 ms为周期,对不同负荷条件下的概率值进行了计算。接着,对单独视觉、单独听觉、视听觉结合在前、后测任务中的累计概率和竞争模型(Race Model)累计分布概率进行了分析。最后,将两个任务中实际视听觉结合的累计概率与竞争模型累计分布概率的累计差异概率值相减,并在每10 ms的时间点上进行单样本t检验(与0进行比较)。结果如图3所示,实验组中,前测任务显著违反竞争模型(显著大于0)的时间窗口为450~560 ms,峰值在480 ms,为17.27%;后测任务显著违反竞争模型(显著大于0)的时间窗口为390~540 ms,峰值在470 ms,为21.34%。控制组中,前测任务显著违反竞争模型(显著大于0)的时间窗口为450~480 ms,峰值在450 ms,为6.13%;后测任务显著违反竞争模型(显著大于0)的时间窗口为410~420 ms,峰值在420 ms,为9.05%。这表明,在两种任务中均存在视听觉整合现象。另外,实验组前测任务的峰值比后测任务的时峰值高,说明知觉学习能有效改善老年前期被试的视听整合能力。
4. 讨论
本研究以知觉学习任务作为认知训练方式,设计了视听觉辨别任务的前、后测任务,以此评估其对老年前期人群感知能力的影响。结果发现,分析视听觉辨别任务时,我们对被试的反应时、正确率和竞争模型进行了考察。通过对反应时和正确率进行分析,发现知觉学习能有效提高老年前期人群的单通道反应和双通道反应的正确率。此外,通过竞争模型的分析,知觉学习能有效提高视听整合的峰值。
知觉学习能够有效改善老年前期人群的感知能力和视听整合能力。已有研究表明,对处于老年前期阶段的人群进行视听觉训练,能有效改善其认知能力[20]。此外,阿尔茨海默病患者的近期康复效果和干预水平可因认知知觉功能障碍训练与作业疗法的结合使用而得到提升[21]。这与本研究的关于视听觉辨别任务的结果一致。根据知觉负载理论,注意资源是有限的,当一个任务对注意资源的需求增加时,其他任务得到的注意资源也将减少[22]。在前测任务中,由于老年前期人群是第一次接触到本研究,因此需要花费更多的注意资源。此外,视听觉辨别任务中还存在标准刺激的干扰,而老年前期人群抗无关信息干扰的能力较弱,因此表现出更高的整合能力[23]。通过7天的知觉学习,老年前期人群对视听觉辨别任务的熟悉度提高,所需要的注意资源减少,因此,在后测任务中的反应时和正确率均有提高,进一步的竞争模型分析也展示出了更高的视听觉整合峰值。但是,值得注意的是,竞争模型的结果还显示了,老年前期人群的时间整合窗口变宽。视听觉辨别任务中采用的是视听觉不一致刺激,这种刺激具有更高的认知负荷,会相互干扰,老年前期人群的大脑难以加工不一致的视听觉刺激[24]。此外,有研究发现,注意减少时老年前期人群更难抑制无关听觉刺激的加工[25]。当老年前期人群进行后测任务时,熟悉度的提高会使他们减少注意资源的投入,并且老年前期人群抗无关信息干扰能力较弱,进而导致了后测任务中的视听整合窗口变宽。
同时,研究也存在一些不足之处。首先,知觉学习在任务和刺激方面都具有极高的特定性,这意味着个体的训练效果仅限于他们接受过训练的特定感知能力。然而在本研究中,仅采用了视听结合的知觉学习模式,并未采用其他的刺激来探究知觉学习的收益。未来研究可以加入更为多元化的知觉学习模式来探究更加全面的知觉学习收益。此外,由于样本量有限,本研究未对性别、文化程度、地区等因素对训练收益的影响做交叉分析,未来研究可进一步提高样本量以明确不同特质的老年前期人群在知觉学习的获益程度。
基金项目
贵州中医药大学大学生创新创业训练计划项目资助(贵中医大创合字(2023)41号)。
NOTES
*通讯作者。