孤独症谱系障碍儿童声音情绪的加工特点研究
Research on the Processing Characteristics of Emotional Voices in Children with Autism Spectrum Disorder
DOI: 10.12677/ae.2026.161113, PDF, HTML, XML,   
作者: 王 泽:济南大学教育与心理科学学院,山东 济南;青岛市崂山区特殊教育学校,山东 青岛;宿淑华:济南大学教育与心理科学学院,山东 济南
关键词: 孤独症谱系障碍儿童智力障碍儿童声音情绪加工Children with Autism Spectrum Disorder Children with Intellectual Disabilities Emotional Processing of Vocalizations
摘要: 孤独症谱系障碍(简称ASD)是一类以社交障碍、重复行为、有限兴趣等为主要特征的复杂性神经发育疾病。孤独症谱系障碍(ASD)儿童的声音情绪识别缺陷严重影响其社交能力。本研究通过两个实验探究ASD儿童与智力障碍儿童的声音情绪加工特点。实验一采用2 × 3混合设计,发现ASD儿童声音情绪识别正确率低于智力障碍儿童,反应时更长,两类儿童对正性情绪声音的识别正确率均高于负性与中性。实验二加入图片辅助,结果显示图片辅助可提高两类儿童的识别准确性并缩短反应时,但ASD儿童的进步幅度小于智力障碍儿童。结论:ASD儿童声音情绪加工存在缺陷,正性情绪识别占优,图片辅助可改善其识别能力。
Abstract: Autism spectrum disorder (ASD) is a complex neurodevelopmental disorder characterized primarily by social impairments, repetitive behaviors, and limited interests. Deficits in vocal emotion recognition significantly impair the social abilities of children with ASD. This study investigated the vocal emotion processing characteristics of children with ASD and intellectual disabilities through two experiments. In Experiment 1, a 2 × 3 mixed-design approach was employed, revealing that children with ASD had lower accuracy in vocal emotion recognition and longer reaction times compared to children with intellectual disabilities. Both groups demonstrated higher accuracy in recognizing positive vocal emotions than negative or neutral ones. Experiment 2 introduced pictorial aids, showing that such assistance improved recognition accuracy and reduced reaction times for both groups. However, the progress of children with ASD was less pronounced than that of children with intellectual disabilities. Conclusion: Children with ASD exhibit deficits in vocal emotion processing, showing a bias toward recognizing positive emotions, and image-assisted methods can enhance their recognition abilities.
文章引用:王泽, 宿淑华. 孤独症谱系障碍儿童声音情绪的加工特点研究[J]. 教育进展, 2026, 16(1): 822-828. https://doi.org/10.12677/ae.2026.161113

1. 引言

以往研究表明,孤独症谱系障碍(ASD)儿童在情绪加工领域存在多方面特征:面孔表情识别准确性低于典型发展儿童,且对正性情绪识别最优,表情类型和强度对其识别正确率影响显著[1] [2];肢体情绪识别存在愤怒优势效应,对上肢情绪加工最深,同时存在面孔逃避行为,可能导致社交障碍[3];音乐情绪觉知与体验基本保持正常,且同情绪背景音乐可促进面孔情绪感知[4] [5]。但单独针对声音情绪识别的研究较少,已有研究发现ASD儿童通过声音识别情绪存在困难,难以通过语音信息判断情绪[6] [7],且社交情景中缺少信息线索整合能力。此外,视听双通道整合优势仅在单独听觉通道存在,双通道音乐情绪加工效率高于单听觉通道,情绪信息不一致时以听觉线索为主导[5] [8]

基于此,本研究通过两个实验系统探究ASD儿童声音情绪加工特点:一是对比ASD儿童与智力障碍儿童在单一声音条件下的加工差异,二是检验图片辅助对两类儿童声音情绪识别的影响,以期为提升ASD儿童社交能力提供依据。

研究假设如下:孤独症谱系障碍儿童在声音情绪识别方面的反应时明显长于智力障碍儿童,正确率整体低于智力障碍儿童,且在中性声音情绪识别上正确率差异更显著;图片辅助后,两类儿童正确率提高、反应时减少,其中正性和负性情绪声音的正确率提升更明显。

实验一采用2 (被试类型:ASD组、智力障碍对照组) × 3 (情绪类型:正性、负性、中性)混合实验设计,以声音为单一刺激,通过反应正确率和反应时,探究不同声音情绪类型对两类儿童识别加工的影响,明确ASD儿童声音情绪加工的基础特征。

实验二同样采用2 × 3混合实验设计,在声音刺激基础上加入情绪图片辅助呈现,通过相同因变量指标,探究图片提示条件下两类儿童的声音情绪加工差异,检验视觉辅助对声音情绪识别的促进作用。

实验一与实验二形成递进关系:实验一聚焦听觉单通道加工机制,明确ASD儿童声音情绪识别的核心缺陷;实验二通过引入视觉线索构建视听双通道情境,对比单通道与双通道加工效果,深入揭示图片辅助对ASD儿童声音情绪加工的调节作用,共同为理解其情绪认知特点提供证据。

2. 问题提出

2.1. 研究设计

2.1.1. 研究目的

探究不同情绪类型(正性、负性、中性)对ASD儿童声音情绪识别的影响,比较ASD儿童与智力障碍儿童的加工差异;检验图片辅助对两类儿童声音情绪识别的作用,为提高ASD儿童社交能力提供建议。

2.1.2. 研究内容

采用2 (被试类型:ASD组、智力障碍对照组) × 3 (情绪类型:正性、负性、中性)混合实验设计。实验一探究单一声音条件下两类儿童的声音情绪加工特点;实验二探究声音 + 图片条件下的加工差异。通过反应正确率和反应时分析数据,验证研究假设并提出干预建议。

2.1.3. 研究假设

ASD儿童声音情绪识别反应时长于智力障碍儿童,正确率更低,尤其在中性情绪识别上差异显著;图片辅助可提高两类儿童的正确率并缩短反应时,且对正性、负性情绪的提升更明显。

2.2. 研究意义

2.2.1. 理论意义

深入探讨ASD儿童声音情绪加工缺陷及视听双通道加工机制,补充该群体情绪识别研究的循证素材,为理解其社会交往障碍的成因及改进教育机制提供理论依据。

2.2.2. 实践意义

揭示ASD儿童声音情绪识别特征,为制定针对性干预方案奠定基础,助力其理解他人情绪、提升社交能力,推动临床诊断与教育实践的结合。

3. 实验一 声音条件下ASD儿童声音情绪加工特点的研究

3.1. 研究方法

3.1.1. 研究对象

从济南市两所特殊教育学校筛选10~15岁ASD儿童22名(排除2名未完成实验者,有效20名)和智力障碍儿童21名(排除1名未完成实验者,有效20名)。所有ASD儿童均经正规医院诊断,韦氏全量表智商 > 70,无其他精神或神经障碍。两组被试智力水平匹配(见表1)。

从济南市槐荫区和市中区某两所特殊教育学校四到九年级筛选年龄在10~15岁之间的孤独症谱系障碍儿童和智力障碍儿童。对实验组和控制组进行相关特征检验,见表1

Table 1. Comparison of intelligence levels between the experimental and control groups

1. 实验组和控制组的智力水平对比

ASD儿童

智力障碍儿童

t

p

总智商

78.75

78.55

0.104

0.918

3.1.2. 实验材料

实验从三类声音情绪中各选取5种,15种声音重复2次,共30个试次。选取中国本土化情绪声音库中时长5000 ms的声音,归为正性(狂喜、愉悦、兴奋)、中性(沉静)、负性(烦闷、惊恐)三类,每类5种,重复呈现2次,共30个试次。声音的愉悦度、唤醒度、优势度一致性较高。

3.1.3. 实验设计

使用E-prime2.0编程声音情绪加工特点的行为学实验,进行无关变量及其控制,采用2 (被试类型) × 3 (情绪类型)的被试间实验设计。被试类型为被试间变量,声音情绪类型为被试内变量,因变量是声音情绪识别加工水平(正确率、反应时等)。

3.1.4. 实验程序

实验在光线微弱环境中进行,被试距屏幕30~70 cm,电脑音量45。每个试次流程:1000 ms注视点→5000 ms声音呈现→被试点击对应表情选项(正性为笑脸、中性为无表情、负性为苦脸)→1000 ms空白间隔。试次随机呈现,先进行练习实验再正式实验。

3.2. 研究结果

3.2.1. 反应时

被试类型主效应显著(F(1, 38) = 8.532, p < 0.05),ASD儿童反应时(9374 ± 3135 ms)显著长于智力障碍儿童(7045 ± 1789 ms);情绪类型主效应不显著(p > 0.05),但正性情绪反应时略短于中性和负性(见表2)。

3.2.2. 正确率

情绪类型主效应显著(F(1, 38) = 5.643, p < 0.05),正性情绪正确率(0.598 ± 0.034)显著高于负性(0.474 ± 0.035)和中性(0.358 ± 0.033),负性显著高于中性;被试类型主效应不显著(p > 0.05),但ASD儿童总体正确率(0.447 ± 0.106)低于智力障碍儿童(0.506 ± 0.139),见表2

Table 2. Accuracy and reaction time (M ± SD) under different emotional types

2. 不同情绪类型下的正确率与反应时(M ± SD)

被试

正性

中性

负性

均值

正确率

ASD

0.558 ± 0.229

0.321 ± 0.207

0.463 ± 0.259

0.447 ± 0.106

智力障碍

0.638 ± 0.206

0.395 ± 0.216

0.486 ± 0.180

0.506 ± 0.139

反应时(ms)

ASD

9156 ± 3556

9451 ± 3135

9515 ± 4531

9374 ± 3135

智力障碍

6574 ± 1859

7002 ± 2152

7559 ± 1905

7045 ± 1789

3.3. 讨论

实验一结果表明,ASD儿童声音情绪识别更慢且不准确,可能与其对情绪声音刺激不敏感有关。两类儿童均表现出正性情绪识别优势,印证了“快乐优势效应”[9] [10],即正性情绪信息更易处理,可能促进积极社交参与,这一发现为低年级孤独症儿童社交游戏开发提供了重要依据——可优先设计以笑声、欢呼声等正性情绪声音为核心线索的互动游戏,降低情绪识别门槛。中性情绪识别正确率最低,推测其情绪特征模糊,较难引发注意,这提示在社交游戏中应减少中性情绪刺激的使用,或通过强化中性情绪与具体社交场景的关联(如“安静等待”的游戏情境)帮助儿童建立认知。

4. 实验二 声音 + 图片条件下ASD儿童声音情绪加工特点的研究

4.1. 研究方法

4.1.1. 研究对象

与实验一相同。

4.1.2. 实验材料

在声音材料基础上匹配黑白情绪图片(640 × 480像素),经Photoshop同质化处理,确保图片情绪与声音情绪一致。

4.1.3. 实验设计与程序

实验设计同实验一,增加图片辅助变量。程序为:1000ms注视点→5000ms声音 + 图片同时呈现→被试点击选项→1000ms空白间隔,试次随机呈现。

4.2. 研究结果

4.2.1. 反应时

被试类型主效应显著(F(1, 38) = 4.443, p < 0.05),ASD儿童反应时(6928 ± 2886 ms)仍长于智力障碍儿童(5247 ± 2136 ms);情绪类型主效应不显著(p > 0.05,见表3)。

4.2.2. 正确率

被试类型主效应显著(F(1, 38) = 7.862, p < 0.05),ASD儿童正确率(0.553 ± 0.142)低于智力障碍儿童(0.659 ± 0.095);情绪类型主效应显著(F(1, 38) = 13.999, p < 0.05),正性(0.767 ± 0.034) > 负性(0.614 ± 0.036) > 中性(0.435 ± 0.033)。

对比实验一与实验二,图片辅助主效应显著:实验二正确率更高(F(1, 38) = 60.626, p < 0.001),反应时更短(F(1, 38) = 43.173, p < 0.001),且正性、负性情绪正确率提升更明显;但ASD儿童中性情绪正确率在两实验中无显著差异。本实验以被试类型和情绪类型为自变量,以正确率和反应时为因变量,进行描述统计,见表3

Table 3. Accuracy and reaction time (M ± SD) under sound + image conditions

3. 声音 + 图片条件下的正确率与反应时(M ± SD)

被试类型

正性

中性

负性

均值

正确率

ASD

0.716 ± 0.261

0.390 ± 0.166

0.553 ± 0.239

0.553 ± 0.142

智力障碍

0.819 ± 0.157

0.481 ± 0.244

0.676 ± 0.214

0.659 ± 0.095

反应时(ms)

ASD

6972 ± 3093

6679 ± 3285

7133 ± 3441

0.6928 ± 0.2886

智力障碍

4658 ± 1859

5544 ± 2275

5538 ± 2614

0.5247 ± 0.2136

4.3. 讨论

图片辅助显著提升了两类儿童的声音情绪识别能力,但ASD儿童进步幅度较小,可能与其对图片情绪感知不敏感有关,这为低年级孤独症儿童社交游戏设计提供了实践启示:可采用“声音 + 图片”双线索融合的游戏形式,如搭配情绪图片的声音配对游戏、情景模拟类社交互动游戏,通过可视化的情绪线索辅助儿童理解声音背后的情绪意义。正性和负性情绪在双通道条件下进步更明显,印证了情绪类型对加工的影响;中性情绪提升有限,因其情绪特征较弱,图片辅助作用不足,这提示在社交游戏开发中需重点强化正性与负性情绪的多感官联动设计,如通过角色扮演游戏让儿童在体验中关联情绪声音与社交行为。

5. 总讨论

5.1. ASD儿童的声音情绪加工特点分析

本研究发现,ASD儿童声音情绪识别存在“慢且准度低”的缺陷,可能与生理神经传导慢、社交经验不足有关,印证了情绪加工缺陷是ASD核心症状之一。两类儿童均表现出正性情绪识别优势,与以往“高兴情绪识别正确率高于恐惧、悲伤”的结论一致[11] [12],这一特点可直接应用于低年级孤独症儿童社交游戏开发,例如设计以“寻找快乐声音”“情绪声音接龙”等为主题的游戏,借助正性情绪优势提升儿童的游戏参与度与社交主动性。图片辅助通过视听整合促进识别,但ASD儿童受益较少,提示其跨通道整合能力较弱[8] [13],这要求社交游戏在设计时需控制多线索的复杂程度,采用循序渐进的方式融入视听刺激,如先单一呈现正性情绪声音,再逐步搭配对应图片与简单社交任务,帮助儿童逐步建立情绪识别与社交互动的关联。

5.2. 教育启示

1) 优先选择高愉悦度正性声音开展训练,强化正性情绪识别能力[6] [7],可将其转化为低年级社交游戏素材,如通过“情绪声音猜猜乐”游戏让儿童在互动中熟悉正性情绪声音的特征;

2) 采用“因质施教”,结合图片等视觉辅助工具设计干预活动[14] [15],例如开发融合视听线索的社交角色扮演游戏,让儿童在模拟场景中练习情绪识别与社交回应;

3) 在融合教育中关注ASD儿童的情绪识别需求,及时提供引导,可通过课堂小游戏(如小组情绪声音传递)促进ASD儿童与同伴的互动,提升社交适应能力;

4) 构建社交实践平台,通过情境训练提升其情绪应用能力,针对低年级儿童设计简单易懂的社交游戏,将情绪声音识别融入日常游戏场景,让儿童在玩乐中积累社交经验。

5.3. 研究不足与展望

5.3.1. 研究不足

1) 被试选取存在局限:本研究样本数量较少,可能导致统计检验力不足,难以充分反映群体整体特征;且被试年龄跨度较小,无法探究不同年龄阶段(如低龄学前阶段、青春期) ASD儿童声音情绪加工的发展差异,限制了结果的年龄普适性。

2) 实验材料生态效度有限:声音材料统一采用5000 ms固定时长,而现实生活中情绪声音的时长具有显著多样性,且未结合具体社交情境,与真实生活中的情绪感知场景存在差异,可能影响研究结果对实际应用的指导价值。

3) 研究方法较为单一:仅采用行为实验(正确率、反应时)作为数据收集手段,只能反映ASD儿童声音情绪加工的外在行为表现,无法揭示其背后的神经生理机制,难以从本质上解释情绪加工缺陷的成因。

5.3.2. 研究展望

1) 深化神经机制探究:未来可结合脑成像技术(如ERP、fMRI)与行为实验,同步采集ASD儿童在声音情绪加工过程中的神经电生理数据与行为数据,深入分析其大脑颞叶、杏仁核等情绪相关脑区的激活模式,揭示声音情绪识别缺陷及多感觉整合不足的神经基础,为理论模型的完善提供更直接的证据支持。

2) 拓展研究维度与场景:一方面,可进一步拓展跨通道研究,除视听双通道外,纳入触觉、嗅觉等多感官线索,探究ASD儿童多模态情绪信息整合的特点;另一方面,增加真实社交情境的模拟,或采用生态瞬时评估法(EMA)收集自然环境中的情绪识别数据,提升研究的生态效度;同时,可关注不同情绪强度、不同语境下的声音情绪加工差异,丰富研究内容。

3) 优化样本结构与研究设计:扩大被试样本量,纳入不同年龄阶段、不同智力水平、不同ASD症状严重程度的被试;此外,可采用纵向追踪设计,长期观察ASD儿童声音情绪加工能力的发展轨迹,以及干预训练对其能力提升的长期效果。

6. 结论

1) ASD儿童声音情绪识别反应时显著长于智力障碍儿童,正确率显著低于智力障碍儿童。

2) 两类儿童对正性情绪声音的识别正确率最高,负性次之,中性最低,正性情绪反应时最短。

3) 图片辅助可提高两类儿童的识别准确性并缩短反应时,但ASD儿童进步幅度小于智力障碍儿童。

4) 声音 + 图片条件下,正性和负性情绪识别正确率的提升显著高于单一声音条件。

参考文献

[1] 郭文斌. 自闭症谱系障碍儿童面部表情识别的实验研究[D]: [博士学位论文]. 上海: 华东师范大学, 2013.
[2] 魏玲, 王静, 余宥依, 等. 自闭症谱系障碍儿童对面孔加工的同龄偏向效应[J]. 心理科学, 2023, 46(1): 72-81.
[3] 任翰林, 黄亮, 郑玉玮, 等. 自闭症谱系障碍儿童的肢体情绪加工特征: 来自眼动的证据[J]. 中国临床心理学杂志, 2021, 29(1): 8-13.
[4] 王锦文. 自闭症者对音乐和情境情绪识别的实验研究[D]: [硕士学位论文]. 江西: 南昌大学, 2021.
[5] 周欣, 郑莹灿, 肖子伦, 等. 基于视听双通道的音乐情绪冲突效应及优势通道研究[J]. 心理学探新, 2022, 42(1): 36-45.
[6] 范佳露. 国外声音情绪识别干预研究的回顾与反思[J]. 现代特殊教育, 2018(16): 57-63.
[7] 蒋重清, 李亮, 张喜娥, 等. 非言语情绪声音中的情绪声音识别[J]. 辽宁师范大学学报(社会科学版), 2019, 42(3): 84-91.
[8] 黄佳慧. 社交定向中自闭症儿童视听双通道情绪知觉特征的研究[D]: [硕士学位论文]. 金华: 浙江师范大学, 2022.
[9] Ozonoff, S., Pennington, B.F. and Rogers, S.J. (1990) Are There Emotion Perception Deficits in Young Autistic Children? Journal of Child Psychology and Psychiatry, 31, 343-361. [Google Scholar] [CrossRef] [PubMed]
[10] 陈云云, 张雅静, 李家菊, 等. 情绪面孔注意偏向的可塑性: 正性声音注意的影响[J]. 心理技术与应用, 2019, 7(6): 332-339.
[11] Dyck, M.J., Piek, J.P., Hay, D., Smith, L. and Hallmayer, J. (2006) Are Abilities Abnormally Interdependent in Children with Autism? Journal of Clinical Child & Adolescent Psychology, 35, 20-33. [Google Scholar] [CrossRef] [PubMed]
[12] Braverman, M., Fein, D., Lucci, D. and Waterhouse, L. (1989) Affect Comprehension in Children with Pervasive Developmental Disorders. Journal of Autism and Developmental Disorders, 19, 301-316. [Google Scholar] [CrossRef] [PubMed]
[13] 霍鹏辉. 声音情绪及情绪状态对注视知觉的影响[D]: [硕士学位论文]. 苏州: 苏州大学, 2020.
[14] 宿淑华, 胡慧贤, 赵富才. 基于ICT的自闭症谱系障碍儿童情绪干预研究综述[J]. 中国特殊教育, 2019(4): 47-53.
[15] 郭琳琳. 自闭症谱系障碍个体情绪认知及干预方法研究[J]. 中国特殊教育, 2019(9): 44-50.