1. 引言
随着我国社会经济发展和人口老龄化加速,心血管疾病(CVD)已成为国民健康的首要威胁,2021年占农村和城市死因的48.98%和47.35% [1]。其中,急性心肌梗死(AMI)因发病急骤、病情凶险备受关注。尽管介入治疗技术不断进步,《中国卫生健康统计年鉴2022》显示我国AMI死亡率仍呈上升趋势,且存在显著城乡差异:省级医院住院病死率为3.1%,市级5.3%,县级高达10.2% [2]。因此,加强AMI识别与提升基层诊疗水平具有重要意义。
近年来,基于心电图信号的心肌梗死识别研究取得了显著进展。现有方法主要可分为传统机器学习方法和深度学习方法两大类。传统机器学习方法依赖特征工程和分类器构建。如Sahu和Ray基于KNN的检测方法达99.82%准确率[3],Yang等人的VCG卦限划分与CART结合使灵敏度达97.28% [4]。这类方法虽具解释性,但难以处理复杂数据和适应个体差异。深度学习通过端到端学习自动提取特征,显著提升诊断性能。CNN方面,Liu等人的多导联模型准确度达96.00% [5];时序建模方面,Darmawahyuni等证实LSTM优于传统RNN和GRU,灵敏度达98.49% [5]。针对多导联信号复杂性,多模型组合方法成为研究热点。Yu等人的时空MI网络创新性地将一维信号转为二维矩阵[6];Qiang等人的多通道密集注意力网络采用并行通道结构,无需去噪预处理实现高效检测[7];Yao等人结合SE残差网络与Transformer提升了准确率和F1分数。这些研究表明,融合多种深度学习架构可更全面捕捉心脏特征,提高心电信号分析的准确性和鲁棒性[8]。
心肌梗死智能诊断领域近年来虽取得显著进展,但现有方法仍存在两大核心局限:其一,数据维度利用不足。当前主流模型多基于单导联或片段化心拍数据进行检测,未能充分挖掘12导联心电信号特有的多维度临床价值。12导联系统通过不同电极组合反映心脏各区域电活动,对梗死灶定位具有不可替代的解剖学意义,而现有方法的降维处理导致关键空间特征丢失。其二,特征融合机制低效。传统多特征融合方法普遍采用特征拼接或线性加权策略,此类简单操作不仅引发维度灾难,还会引入大量噪声和冗余信息,严重制约模型对病理特征的聚焦能力。针对上述挑战,本研究提出系统性解决方案,主要贡献点包括:
1) 提出一个端到端深度学习架构,实现心肌梗死诊断与病灶定位的同步优化。通过共享特征层捕捉两类任务的共性规律,利用独立输出层学习特异性表征,提升临床实用价值。
2) 本研究提出多信息融合网络(Multi-Information Fusion Network, MI-Net),通过心拍特征提取和全局特征提取两个模块分别捕获局部时序特征和整体特征,并设计自适应特征选择机制引入动态权重分配机制,抑制噪声干扰并减少冗余维度,提升疾病相关特征的表达纯度。
3) 基于真实临床数据的系统评估充分验证了该方法在心肌梗死分类与定位任务中均显著优于现有单任务模型及传统融合方法。通过特征可视化技术验证其决策逻辑与临床心电图诊断标准高度一致,增强医生对AI结果的信赖度。
2. 方法
2.1. 数据集描述
本研究使用数据全部来自于上海瑞金医院的数据库,并对此进行了一项回顾性分析。在遵循《赫尔辛基宣言》中关于人体医学研究伦理原则的基础上,我们所有的研究程序都得到了医院伦理委员会的批准【批准号:(2021)临床伦理审查第(23)号】。为了确保患者隐私不受侵犯,使用的所有数据都经过了彻底的脱敏处理。
2.2. 数据集预处理
心电信号分析受噪声与基线漂移干扰显著[9],尤其影响QRS复合波等关键波形检测。实际采集的ECG信号常见干扰源包括设备电磁干扰及人体肌电活动,其中基线漂移(源于电极接触阻抗变化与呼吸运动)与肌电干扰最为突出。针对此,本研究采用三步预处理方案:基线漂移抑制、肌电噪声消除及信号归一化,在消除干扰的同时最大限度保留原始特征,为后续分析提供高质量数据基础。鉴于本研究已预消除工频噪声,对此,心电信号去噪流程图如图1所示。
Figure 1. ECG signal denoising flowchart
图1. 心电信号去噪流程图
本研究采用分层滤波策略消除心电信号中的基线漂移与肌电干扰。针对基线漂移的低频特性[10],基于db4小波基进行9层分解,通过将最低频近似系数(A9)置零重构信号,消除基线偏移同时保留0.5 Hz以上有效成分。对于肌电干扰,采用sym8小波基进行4层分解,结合软阈值去噪,抑制高频随机噪声;随后采用0.5-40Hz四阶巴特沃斯带通滤波器进行零相位滤波,在通带内保持幅值平坦性,消除残留高频噪声及小波处理引入的伪影。该方法通过小波域与频域处理的协同作用,在去除干扰的同时最大程度保护QRS波群、ST段等关键诊断特征的形态完整性。最后,为了使处理后的信号具有统一的幅值范围,便于不同心电信号之间的比较和后续分析,对信号进行归一化处理。归一化采用最大最小值方法,将信号幅值映射到[−1, 1]区间内。这种处理确保了不同病人、不同记录条件下的心电信号具有可比性,同时也有利于后续特征提取和分类算法的应用。
对心电数据进行完去噪之后,提出了一种基于切比雪夫带通滤波[11]和Hilbert变换[12]的改进算法用于心电数据的定位与分割。该方法首先通过带通滤波进行信号预处理,继而采用非线性变换增强R波特征,最后利用Hilbert变换的过零点检测实现R波的自适应定位。这种设计既避免了对固定阈值或模板的依赖,又确保了较低的计算复杂度。提出的心电信号定位流程图如图2所示。
Figure 2. ECG signal localization flowchart
图2. 心电信号定位流程图
在R波峰值定位后,以检测点为中心截取左140、右340采样点的心拍段(总长480点),完整涵盖P-QRS-T波形关键特征;同时为避免信号首尾因电极接触不稳定或设备启停噪声导致的误检,舍弃原始信号起止段各200采样点,消除边界效应对心拍分割的影响。该策略在保留诊断关键区的前提下有效提升了心拍截取的可靠性。
2.3. 深度学习模型构建
2.3.1. MI-Net网络模型构建
本研究提出了一种基于深度学习的心肌梗死识别模型,该模型通过对心电信号的多维度分析,为心肌梗死的疾病判别和病灶定位提供了一种新的解决方案。模型采用了双流架构设计,能够同时处理长程心电信号和单个心拍数据,从而实现对心肌梗死更全面和精确的判断。具体流程如图3所示。
Figure 3. Schematic diagram of the MI-Net architecture
图3. MI-Net模型架构示意图
模型由三个核心模块构成:全局特征提取模块通过多尺度卷积捕获心电信号的长程时域依赖及整体趋势;心拍特征提取模块聚焦单个心拍的P-QRS-T波群形态与病理特征,解析局部波形细节;特征融合模块采用多头注意力与注意力池化层自适应整合多尺度特征,最终通过分类头同步完成分类与定位任务。该架构通过全局–局部特征协同分析,模拟临床诊断逻辑,提升病理识别精度。
2.3.2. 心拍特征提取模块
本研究针对传统CNN在深层架构中易出现梯度消失及参数冗余的问题,基于ResNet [13]的跳跃连接机制设计了一维心拍特征提取模块。该模块通过一维卷积核在时间维度的滑动操作,自适应捕获ECG信号中时序动态特征。
具体来说,心拍特征提取模块通过一维卷积与残差学习机制实现局部波形特征建模。输入信号
。首先经过一维卷积层
。其中,卷积核尺寸为3,步长为2,填充为1。
为LeakyReLU [14],定义为
,
是一个正数常数,用于控制负区域的斜
率。这三个组件的有机结合构成了一个基本的特征提取模块。经过该模块处理后,输出特征
既保留了关键的时序信息,又实现了特征的升维表达。
随后通过串联的两个一维残差块进行深层特征提取。残差路径通过1 × 1卷积调整通道数或恒等映射。这种设计不仅缓解了深层网络的梯度消失问题,还使得模型能够自适应地学习残差函数,在保证网络深度的同时维持了梯度的有效传递。最后的残差块输出通过特征融合得到
。这种残差学习机制使得网络能够更好地保持和利用浅层特征,同时学习新的特征表示,从而在心电信号
的特征提取任务中取得更好的效果。最终,通过全局平均池化压缩时序维度,得到高维特征
。
总体来说,该模块通过卷积–残差架构捕捉心拍内P-QRS-T波群的形态动力学特征,池化层聚合全局时序信息,为下游任务提供判别性特征表示。
2.3.3. 全局特征提取模块
由于全局的长程心电信号
包含了2.5秒的12导联信息和10秒的II导联信息,首尾易受电极噪声干扰的问题,在预处理阶段截断头尾各100个采样点,保留L = 4800有效信号段。基于此,改进心拍特征提取模块为并行多分支卷积架构,通过多分支时域卷积操作同步提取多导联、多心拍周期的互补特征,增强模型对长时序信号中跨导联及周期性特征的融合能力。
并行多分支卷积模块通过卷积核尺寸
的多尺度特征同步提取机制,建模心电信号的局部细节与全局动态。各分支特征提取公式为:
(1)
其中,
是输入张量,
是第i个卷积核的权重矩阵,
表示一维卷积操作,
是第i个卷积核的偏置,3/5/7的尺寸卷积核分别捕获短时波动(如P波形态)、中程节律(如QRS时限)及长程周期(如ST段趋势)。
各分支提取的多尺度特征随后在通道维度上进行拼接
,形成一个综合性的特征表示
,以此来提高了特征的表示能力,从而增强了模型对复杂心电模式的识别能力。通过Dropout正则化与残差块进行深层融合,再经最大池化压缩时序维度,得到最后的高维度特征。该设计利用分支间参数共享与特征交互,有效整合不同时间尺度的电生理模式,提升对复杂心电动态的建模效果。
2.3.4. 多尺度特征自适应融合模块
在心电信号特征融合方面,传统方法往往采用简单的特征拼接或加权融合策略,这容易导致特征信息的有效性降低,且难以保持不同尺度特征之间的内在关联。
Figure 4. Architecture illustration of the multi-scale adaptive feature fusion module
图4. 尺度特征自适应融合模块示意图
对此,本文采用多尺度特征自适应融合的策略(图4),通过多头子注意力[15]与注意力池化机制整合心拍局部特征
和全局特征
。具体来说,采用8头自注意力机制建模跨尺度特征关联:
(2)
随后,使用残差和归一化操作增强特征稳定性,得到每个头的特征
。在特征整合的最终阶段,采用基于注意力机制的自适应池化策略来融合时序信息,数学表达式为:
(3)
其中,
是输入序列中的第i个,
和
分别是第一个和第二个线性层的向量,tanh作为激活函数。至此,全局特征
和局部特征
拼接后形成统一表示
,输入分类头完成决策。该机制通过多头交互与自适应加权,强化关键时序特征的贡献,抑制冗余信息。
2.3.5. 损失函数
针对心肌梗死筛查中的分类与定位任务分别设计了差异化的损失函数。对于二分类任务,采用了加权二元交叉熵作为损失函数,其计算公式如下:
(4)
其中,
为心肌梗死样本的数量,
是正常心电样本的数量。对于多分类定位任务,采用加权交叉熵损失,以更好地适应真实的临床环境。计算公式如下:
(5)
其中,N是样本总数,
是第c类的样本数量,
表示样本i的真实标签,
是样本i的真实类别,
是每个类别的权重。两类损失函数均通过反向传播放大少数类的梯度信号,以适配不同任务中数
据分布不均衡的特性。
2.4. 实验环境及参数设置
本研究采本研究实验环境基于PyTorch框架构建,代码采用Python 3.9编写,硬件配置为GeForce RTX 4090 GPU,运行于Ubuntu 22.04操作系统,以保障训练效率与实验可复现性。两个实验所用参数一致如表1所示。
Table 1. Experimental parameter details
表1. 实验参数细节
名称 |
参数 |
优化器 |
AdamW |
初始学习率 |
1e−3 |
学习率调度器 |
StepLR (步长 = 5) |
训练周期 |
30 |
批次大小 |
128 |
2.5. 实验评估指标
本研究针对心肌梗死识别需求设计了两类任务:二分类任务用于判断患病与否,采用准确率、AUROC、召回率(Recall,即敏感性)、特异性及F1值五项指标,综合评估模型对阳性与阴性样本的区分能力;定位多分类任务旨在识别梗死位置,针对数据类别不均衡问题,采用微平均(Micro-Average)与加权平均(Weighted-Average)方法评估精确率、召回率及F1值。具体地,微平均通过全局汇总所有类别的计算指标,加权平均则依据类别样本占比对各类别指标加权求和。
3. 实验结果
3.1. 数据集预处理和划分结果
本研究基于2019年1月至2021年12月期间的临床心电图数据,经严格筛选后,排除63份质量异常或诊断不明确数据,纳入51,547份正常与3925份心肌梗死样本。所有心肌梗死样本以医生诊断为金标准。由于心梗数据集呈现出明显的长尾分布特征,因此,将广泛性前壁心梗、前间壁心梗、前壁心梗等位置统一归类为前壁心梗,并对其他心梗位置进行了类似的整合处理。最终纳入了2395份前壁心梗样本(标签2)、1315份下壁心梗样本(标签0)、101份侧壁心梗样本(标签1)和75份后壁心梗样本(标签3),共3886份样本数据作为该任务的数据集。
数据集按6:1:3比例分层划分为训练集、验证集与测试集,分层抽样策略保障各子集类别分布与总体一致,以缓解样本量不均衡问题。
图5展示了心肌梗死样本的去噪效果:基线漂移校正后,信号等电位线稳定于零电位附近,消除低频漂移干扰;肌电噪声抑制阶段显著降低高频震荡(如PR段与T波区域),在维持P-QRS-T波形形态完整性的同时,提升了关键诊断区间的信噪比,验证了去噪方案的有效性。
通过R波定位与心拍分割实现周期级分析。选取10秒II导联信号(其R波时序与多导联同步且波形完整)作为基准,经滤波后精准定位R波(图6),并将该定位映射至其他导联进行跨导联心拍分割,确保数据一致性并降低冗余。
Figure 5. Denoising flowchart for myocardial infarction ECG signals
图5. 心肌梗死心电信号去噪效果图
Figure 6. Localization flowchart for myocardial infarction ECG signals
图6. 心肌梗死心电信号定位效果图
最终构建双尺度输入:4800采样点的多导联长序列(涵盖整体节律与跨导联动态)与480采样点的单心拍序列(聚焦P-QRS-T波群形态),通过同步输入模型实现宏观节律趋势分析与微观病理特征的协同建模,提升心肌梗死诊断精度。
3.2. 模型实验结果
3.2.1. 分类实验
表2展示了模型在心肌梗死分类任务中的性能。其整体判别效能显著,准确率(97.84%)与AUROC (98.84%)表明模型对心肌梗死与正常心电图的区分能力突出。98.82%的特异度与84.55%的精确度提示其可有效避免正常样本的误判,而84.84%的灵敏度与84.69%的F1分数则反映了对心肌梗死病例的稳健识别能力,这对临床识别中平衡漏诊与误诊风险具有实践价值。
Table 2. Experimental results for myocardial infarction classification task
表2. 心肌梗死分类任务实验结果
标签\预测 |
正常 |
心肌梗死 |
Acc (%) |
AUROC (%) |
Sensitivity (%) |
Specificity (%) |
Precision (%) |
F1 score (%) |
正常 |
15,286 |
182 |
97.84 |
98.73 |
84.84 |
98.82 |
84.55 |
84.69 |
心肌梗死 |
178 |
996 |
为验证模型性能,本研究通过对比实验与消融实验分析关键设计的影响。对比实验结果如表3所示,重点考察并行多分支卷积结构中卷积核组合的差异:采用统一尺寸与混合尺寸两类配置对比。结果显示,混合尺寸组合较单一尺寸能更有效捕获多尺度特征,显著提升分类性能。消融实验进一步验证数据输入形式及特征融合模块对模型的关键作用,表明多尺度特征融合机制可增强模型对心肌梗死病灶的泛化识别能力。
Table 3. Comparative study of multi-scale convolutional kernel combinations
表3. 尺度卷积核组合对比实验
多尺度卷积核组合 |
Acc (%) |
AUROC (%) |
Sensitivity (%) |
Specificity (%) |
Specificity (%) |
F1 score (%) |
相同尺寸卷积核 |
[3, 3, 3] |
97.13 |
96.65 |
86.14 |
97.68 |
69.10 |
[5, 5, 5] |
97.27 |
97.32 |
82.77 |
98.29 |
77.50 |
[7, 7, 7] |
96.58 |
96.10 |
79.77 |
97.68 |
69.27 |
不同尺寸卷积核 |
[3, 7, 11] |
96.95 |
97.11 |
79.30 |
98.26 |
77.08 |
[5, 7, 9] |
97.22 |
97.52 |
82.71 |
98.24 |
76.74 |
[3, 5, 7] |
97.84 |
98.73 |
84.84 |
98.82 |
84.55 |
消融实验结果如表4所示。基础模型中,完整长序列输入相较单心拍输入在F1分数(+12%)、AUROC (+6%)及准确率(+0.9%)上均表现出显著优势,表明多导联长时程动态特征对诊断具有关键价值。双路径输入策略使模型达到96.42%准确率、97.70% AUROC与80.38% F1分数,证实了局部–全局特征协同建模的有效性。引入多尺度特征融合模块后,各输入模式性能进一步提升:完整序列输入的F1分数(Δ + 19%)、准确率(Δ + 1.1%)及敏感性(Δ + 7%)提升显著;单心拍输入的F1 (Δ + 16%)、准确率(Δ + 0.8%)与敏感性(Δ + 10%)同步优化;双路径输入下F1提升19%、准确率增加1.1%。该模块通过跨尺度特征交互机制,显著增强了模型对心电信号时序依赖与形态细节的联合建模能力。
Table 4. Ablation study
表4. 消融实验
心拍数据 |
全局数据 |
特征融合模块 |
Acc (%) |
AUROC (%) |
Sensitivity (%) |
Specificity (%) |
Precision (%) |
F1 score
(%) |
✓ |
|
|
94.85 |
88.37 |
73.29 |
95.78 |
42.87 |
54.10 |
|
✓ |
|
95.97 |
95.71 |
81.65 |
96.69 |
55.52 |
66.48 |
✓ |
✓ |
|
96.42 |
97.70 |
82.88 |
98.10 |
78.03 |
80.38 |
✓ |
|
✓ |
95.38 |
93.93 |
71.69 |
96.80 |
57.39 |
63.74 |
|
✓ |
✓ |
96.59 |
97.91 |
84.97 |
98.49 |
80.14 |
82.48 |
✓ |
✓ |
✓ |
97.84 |
98.73 |
84.84 |
98.82 |
84.55 |
84.69 |
3.2.2. 定位实验
表5结果显示,模型在心肌梗死定位任务中性能均衡:Micro平均下AUROC达92.45%,Recall (88.68%)与F1 (88.68%)接近;Weighted平均中AUROC (88.67%)与F1 (88.52%)保持稳定。两类指标下F1分数波动小于0.16%,表明模型对类别不均衡数据具有较强适应性。
Table 5. Classification performance for myocardial infarction
表5. 心肌梗死分类性能表
|
AUROC (%) |
Precision (%) |
Recall (%) |
F1 score (%) |
Micro |
92.45 |
88.68 |
88.68 |
88.68 |
Weighted |
88.67 |
88.59 |
86.68 |
88.52 |
表6结果显示,模型对前壁与下壁心肌梗死的检测性能显著突出:前壁心梗的精确度(Precision)、召回率(Recall)及F1分数均超过90%,下壁心梗三项指标稳定在85%左右;混淆矩阵进一步验证其识别可靠性,下壁与前壁的识别率分别达85.6%和92.6%,表明模型对此两类解剖位置的心梗具有较高的定位准确性。
Table 6. Localization performance for myocardial infarction
表6. 心肌梗死定位性能表
标签 |
对应类别 |
AUROC (%) |
Precision (%) |
Recall (%) |
F1-score (%) |
0 |
下壁心梗 |
89.01 |
84.92 |
85.79 |
85.35 |
1 |
侧壁心梗 |
75.67 |
84.21 |
51.61 |
64.00 |
2 |
前壁心梗 |
89.27 |
91.36 |
92.63 |
91.99 |
3 |
后壁心梗 |
81.56 |
70.00 |
63.64 |
66.67 |
图7展示了前间壁心梗的类激活热力图。颜色强度表示模型关注程度:深红色区域代表模型高度关注的信号特征,而浅黄色区域则表示相对较低的关注度。前间壁由左前降支分支供血,其闭塞可引发V1~V3导联病理性Q波、ST段抬高及T波倒置。热力图中,模型在V1~V3导联的QRS波群与ST段区域呈现高激活强度,与临床诊断关注点完全一致。同时,模型对下壁导联(II, III, aVF)的响应显著减弱,表明其能精准捕捉前间壁病变的定位特征,有效排除非相关导联干扰,印证了模型对心肌梗死解剖–电生理关联机制的学习能力。
Figure 7. Class activation heatmap for anteroseptal myocardial infarction
图7. 前间壁心梗类激活热力图
4. 结论
本研究针对心电信号智能分析中数据利用率不足、特征信息损耗及多尺度融合效率低等核心问题,提出了一套系统性解决方案。在数据预处理阶段,通过动态截取策略保留心拍关键诊断区域(P-QRS-T复合波),规避传统固定窗口导致的ST段与T波特征丢失;模型架构方面,创新性设计多尺度特征自适应融合机制,利用注意力引导的跨模态交互替代传统特征拼接方法,显著提升病理特征的表达能力。基于三甲医院临床数据的实验表明,本研究构建的多信息融合网络在心肌梗死二分类任务和定位分类任务获得了不错的性能,验证了方法的有效性。
当前研究的局限性主要体现在数据分布层面:侧壁与后壁心肌梗死样本占比过少,导致模型对特殊解剖部位病变的识别特异性受限。未来计划通过三方面进行优化:其一,联合多中心医疗机构构建跨地域心电数据库,重点补充侧壁、后壁等稀缺心梗样本;其二,开发基于解剖先验约束的特征增强算法,强化模型对低频病理模式的捕捉能力;其三,建立设备异构数据校准机制,提升模型在多元采集环境下的泛化性能。这些改进将推动心肌梗死智能诊断技术向临床实用化迈进。
基金项目
本文由科技创新2030——“新一代人工智能”重大项目(2022ZD0160704)部分资助。