基于卷积神经网络的多标签心电信号分类
Multi-Label ECG Signal Classification Based on Convolutional Neural Network
DOI: 10.12677/mos.2025.142168, PDF, HTML, XML,    科研立项经费支持
作者: 季 磊, 孙占全, 杨 姿, 黎凌峰:上海理工大学光电信息与计算机工程学院,上海
关键词: 多标签分类卷积神经网络多尺度残差注意力标签增强Multi-Label Classification Convolutional Neural Network Multi-Scale Residual Attention Label Enhancement
摘要: 针对当前主流心电图多标签分类方法在特征提取能力不足及缺乏有效标签关系建模的挑战,本研究提出了一种多标签心电图卷积神经网络分类模型。该模型包含三个关键模块:多尺度卷积模块、残差注意力模块和标签增强模块。具体而言,多尺度卷积模块能够在不同尺度上有效捕捉心电信号的空间特征,增强对不同心电图信号特征的捕捉能力。残差注意力模块结合并行注意机制,提取心电图信号中时间和空间信息,增强心电图信号中的潜在特征捕捉能力。标签增强模块通过建模标签间的相关性,进一步优化对心律失常类别的预测能力。在两个心电图数据集上进行实验,所提出模型的F1分数分别达到83.2%和73.0%。验证了所提出模型在分类性能和泛化能力上的显著优势。
Abstract: Aiming at the challenges of current mainstream ECG multi-label classification methods in terms of insufficient feature extraction capability and lack of effective label relationship modelling, this study proposes a multi-label ECG convolutional neural network classification model. The model contains three key modules: a multiscale convolution module, a residual attention module, and a label enhancement module. Specifically, the multi-scale convolution module can effectively capture the spatial features of ECG signals at different scales and enhance the ability to capture different ECG signal features. The residual attention module combines the parallel attention mechanism to extract temporal and spatial information in ECG signals and enhance the ability to capture potential features in ECG signals. The label enhancement module further optimizes the prediction ability of arrhythmia categories by modelling the correlation between labels. Experiments are conducted on two ECG datasets and the F1 score of the proposed model reaches 83.2% and 73.0%, respectively. The significant advantages of the proposed model in classification performance and generalization ability are verified.
文章引用:季磊, 孙占全, 杨姿, 黎凌峰. 基于卷积神经网络的多标签心电信号分类[J]. 建模与仿真, 2025, 14(2): 475-488. https://doi.org/10.12677/mos.2025.142168

1. 引言

心血管疾病的死亡率逐年上升,已成为全球主要的健康挑战之一。据世界卫生组织统计,其已成为仅次于癌症的第二大致命疾病[1]。心律失常是心血管疾病的重要组成部分,准确地检测和分类心律失常对于有效治疗和患者管理至关重要。常见的心律失常包括心房颤动、ST段抬高、束支传导阻滞和心房早搏,这些疾病可能单独发生,也可能共存。

心电图(ECG)是一种广泛用于监测心脏活动的无创技术,提供了关于心脏电活动的重要信息,被广泛用于诊断各种心脏疾病[2]。它记录了各种心脏成分,包括P波、QRS复合体和T波,反映了心房和心室的去极化和复极化过程。通过对心电图信号的分析,医生不仅能够诊断心脏疾病、监测心脏功能,还能预测心血管事件的风险。

然而,由于不同患者的身体状况各异,心电信号的形态和时间特征可能存在显著差异,因此心电图信号的准确分类一直是一个挑战。此外,两种不同的疾病可能在心电图上表现出相似的特征,增加了诊断的难度。传统的心电图分类方法通常依赖于专业医生的解读,容易受到人为因素的影响,导致误诊。因此,心电信号的自动分类技术已在临床医学中得到广泛应用。

传统的心律失常自动分类方法主要依赖心脏科医生手工特征提取技术。在临床实践中,已有多种基于机器学习的方法被提出。例如,Rouhi等人[3]提出了一种可解释的分类方法,通过提取手工设计的特征并选择最佳特征后,输入随机森林分类器进行分类。Beyli等人[4]开发了一种基于支持向量机(SVM)的心电图检测方法。Ye等[5]从两导联中分别提取形态学特征和动态特征,并融合导联特征后利用SVM对16种心跳类别进行分类。Qin等人[6]利用小波多分辨率分析提取低维心电图特征向量,随后采用主成分分析(Principal Component Analysis, PCA)来降低特征的维数,并将降维之后的特征输入支持向量机进行分类。Wang等人[7]基于临床诊断、形态学特征及统计特征提取局部和全局特征,这些特征经过主成分分析(PCA)进行降维后被送入随机森林分类器。这些研究为心律失常的自动分类提供了丰富的技术支持。

尽管上述方法已证明其有效性,但它们通常依赖于数据预处理和手工特征提取,从原始信号中提取特定特征。心电信号包含多种波形和噪声,手工特征提取往往难以充分利用原始信号中的潜在信息。由于过度依赖手工设计的特征与特征选择,这些方法在应对多样化和复杂的心电图模式时存在局限性。传统的基于手工特征的方法存在一些局限性,比如忽视时空相关性、对噪声敏感以及泛化能力不足。此外,分类器的性能往往受到数据分布变化的显著影响。一旦数据分布发生变化,其分类精度可能会大幅下降。随着特征维数的增加,模型参数选择的难度也显著增加,从而进一步限制了传统方法的适用性。因此,传统方法往往难以有效地处理心电信号。这些算法在某些特定设计的心律失常类别上表现较好,但在解决多分类问题和提升泛化能力方面仍存在不足。

近年来,深度学习技术在心电图分类中展现出显著潜力,通过大规模数据集训练,能够自动从原始信号中提取深层次特征,显著提升分类性能。与传统方法相比,深度学习无需依赖手工特征设计或繁琐规则,具有更强的泛化能力和适应性,能够有效应对不同类型的心电信号及噪声干扰。

Acharya等人[8]提出了一种基于9层卷积神经网络的方法,采用十倍交叉验证策略检测五种心电图节律。Li等人[9]基于ResNet架构部署了一维残差CNN,将双向心电信号与深度学习相结合,成功区分五种心律类别。Ge等人[10]使用SE (Squeeze-and-Excitation)模块来模拟通道注意力,该模块通过为不同导联分配不同的权重来增强对重要特征的关注,并减少对不相关特征的依赖。Ge等人[11]利用贝叶斯先验知识,对不同频率类型的心电图异常进行分类,并采用残差神经网络提取特征对12导联心电图进行分类。Yan等人[12]提出了一种基于Transformer块编码器的自注意力机制,用于对序列数据进行特征提取,从而提升模型的分类性能。Ran等人[13]认为不同类型的心律失常之间可能存在潜在的关联性,采用标签关联性嵌入技术,引导网络在训练过程中学习到更准确的标签表示。Pratiher等人[14]结合CNN和Transformer架构,通过特征编码的方式,在压缩参数数量的同时有效提取全局特征。Prabhakararao等人[15]提出了一种卷积神经网络框架,用于自动检测单导联短时心电图信号中的阵发性心房颤动。Srivastava等人[16]提出了一种增强通道注意力机制的残差模型,在心电图分类任务中展现出较强的特征学习能力。Natarajan等人[17]提出了一种完全基于Transformer的无卷积方法,该方法由多个自注意力模块和全连接层组成,能够通过学习不同波形之间的关联性和重要特征,实现心电图分类任务。

尽管上述模型在心电图分类任务中取得了令人鼓舞的结果,但是基于深度学习的方法也存在一些局限性。首先,许多应用于心律失常检测的深度学习模型是基于单导联心电图设计的,这限制了其对心脏活动的多维度解析能力,无法通过不同方向的信号监测提供对心脏活动的全面描述。其次,大多数基于深度学习的特征提取方法依赖于单一尺度的特征提取策略,这种方法可能会忽略不同尺度特征之间的潜在关联性和相互作用,从而限制了模型对多层次信息的有效挖掘。此外,部分研究将多标签分类问题简化为单标签分类,忽略了心电记录中可能存在的多种心律失常类型,从而降低了模型对复杂临床场景的适应性和分类准确性。

为了解决上述限制性,我们提出了一种基于残差注意力机制的卷积神经网络仿真模型(卷积神经网络的多标签分类模型),本文的主要贡献如下:

1) 本文提出的模型包含三个模块:(a) 多尺度卷积模块,增强对不同心电图信号特征的捕捉能力。(b) 残差注意力模块,增强心电图信号中的潜在特征捕捉能力。(c) 多标签增强模块,建模标签间的相关性,进一步优化对心律失常类别的预测能力。

2) 本文采用跳跃连接方法,将不同尺度的分辨率信息合并到最终的特征图中,以实现多尺度信息的融合。

3) 在两个公开的心电图数据集上进行的实验结果表明,本文提出的模型在心律失常分类任务中,优于一些现有的分类方法。

2. 仿真模型

2.1. 模型架构

本文提出了一种基于残差注意力机制的卷积神经网络模型,模型结构如图1所示。该模型由三大核心模块组成:多尺度卷积模块(Multi-Scale Convolution Module, MSCM)、残差注意力模块(Residual Attention Module)以及多标签增强模块(Multi-Label Enhancement Module, MLEM)。首先,多尺度卷积模块通过捕获和融合不同尺度的特征信息,实现对输入数据的多层次特征提取。其次,残差注意力模块通过并行的空间和通道注意力机制,有效建模特征映射间的相互依赖关系。然后,通过跳跃连接将不同层级的残差块输出与自适应池化层进行整合,得到综合特征图。最后,综合特征图被输入多标签增强模块,完成特征向量到分类标签的映射,进而实现对心电信号的精确分类。

Figure 1. The framework of our proposed model

1. 本文提出模型的架构

2.2. 多尺度卷积模块

多尺度卷积模块(Multi-Scale Convolution Module, MSCM)旨在从不同尺度捕获心电信号中的空间特征。其设计核心在于引入多层卷积操作,每一层卷积均采用不同的核大小,以使模型能够识别心电信号中不同空间范围内的模式特征,从而提升对心律失常相关信号中固有的细粒度信息和广域模式的建模能力。具体而言,采用小尺寸卷积核的卷积层侧重于捕获输入信号中的局部细节与细粒度特征,而大尺寸卷积核则通过扩展感受野,更加侧重于全局模式及特征间关系的学习。MSCM模块的结构如图2所示。

Figure 2. MSCM module structure diagram

2. MSCM模块结构图

首先,让 k= k 1 , k 2 ,, k n 表示MSCM模块中使用的 n 个卷积核大小的集合。这里, k i 代表特定大小的卷积核。对于输入的心电信号样本 x ,从每个卷积层提取的特征通过逐元素平均融合以获取多尺度信息 x ^ 。该过程可通过如公式所示:

x ^ = 1 n i=1 n Conv( x, k i , p i ) (1)

其中, n 是多尺度卷积模块中卷积层的数量, k i 代表第 i 个卷积层的卷积核大小, p i 代表第 i 个卷积层的填充数。在本文中, n=3 。通过上述融合得到的特征融合 x ^ 随后依次通过批量归一化层(BN)、RELU激活函数和最大池化层的处理,被输入到后续的残差注意力模块。

2.3. 残差注意力模块

在提取12导联心电信号特征时,需要对不同导联之间的依赖性和心电图节律的长期依赖性进行建模。在本文中,我们使用残差注意块(Residual Attention Block, RAB)作为模型特征提取的骨干。多个RAB的输出被合并为最终特征图,然后将其输入到多标签增强模块中,从而实现心电信号的精确分类。

RAB是在经典残差网络ResNet [18]的基础上进行了扩展,该主干网络包括两类模块,如图3(a)所示,第一种RAB由多个卷积层、一个并行注意力模块模块(Parallel Attention Module, PAM)、一个平均池化层、若干个归一化层(Batch Normalization, BN)和ReLU激活函数组成。与残差网络有所不同,在跳跃连接处加入了一个卷积层和一个最大池化层。与第一类模块相比,第二类模块缺少卷积层和池化层,残差网络的连接方式采用了直接连接,如图3(b)所示。每个卷积层后面都跟随一个BN层和一个ReLU激活函数,BN 层有助于在训练中获得更稳定的参数更新,ReLU函数是一种广泛使用的激活函数,因其在深度神经网络 中防止梯度消失问题方面的能力而备受认可。通过利用残差连接可以解决由于反向传播过程中梯度逐层递减导致靠近输入层时难以更新的问题。

PAM模块

图4所示,本文提出的并行注意力(PAM)模块作为残差注意力模块的关键组件,其灵感来源于[19]。PAM模块能够有效提取和利用心电信号中通道和空间特征,能够分别在通道维度和空间维度上实现特征增强,从而获得更详细和准确的特征集合,促使网络更多关注和学习心电图异常类型的特征信息,进一步提高心律失常自动分类的准确性和可靠性。

Figure 3. RAM module structure diagram

3. RAM模块结构图

Figure 4. PAM module structure diagram

4. PAM结构图

PAM由两个主要组件组成:一个包含空间注意力模块,另一个包含通道注意力模块。如图4所示,PAM中的通道注意力模块擅长提取通道特征。给定PAM的原始特征输入 x R C×L ,首先将 x 分别输入到两个卷积层中,得到两个新的特征图 A ch B ch ,其尺寸分别为 R C 1 ×L , R 1×L 。接着,将特征图 B ch 重塑为 R L×1 ,并应用softmax层与特征图 A ch 执行矩阵乘法,得到一个新的特征图。随后,通过卷积层、BN层和sigmoid函数,得到通道权重 f ch R C×1 。最后,将通道权重 f ch 与输入 x 进行逐元素相乘,得到通道特征输出 F ch R C×L 。在通道特征提取过程中,每个通道的最终输出特征都是由所有通道特征和原始特征的加权和,从而增强了模型的通道特征提取能力。

与通道注意力模块不同,空间注意力模块直接将原始特征输入经过卷积后得到的特征图 B sp 通过全局池化层进行处理,再重塑为 R 1× C 1 。接下来,应用softmax层,与特征图 A sp 执行矩阵乘法,得到一个新的特征图,再经过sigmoid函数计算得到空间权重 f sp R 1×L 。将空间权重 f sp 与输入 x 进行逐元素相乘,得到空间特征输出 F sp R C×L 。由于 F sp 是所有空间特征和原始特征的加权和,它能够有效地提取全局上下文信息,具备较强的空间特征提取能力,同时能够保持全局上下文信息的连贯性。

PAM模块将通道注意力模块的通道特征提取与空间注意力模块的强大位置特征提取功能优势相结合,从而有效提升了特征提取的效果。这种注意力机制增强了模型的分类性能,成为提升模型性能的关键组件。最终的输出特征图是由两个注意力模块的 F ch F sp 进行元素求和得到的。具体计算过程如下所示:

output= F ch + F sp (2)

PAM模块通过有效融合空间和通道注意力的优势,显著增强了特征提取能力,提升了模型的整体性能。

2.4. 多标签增强模块

在许多现有的模型中,最后的预测层通常采用全连接层来进行心律失常类别的预测。这种方法在单分类任务中表现良好,但在多分类任务中往往会忽视少数类别的心律失常,进而导致模型分类精度的下降。受Xun等人[20]的启发,本文提出了一种多标签增强模块(Multi-Label Enhancement Module, MLEM),该模块能够有效地学习不同标签之间的相关性,并利用这种相关性对原始标签的预测结果进行优化,从而提高标签预测的精确度。具体而言,如图5所示,输入特征经过两个分支处理后,将得到的结果进行拼接,随后通过线性层和sigmoid激活函数处理,最后将处理后的结果输入到堆叠8层的CorNet模块,以生成增强后的标签预测。该方法通过引入标签之间的相关性,不仅提升了模型对少数类别的识别能力,而且增强了整体分类性能。

CorNet模块

图6所示,CorNet模块将原始标签预测 x 作为输入,通过学习标签相关性来增强原始标签预测,最终输出增强的标签预测 y 。具体过程可表示为:

y=F( x )+x (3)

其中, x,y 分别是CorNet模块的输入和输出。 F( x ) 是映射函数, F( x ) 表达式如下所示:

F( x )= W 2 δ( W 1 σ( x )+ b 1 )+ b 2 (4)

其中, x 表示原始标签预测, W 1 W 2 是权重矩阵。 b 1 b 2 是偏置项。 σ δ 分别是sigmoid和ELU激活函数。通过这一映射函数,CorNet模块能够有效地捕捉标签间的潜在相关性,从而提升模型的预测精度和鲁棒性。

Figure 5. MLEM module structure diagram

5. MLEM结构图

Figure 6. CorNet module structure diagram

6. CorNet结构图

3. 实验结果与分析

3.1. 实验设置

本文提出的模型是在一台配备8G内存的 NVIDIA GeForce GPU显卡上进行训练和测试的,选择 Pytorch作为搭建网络模型的深度学习框架。在训练过程中,采用随机梯度下降优化器(SGD)来更新模型权重以及偏差参数,初始动量参数设置为0.9,采用BCE损失函数,训练周期(Epoch)为设置为150,批处理大小(Batch Size)设为32,随着训练的轮数增加,学习率从初始的0.1逐渐降低到0.001,将网络中全连接层之前的Dropout层的数值设置为0.5。通过上述超参数的设置,模型达到了最佳分类性能。

3.2. 数据集

为验证我们模型在多标签心律失常分类任务中的性能,本研究选用了目前心律失常分类任务中常用的两个数据集,CPSC 2018心电数据集和PTB-XL心电数据集。

CPSC 2018心电数据集[21]是2018年中国生理电信号挑战赛提供的一个12导联心电数据集。该数据采集自中国的11家医院,每个信号的采样频率为500 Hz。该数据集包含6877条心电记录,其中男性3699例,女性3178例,记录时长从6秒至60秒不等。这些数据共有9种类型,其中1种为正常类型,另外8种为心律失常类型。由于每条心电图数据长度不一致,直接用于训练时无法作为批量数据输入模型。因此,本文在预处理阶段对数据进行了统一化:对于长度不足10秒的记录,复制原数据将其扩充至10秒;对于长度超过10秒的记录,则截取前10秒的部分,确保所有记录的长度一致,从而得到统一长度的实验数据。

实验的另一个数据集是PTB-XL数据集[22]。该数据集包含21837条12导联心电图记录,来自18,885名患者,其中男性占52%,女性占48%。该数据集中的心电图记录具有100Hz和500Hz两种采样频率,每条心电图记录的持续时间为10秒。

在数据集划分方面,对于预处理后的CPSC 2018数据集,我们按照8:2的比例划分为训练集和测试集,同时确保测试集和训练集数据互不重叠。而对于PTB-XL数据集,本文则采用原论文推荐的训练集和测试集划分方式,其中训练集包含19267例记录,测试集包含2163例记录。推荐的测试集数据具有较高的标签质量,且数据分布与训练集保持一致,能够有效评估模型的性能。

3.3. 评价指标

为了更加客观地评估模型在数据集上的性能表现,本研究选用了汉明损失(Hamming Loss)、杰卡德系数(Jaccard Index)、准确率(Accuracy)、精确率(Precision)、召回率(Recall)以及F1分数作为评估仿真模型在多标签心律失常分类任务中的评估指标。计算公式如下所示:

Haming Loss= l n i=1 n y i y ^ i l (5)

Jaccard Index= l n i=1 n | y i y ^ i | l (6)

Accuracy= TP+TN TP+FP+TN+FN (7)

Precision= TP TP+FP (8)

Recall= TP TP+FN (9)

F1= 2×Precision×Recall Precision+Recall (10)

其中, y i 代表第 i 个样本的真实标签值, y ^ i 是第 i 个样本预测值, l 是类别数目, n 是样本个数。TP表示被正确分类为正类别的记录数量,而TN代表被正确预测为负类别的记录数量。FP表示被错误地识别为正类别的实例数量。FN是被错误分类为负类别的实例数量。

3.4. 实验结果

3.4.1. CPSC数据集实验结果

本文在CPSC2018心电数据集上对提出的模型与先前在12导联心电图分类任务中所采用的不同方法进行了性能对比,表1列出了各模型的主要性能指标,除汉明损失外,其他指标数值越高,表明模型的分类性能越优。与参考文献[13]总结的7种网络结构的性能指标相比,本文提出的模型在F1指标上有显著提升。与Ge [10]相比,本文提出的模型分类结果F1分数提升了0.004。尽管Chen等人提出的模型在F1分数上达到了0.837,但其模型是由130个模型单独训练的,并采用手动分配的权重进行组合推理。尽管性能较高,但此方法需要更多的训练和推理时间成本。相比之下,本文提出的模型在性能和时间效率上均表现出了明显的优势,充分证明其竞争力。此外,本文提出的模型在其他性能指标上也对比研究中的方法取得了不同程度的提升,验证了其在多标签ECG分类任务中的适用性。

为更直观地展示模型分类结果,本文绘制了数据集上的分类结果混淆矩阵(如图7所示)。其中,颜色深浅代表分类准确性的高低。从图中可以看出,本文提出的模型在大多数类别上均实现了出色的分类效果。

Figure 7. The confusion matrix on the test set of the CPSC2018

7. CPSC2018测试集上的混淆矩阵

Table 1. Comparison of results of the proposed model and those of the existing model on CPSC2018

1. 本文提出的模型与现有模型在CPSC2018心电数据集上的分类结果对比

Model

Hamming Loss

Jaccard Index

Accuracy

Precision

Recall

F1

ResNet [13]

0.0555

0.5574

0.6807

0.7393

0.6610

0.6850

xECGNet [13]

0.0440

0.6384

0.7304

0.8103

0.7313

0.7605

ML-GCN [13]

0.0428

0.6292

0.7177

0.8236

0.7085

0.7535

MLC-CNN [13]

0.0472

0.6047

0.6946

0.8034

0.6873

0.7337

P-GCN [13]

0.0455

0.6145

0.7016

0.8162

0.6970

0.7443

KGGR [13]

0.0451

0.6212

0.7132

0.8119

0.7062

0.7477

LCEGNet [13]

0.0407

0.6529

0.7500

0.8326

0.7375

0.7767

DMSFNet [23]

/

/

/

0.838

0.822

0.828

Ge et al. [10]

/

/

/

0.830

0.827

0.828

Chen et al. [24]

/

/

/

/

/

0.837

Ours

0.0335

0.7235

0.8145

0.819

0.8538

0.832

3.4.2. PTB-XL心电数据集实验结果

此外,为验证模型的泛化能力,本文还在PTB-XL数据集上评估模型的分类性能。PTB-XL数据集包括71个不同的陈述,分为44个诊断陈述,19个形式陈述和12个节律陈述。本文主要对诊断陈述的数据集进行实验,诊断陈述进一步分为超类和子类。由于在23个子类和44个诊断类中,少部分类别的心律失常出现次数极少,为减轻类别不均衡的影响,本次实验仅在5个超类上进行训练和测试。表2比较了本文模型与现有方法在PTB-XL数据集上得到的分类结果。除Precision以外,本文提出模型的其它多项指标均高于现有的模型。充分说明本文提出的方法在心电图分类任务中具有良好的泛化性和分类性能。

Table 2. The comparison of different models on the PTB-XL

2. PTB-XL数据集上不同模型的性能对比

Model

Accuracy

Precision

Recall

F1

Smigiel et al. [25]

/

0.714

0.662

0.680

DNNs [26]

/

/

/

0.683

FSL [27]

/

/

/

0.717

MRF-CNN [28]

/

0.730

0.710

0.720

Ours

0.635

0.703

0.769

0.730

3.5. 消融实验

为了验证提出的多尺度卷积模块、并行注意力模块和多标签增强模块的有效性,我们在CPSC2018数据集上进行了消融实验。并设计了三种对比模型。具体模型结构如下:

模型1:用普通卷积替代多尺度卷积模块,用于评估多尺度卷积模块有效性。

模型2:在残差注意力中去除PAM,用于评估PAM模块对模型性能的影响。

模型3:用全连接层 (Fully Connected Layer, FC)替代多标签增强模块,以验证多标签增强模块的有效性。

表3展示了对比模型与本文提出的模型在分类任务中的性能对比。通过比较模型1与本文模型的实验数据可以观察到,加入多尺度卷积模块后,模型性能指标均有小幅提升,这表明多尺度卷积模块能够有效改善模型的特征提取能力,从而提升整体分类性能。进一步比较模型2与本文模型的实验数据表明,加入PAM模块,模型的性能显著地提升,这一结果充分验证了PAM模块在改进模型分类性能中的关键作用。此外,通过比较模型3与本文模型的实验数据,可以发现,加入多标签增强模块后,模型性能也有小幅提升,进一步证明了多标签增强模块的有效性。实验结果表明,本文提出的每个模块均能够有效提升模型的分类性能,其中PAM模块对模型分类精度的提升最为显著。实验结果充分证明了本文提出的模块设计的有效性和合理性。

Table 3. Comparison of results of the proposed model and those of the existing model on CPSC2018

3. 本文提出的模型与现有模型在CPSC2018心电数据集上的分类结果对比

模型

Hamming Loss

Jaccard Index

Accuracy

Precision

Recall

F1

模型1

0.0343

0.7155

0.8074

0.806

0.860

0.827

模型2

0.0355

0.7012

0.8059

0.795

0.846

0.815

模型3

0.0342

0.7119

0.8038

0.809

0.845

0.824

Ours

0.0335

0.7235

0.8145

0.819

0.854

0.832

4. 结论

本文提出了一种创新的多标签心电图分类模型,旨在提升多标签心律失常分类任务的准确性与效率。该模型融合了多尺度卷积模块、残差注意力模块和多标签增强模块,以全面优化心律失常的分类性能。多尺度卷积模块在增强对多种心电图信号特征的捕捉能力方面发挥了关键作用,残差注意力模块通过精确提取潜在特征进一步增强了信号的表征能力,而多标签增强模块则通过建模标签间的相关性,优化了对多类别心律失常的预测能力。此外,跳跃连接方法的应用有效融合了不同尺度的信息,提高了模型的整体性能。

为验证所提模型的有效性,本文在CPSC2018和PTB-XL两个公开心电图数据集上进行实验。实验结果表明,模型在CPSC2018数据集上的F1值达到了0.832,在PTB-XL数据集上的F1值为0.730。这些结果显示,与近年来提出的多种最新分类方法相比,本文模型在分类准确性上具有显著优势,尤其是在F1值指标上超越了其他模型,充分展示了其卓越的分类性能。此外,我们在CPSC2018数据集上对模型的各个模块进行了消融实验。实验结果证明了所提出的多尺度卷积模块、残差注意力模块以及多标签增强模块的有效性。

在未来的研究中,计划结合多模态方法,将一维心电信号转化为二维频谱信号输入到网络中,以进一步提升心律失常识别的性能。

基金项目

本文由国防基础研究计划项目(JCKY2019413D001)、上海理工大学医学工程交叉项目(10-21-302-413)、上海市自然科学基金项目(19ZR1436000)部分资助。

参考文献

[1] Zhou, R., Yao, J., Hong, Q., Zheng, Y. and Zheng, L. (2023) Dams-net: Dual Attention and Multi-Scale Information Fusion Network for 12-Lead ECG Classification. Methods, 220, 134-141.
https://doi.org/10.1016/j.ymeth.2023.10.013
[2] Kaplan Berkaya, S., Uysal, A.K., Sora Gunal, E., Ergin, S., Gunal, S. and Gulmezoglu, M.B. (2018) A Survey on ECG Analysis. Biomedical Signal Processing and Control, 43, 216-235.
https://doi.org/10.1016/j.bspc.2018.03.003
[3] Rouhi, R., Clausel, M., Oster, J. and Lauer, F. (2021) An Interpretable Hand-Crafted Feature-Based Model for Atrial Fibrillation Detection. Frontiers in Physiology, 12, Article ID: 657304.
https://doi.org/10.3389/fphys.2021.657304
[4] Übeyli, E.D. (2007) ECG Beats Classification Using Multiclass Support Vector Machines with Error Correcting Output Codes. Digital Signal Processing, 17, 675-684.
https://doi.org/10.1016/j.dsp.2006.11.009
[5] Can, Y., Kumar, B.V.K.V. and Coimbra, M.T. (2012) Heartbeat Classification Using Morphological and Dynamic Features of ECG Signals. IEEE Transactions on Biomedical Engineering, 59, 2930-2941.
https://doi.org/10.1109/tbme.2012.2213253
[6] Qin, Q., Li, J., Zhang, L., Yue, Y. and Liu, C. (2017) Combining Low-Dimensional Wavelet Features and Support Vector Machine for Arrhythmia Beat Classification. Scientific Reports, 7, Article No. 6067.
https://doi.org/10.1038/s41598-017-06596-z
[7] Wang, Z., Li, H., Han, C., Wang, S. and Shi, L. (2019) Arrhythmia Classification Based on Multiple Features Fusion and Random Forest Using ECG. Journal of Medical Imaging and Health Informatics, 9, 1645-1654.
https://doi.org/10.1166/jmihi.2019.2798
[8] Acharya, U.R., Fujita, H., Oh, S.L., Hagiwara, Y., Tan, J.H. and Adam, M. (2017) Application of Deep Convolutional Neural Network for Automated Detection of Myocardial Infarction Using ECG Signals. Information Sciences, 415, 190-198.
https://doi.org/10.1016/j.ins.2017.06.027
[9] Li, Z., Zhou, D., Wan, L., Li, J. and Mou, W. (2020) Heartbeat Classification Using Deep Residual Convolutional Neural Network from 2-Lead Electrocardiogram. Journal of Electrocardiology, 58, 105-112.
https://doi.org/10.1016/j.jelectrocard.2019.11.046
[10] Ge, R., Shen, T., Zhou, Y., Liu, C., Zhang, L., Yang, B., et al. (2021) Convolutional Squeeze-and-Excitation Network for ECG Arrhythmia Detection. Artificial Intelligence in Medicine, 121, Article ID: 102181.
https://doi.org/10.1016/j.artmed.2021.102181
[11] Ge, Z., Jiang, X., Tong, Z., Feng, P., Zhou, B., Xu, M., et al. (2021) Multi-Label Correlation Guided Feature Fusion Network for Abnormal ECG Diagnosis. Knowledge-Based Systems, 233, Article ID: 107508.
https://doi.org/10.1016/j.knosys.2021.107508
[12] Yan, G., Liang, S., Zhang, Y. and Liu, F. (2019) Fusing Transformer Model with Temporal Features for ECG Heartbeat Classification. 2019 IEEE International Conference on Bioinformatics and Biomedicine (BIBM), San Diego, 18-21 November 2019, 898-905.
https://doi.org/10.1109/bibm47256.2019.8983326
[13] Ran, S., Li, X., Zhao, B., Jiang, Y., Yang, X. and Cheng, C. (2023) Label Correlation Embedding Guided Network for Multi-Label ECG Arrhythmia Diagnosis. Knowledge-Based Systems, 270, Article ID: 110545.
https://doi.org/10.1016/j.knosys.2023.110545
[14] Pratiher, S., Srivastava, A., Priyatha, Y.B., Ghosh, N. and Patra, A. (2022) A Dilated Residual Vision Transformer for Atrial Fibrillation Detection from Stacked Time-Frequency ECG Representations. ICASSP 2022-2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Singapore, 22-27 May 2022, 1121-1125.
https://doi.org/10.1109/icassp43922.2022.9747258
[15] Prabhakararao, E. and Dandapat, S. (2020) Multiscale Convolutional Neural Network for Detecting Paroxysmal Atrial Fibrillation from Single Lead ECG Signals. 2020 IEEE Applied Signal Processing Conference (ASPCON), Kolkata, 7-9 October 2020, 339-343.
https://doi.org/10.1109/aspcon49795.2020.9276690
[16] Srivastava, A., Pratiher, S., Alam, S., Hari, A., Banerjee, N., Ghosh, N., et al. (2022) A Deep Residual Inception Network with Channel Attention Modules for Multi-Label Cardiac Abnormality Detection from Reduced-Lead ECG. Physiological Measurement, 43, Article ID: 064005.
https://doi.org/10.1088/1361-6579/ac6f40
[17] Natarajan, A., Boverman, G., Chang, Y., Antonescu, C. and Rubin, J. (2021) Convolution-Free Waveform Transformers for Multi-Lead ECG Classification. 2021 Computing in Cardiology (CinC), Vol. 48, 1-4.
https://doi.org/10.23919/cinc53138.2021.9662697
[18] He, K., Zhang, X., Ren, S. and Sun, J. (2016) Deep Residual Learning for Image Recognition. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas, 27-30 June 2016, 770-778.
https://doi.org/10.1109/cvpr.2016.90
[19] Liu, H., Liu, F., Fan, X. and Huang, D. (2022) Polarized Self-Attention: Towards High-Quality Pixel-Wise Mapping. Neurocomputing, 506, 158-167.
https://doi.org/10.1016/j.neucom.2022.07.054
[20] Xun, G., Jha, K., Sun, J. and Zhang, A. (2020) Correlation Networks for Extreme Multi-Label Text Classification. Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 6-10 July 2020, 1074-1082.
https://doi.org/10.1145/3394486.3403151
[21] Liu, F., Liu, C., Zhao, L., Zhang, X., Wu, X., Xu, X., et al. (2018) An Open Access Database for Evaluating the Algorithms of Electrocardiogram Rhythm and Morphology Abnormality Detection. Journal of Medical Imaging and Health Informatics, 8, 1368-1373.
https://doi.org/10.1166/jmihi.2018.2442
[22] Wagner, P., Strodthoff, N., Bousseljot, R., Kreiseler, D., Lunze, F.I., Samek, W., et al. (2020) PTB-XL, a Large Publicly Available Electrocardiography Dataset. Scientific Data, 7, Article No. 154.
https://doi.org/10.1038/s41597-020-0495-6
[23] Wang, R., Fan, J. and Li, Y. (2020) Deep Multi-Scale Fusion Neural Network for Multi-Class Arrhythmia Detection. IEEE Journal of Biomedical and Health Informatics, 24, 2461-2472.
https://doi.org/10.1109/jbhi.2020.2981526
[24] Chen, T., Huang, C., Shih, E.S.C., Hu, Y. and Hwang, M. (2020) Detection and Classification of Cardiac Arrhythmias by a Challenge-Best Deep Learning Neural Network Model. iScience, 23, Article ID: 100886.
https://doi.org/10.1016/j.isci.2020.100886
[25] Śmigiel, S., Pałczyński, K. and Ledziński, D. (2021) ECG Signal Classification Using Deep Learning Techniques Based on the PTB-XL Dataset. Entropy, 23, Article No. 1121.
https://doi.org/10.3390/e23091121
[26] Śmigiel, S., Pałczyński, K. and Ledziński, D. (2021) Deep Learning Techniques in the Classification of ECG Signals Using R-Peak Detection Based on the PTB-XL Dataset. Sensors, 21, Article No. 8174.
https://doi.org/10.3390/s21248174
[27] Pałczyński, K., Śmigiel, S., Ledziński, D. and Bujnowski, S. (2022) Study of the Few-Shot Learning for ECG Classification Based on the PTB-XL Dataset. Sensors, 22, Article No. 904.
https://doi.org/10.3390/s22030904
[28] Feyisa, D.W., Debelee, T.G., Ayano, Y.M., Kebede, S.R. and Assore, T.F. (2022) Lightweight Multireceptive Field CNN for 12-Lead ECG Signal Classification. Computational Intelligence and Neuroscience, 2022, Article ID: 8413294.
https://doi.org/10.1155/2022/8413294