1. 引言
心脏病是目前全球范围内最常见的疾病之一,也是导致死亡和残疾的主要原因之一。世界卫生组织的数据显示,每年因心脏病导致的死亡人数约为1800万,占全球总死亡人数的31%。心血管疾病是心脏病的一种类型,包括冠状动脉疾病、心肌梗死、心力衰竭等。虽然心脏病的发病率很高,但是通过及时预测可以成功地控制病情并改善生活质量。近年来,随着医学影像技术的发展和深度学习的兴起,通过结合不同类型的医学影像数据和多种模态的特征信息,融合模型能够提供更全面、准确的心脏病检测和诊断结果,为心脏病患者提供早期诊断和治疗。
传统的心脏病图像检测方法主要依赖于单一的影像模态或特定的特征提取方法,如支持向量机、随机森林、线性回归等。朱家群 [1] 使用支持向量机(SVM)在二维图像中进行识别和定位左心室目标区域,在利用梯度方法找出边缘点,达到分割的目的,但在实际应用中结果不尽人意;吴彰良 [2] 等提出一种基于支持向量机分类的油封缺陷图像检测方法,准确率达到92.5%;张作淳 [3] 利用随机森林对遥感高分辨率图像沿海地貌进行检测,误差率在20%左右。
伴随深度学习的逐渐成熟,研究人员将深度学习技术应用于临床检测,进一步提高了检测效率和就诊速度。谢宁 [4] 提出了i-YOLOX算法,利用involution构建iCSPLayer特征提取层,检测速度提高了40.4%;赵越 [5] 等基于Tensorflow搭建YOLOv4网络模型,不同分辨率、不同品种、不同时期的麦穗图像均类平均精度(mAP)为93.7%;张桃红 [6] 等基于深度学习的医疗辅助诊断方法,准确率为94.2%。
本文基于融合模型的心脏病图像检测方法为临床医生提供了更精确的心脏病诊断结果,并为个体化治疗方案的制定提供有力支持。通过综合考虑不同模态的图像数据和特征信息,全面评估心脏结构、功能和血液流动等方面的异常,有助于及早发现和诊断心脏病变。进一步的研究和探索将进一步提升基于融合模型的心脏病图像检测的准确性和可靠性,为心脏病的预防、诊断和治疗带来重要的进展。
2. 模型概述
2.1. YOLOv5模型
YOLOv5是由Ultralytics开发的一种基于深度学习的目标检测框架,YOLOv5模型是基于YOLOv3模型基础上改进而来的,有YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x四个模型。YOLOv5模型由骨干网络、颈部和头部组成。它将目标检测任务视为回归问题,在单个前向传递中预测边界框和类别。大大提高了图像处理速度。
在网络结构方面,YOLOv5采用了一种新的骨干网络结构,即CSPDarknet,它结合了Cross-StagePartial连接(CSP)和Darknet网络。同时引入多尺度预测的策略,通过在不同的特征图层上预测边界框,以适应不同大小的目标。以更好地处理小目标和大目标,提高检测的准确性。YOLOv5 [7] 在目标检测领域取得了显著的成果,并在各种实际应用中得到广泛应用。
2.2. 融合模型
融合模型结合了YOLOv5和Attention注意力机制的优点,进一步提升了目标检测的准确性和性能。YOLOv5通过在单个前向传递中预测目标边界框和类别,具有较快的推理速度和较低的资源消耗。引入注意力机制后,模型可以根据输入数据的不同部分调整关注的权重,从而提高对目标的准确性和鲁棒性。融合模型的网络结构见图1。融合模型的检测过程如下:
1) 输入图像:首先,将待检测的心脏病图像作为输入,设定超参数后训练模型。
2) YOLOv5特征提取:利用YOLOv5模型对输入图像进行特征提取。YOLOv5作为一种实时目标检测算法,在单次前向传播中预测出图像中所有目标的位置和类别。在特征提取过程中,YOLOv5将自动学习不同尺度的特征表示,并通过卷积层、池化层等组件来提取丰富的上下文信息。
3) Attention注意力机制:在YOLOv5处理图像结束后,输出一个初步的检测图像。然后使用Attention注意力机制,在不同尺度的特征图之间建立关联。进一步提高模型对小目标的检测能力 [8] 。Attention机制的核心思想是根据输入特征的重要性分配权重,从而使模型更加关注重要的区域。
4) 特征融合:将YOLOv5和Attention注意力机制得到的特征进行融合,形成一个更强大的特征表示。这种融合可以提高模型对目标的检测精度和召回率。具体而言,将YOLOv5的特征与Attention机制得到的加权特征相乘,然后再通过全连接层进行分类或回归任务。
5) 解码器:使用解码器根据融合后的特征图生成目标框和类别概率。解码器的输出包括目标框的坐标(中心、宽高)、置信度得分以及对应的类别概率。在YOLOv5中,解码器采用BBox Head结构,其中包含多个卷积层和池化层用于预测目标框的坐标和置信度得分。
6) NMS (非极大值抑制):为了去除重叠的目标框,使用NMS算法对解码器的输出进行筛选。NMS根据目标框的IoU (交并比)来消除重叠区域,从而得到最终的目标检测结果。
7) 可视化和后处理:对于每个检测到的目标,选择绘制边界框、显示类别标签等操作,以便于用户观察和分析。将结果数据可视化,方便观察和记录此外,对检测结果采用非极大值抑制、重采样等技术进行后处理,进一步提高心脏病图像检测性能。
通过在特定的网络层引入注意力机制,模型可以更加聚焦于图像中的关键区域,提高对目标的理解和处理能力。融合模型的优势在于通过YOLOv5的快速和准确的目标检测能力,以及注意力机制的关注能力,该算法在保持高性能的同时,进一步提升了目标检测的效果,提高了检测精确率和召回率,具有较好的鲁棒性。同时,融合模型还具有快速性、适应性强、可扩展性和通用性等优势,可以广泛应用于其他计算机视觉领域。

Figure 1. Fusion model network structure diagram
图1. 融合模型网络结构图
3. 实验分析
实验数据集包括CardiacMRI (MRI)心脏病影像数据集和Sunnybrook (SCD)心脏数据,在两种数据集上验证模型,使得模型具有可靠性和稳定性,示例图像见图2 (左为MRI图像,右为SCD图像)。实验前对图像进行数据预处理,图像预处理的目的在于降噪、增强及归一化 [9] 。预处理后的数据集处理有助于凸显心脏病变的特征 [10] ,使研究人员能够更好地理解心脏疾病,并开展相关的诊断和治疗研究。实验设备显卡为1080 Ti,显存为11 GB,实例内存为31 G,系统盘为20 G,数据盘为50 GB。实验模型使用相同的两个数据集并在相同实验环境下进行实验,两种模型均使用相同的超参数,最后统计结果并将其可视化。
通过训练得到的权重求得混淆矩阵,进一步计算出各模型的准确率Accuracy、精确率Precision、召回率Recall、F1-Score分数和AUC值灵敏度。将这五类评价指标作为模型性能的度量标准。在数据集上的结果对比见表1。将实验结果进行可视化,曲线图见图3。
由实验结果可知,引入注意力机制后极大地提升了分类准确率。融合模型在训练过程中展现出出色的鲁棒性和高效的收敛性,这为模型的稳健性和训练效果提供了有力支持,最终的预测结果的准确率持续稳定地保持在98%以上,进一步彰显了该模型在处理分类任务上的优异表现。由曲线图可知,随着迭代轮次增加,模型准确率不断提升,损失函数值不断下降。在迭代超过80轮之后,融合模型的准确率提高至98%以上,损失函数值降低至10%以下,说明融合模型的分类检测效果较好。由此说明,将注意力机制与YOLOv5模型相融合,将显著提高医学领域的在体农作物图像识别准确率,为医学领域的发展做出了巨大贡献。

Table 1. Comparison of experimental results
表1. 实验结果对比

Figure 3. Comparison curve of accuracy and loss function values
图3. 准确率和损失函数值对比曲线图
4. 结语
首先,为了提高临床上心脏病的检测准确度和速度,我们通过融合模型来综合利用不同模态的图像数据和特征信息,提供了更全面的信息来支持识别和分类任务。通过控制超参数,设置合理的实验验证模型的有效性。对进行实验的两个数据集进行离散化和归一化处理,增强心脏病图像的可靠性;然后,采用融合模型进行分类和预测,实验结果表明,基于融合模型检测心脏病图像,准确率高达98%以上,损失函数值低至10%以下,具有良好的检测效果。
此外,使用深度学习技术进行心脏病图像检测在医学领域具有潜力极大潜力。随着社会不断进步,计算机技术在各行各业飞速发展,基于深度学习对心脏病人员的快速检测和诊断的方法是十分可行的。
该研究成果为医学领域的心脏病检测提供了重要的技术支持和应用潜力,有望为临床图像检测研究提供巨大帮助。但是,心脏病图像数据往往存在稀疏性和多样性的特点,这对模型的设计和训练提出了挑战。此外,模型选择和优化也是一项重要的任务,需要针对不同的心脏病类型和图像特征进行针对性的设计和训练。因此,未来的研究需要进一步探索和完善心脏病图像识别方法,提高识别准确度和鲁棒性,以更好地服务于临床诊断和治疗。