自动检测MR图像中的伪影：基于改进的AMAResNet网络

doi:10.12677/aam.2025.145278

期刊菜单

自动检测MR图像中的伪影：基于改进的AMAResNet网络
Automatic Detection of Artifacts in MR Images: An Enhanced AMAResNet-Based Network

DOI: 10.12677/aam.2025.145278, PDF, HTML, XML,
作者: 余嘉明：内蒙古大学数学科学学院，内蒙古呼和浩特
关键词: 卷积神经网络；MRI伪影；磁共振成像；残差网络；自动检测；Convolutional Neural Network； MRI Artifacts； Magnetic Resonance Imaging； Residual Network； Automatic Detection

摘要: 本文提出了一种创新网络结构，基于改进ResNet网络的算法，针对传统方法对局部特征和多尺度信息捕捉不足的问题，引入分块机制、Squeeze-and-Excitation (SE)模块和金字塔模块，分块机制将输入图像划分为局部子块以增强细节感知；SE模块通过通道权重自适应优化关键特征表达；金字塔结构融合跨尺度特征以提升复杂伪影识别能力。为解决类别不平衡问题，提出交叉熵与Dice损失的加权联合损失函数(最优权重比α = 0.7/β = 0.3)，构建出一个全新的名为AMAResNet的伪影检测模型，从而实现了MRI伪影的自动检测。该方法是数据驱动的，且不需要特殊的硬件要求，使用空间域中MR图像的大小作为输入。本文在真实数据上评估了算法性能，结果显示，改进后的网络在不同类型数据上的准确性和泛化能力方面均有显著提升。所提出的方法有望在扫描完成后立即将MR图像标记为无伪影或有伪影状态，从而确保获取高质量的MR图像，这对于准确的医学诊断至关重要。实验结果表明，改进后的ResNet网络在自动检测MRI伪影方面表现出色，具备在临床实践中广泛应用的潜力，有助于提高MRI图像质量和诊断准确性。

Abstract: This paper proposes an innovative network architecture based on an enhanced ResNet algorithm to address the limitations of traditional methods in capturing local features and multi-scale information. The framework introduces three key components: a partition mechanism that divides input images into local sub-regions to enhance detail perception, Squeeze-and-Excitation (SE) modules that adaptively optimize critical feature representations through channel-wise weighting, and a pyramid structure that integrates cross-scale features to improve complex artifact recognition. To resolve class imbalance issues, we design a weighted joint loss function combining cross-entropy and Dice Loss (optimal weight ratio α = 0.7/β = 0.3), ultimately constructing a novel artifact detection model named AMAResNet for automatic MRI artifact detection. This data-driven approach requires no specialized hardware and utilizes spatial domain MR image sizes as input. Evaluations of real-world datasets demonstrate that the enhanced network achieves significant improvements in both accuracy and generalization across different data types. The proposed method shows potential for immediate post-scan quality assessment by labeling MR images as artifact-free or artifact-affected, thereby ensuring high-quality medical imaging crucial for accurate diagnosis. Experimental results indicate that the improved ResNet architecture excels in automatic MRI artifact detection, exhibiting strong potential for clinical application to enhance both MRI image quality and diagnostic reliability.

文章引用：余嘉明. 自动检测MR图像中的伪影：基于改进的AMAResNet网络[J]. 应用数学进展, 2025, 14(5): 498-509. https://doi.org/10.12677/aam.2025.145278

1. 引言

磁共振成像(Magnetic Resonance Imaging, MRI)是一种无创且高精度的医学成像技术，因其在软组织分辨率上的卓越表现而被广泛应用于疾病诊断与研究。MRI能够精确且非侵入性地评估解剖结构、生理及功能过程。尽管MRI在临床诊断中应用广泛，但其图像质量常受伪影影响，特别是由患者运动引起的伪影，可能严重降低图像的清晰度和可用性[1] [2]。伪影通常表现为相位编码方向的移位、混叠结构及图像模糊[3]。在躯干呼吸和神经成像中，头部运动是常见且严重的运动伪影来源，其中由呼吸引起的非刚性位移和头部运动导致的刚性位移[4]尤为突出。

当MRI数据提示存在运动伪影干扰导致临床可用性降低时，这一质量控制问题尤为突出。运动伪影的空间异质性使其呈现层面选择性分布特征，这种非全域显性特征显著增加了影像即时判读的难度。为解决这一问题，Meding等人[5]创新性地提出了基于2DCNN的伪影检测方法，该方法依托先进的端到端学习框架，实现了MRI图像中运动伪影的自动、精准检测与校正，显著改善了图像质量，减少了人工介入的需求，从而验证了自动化医学图像质量评估的高效与可靠。紧接着，针对MRI中运动伪影的自动检测，3DCNN、MNetArt及VNetArt三种前沿网络架构相继问世[6] [7]，为伪影检测领域注入了新的活力。Oksuz等人[8]提出一种将深度学习与图像重建技术完美融合的高质量分割技术，极大地提升了心脏MRI图像的分辨率与精确度，为医学诊断提供了更为清晰、准确的图像依据。在自动脑肿瘤分割领域，一项改进后的卷积神经网络分割策略凭借其卓越的多任务处理能力与稳定性脱颖而出[9]，为脑肿瘤的早期发现与精准治疗提供了有力支持。此外，Ke等人[10]构建的全自动深度学习系统实现了从伪影分类、恢复，到肿瘤分类及细胞核分割等一系列复杂任务的自主完成，无需人工干预，展现了强大的结构独立性与跨任务通用性，极大地减轻了医务人员的工作负担。

ResNet结合了SE (Squeeze-and-Excitation)注意力机制和金字塔特征融合技术，已经广泛应用于多个领域，如物体检测、医学成像和故障诊断。例如，SE-ResNet [11]已被用于滚动轴承故障检测等故障诊断任务中，通过利用空间和通道信息，显著增强了特征提取能力。结合SE注意力机制的多尺度金字塔特征融合在小目标检测和水下图像分析等任务中表现出色，能够有效处理不同尺度的目标，提高检测精度[12]。另一个典型的应用是声振动信号的融合，该方法在机械故障检测中取得了显著效果，其中SE-ResNet模型通过多模态数据的集成，进一步提高了分类的准确性。然而，关于ResNet、SE注意力机制与金字塔特征融合三者结合应用的实例相对较少。尽管SE注意力机制和金字塔特征融合已经在目标检测、医学成像和故障诊断等多个领域得到了广泛应用，但三者的结合应用尚未见明确报道。

本文聚焦于残差网络ResNet，该网络由He等人[13]在2016年提出，旨在克服深层网络因层数增加而引发的梯度问题，进而优化训练效果。ResNet拥有多种深度变体，以灵活应对不同应用场景，其中ResNet18 [14]作为代表，广泛应用于图像分类与检测任务，其18层网络结构巧妙运用残差连接，有效缓解了深度训练中的梯度消失难题。在此基础上，本文创新性地提出了一种名为AMAResNet的网络，是基于ResNet架构的MRI自动伪影识别方法。针对传统方法对局部特征和多尺度信息捕捉不足的问题以及实现MRI图像中伪影的自动检测与量化评估，引入分块机制、Squeeze-and-Excitation (SE)模块和金字塔模块，分块机制将输入图像划分为局部子块以增强细节感知；SE模块通过通道权重自适应优化关键特征表达；金字塔结构融合跨尺度特征以提升复杂伪影识别能力，提升了模型的识别能力。为了提升模型的稳定性和检测精度以及类别不平衡的问题，提出交叉熵损失函数与Dice损失函数的加权联合损失函数，有效平衡了训练过程中的类别不平衡问题，并显著提高了伪影区域的精确定位能力。通过一系列详尽的实验验证，本文所提方法展现出了卓越的准确性和泛化能力，能够高效且准确地检测并量化不同类型MRI图像中的伪影。

本文的主要贡献在于：成功将ResNet架构与先进的图像处理技术相结合，开发出了一种高效、准确的MRI伪影自动识别方法，为医学影像分析领域提供了新的思路与工具。

1) 通过引入SE模块和金字塔模块，本文增强了算法的特征提取与多尺度信息融合能力，并结合交叉熵与Dice损失函数，形成新的加权联合损失函数，提升了MRI图像中伪影的自动检测与量化评估效果。

2) 开发了一种无需额外硬件设备的数据驱动MRI伪影检测方法，简化操作流程。通过真实数据实验验证，证明了改进网络在准确性和泛化能力方面的优势。

3) 展示了该方法的临床应用潜力，能够在MRI扫描后即时标记图像质量，提高诊断的准确性和效率。

2. 方法

本文创新性地构建了一个名为AMAResNet的伪影检测模型，它以ResNet网络为基础框架，将分块技术、Squeeze-and-Excitation (SE)注意力机制和金字塔特征融合机制相结合，首次应用于MRI伪影检测领域。此外，本文还构造了新的加权联合损失函数，用于优化模型在伪影检测中的表现。这一组合在该领域中尚属首次应用，有效提升了对MRI伪影的检测精度和稳定性，推动了自动化检测技术的发展。

2.1. 损失函数

2.1.1. 交叉熵损失函数(Cross-Entroy Loss)

在深度学习任务如目标检测中，选择合适的损失函数对模型性能至关重要。交叉熵损失是最常见的损失函数之一，主要用于衡量预测分布与真实分布之间的差异。它能够有效评估模型输出的概率分布与实际类别的匹配程度，广泛应用于二分类和多分类任务中。交叉熵通过度量两个概率分布的距离来优化模型，对于一个有C个类别的分类问题，给定真实类别分布 $y$ 和预测概率分布 $\hat{y}$ 。

对于这项工作中的二分类问题，交叉熵损失为：

${Loss}_{BCE} (y, \hat{y}) = - [y \log (\hat{y}) + (1 - y) \log (1 - \hat{y})]$ (1)

这里， $y$ 为实际标签(0或1)， $\hat{y}$ 为预测的正类概率。

2.1.2. Dice Loss

Dice Loss基于Dice系数，用于衡量两个集合的相似度，广泛应用于医学图像分割，特别适合处理类别不平衡问题。其优化目标是通过最大化预测结果与真实标签之间的重叠区域来提高分割性能。Dice系数用于计算两个样本集合的相似度，取值范围在0到1之间，值越高表示两个集合的重叠度越高。对于图像分割任务和二分类的目标检测，Dice Loss的具体计算公式都可以表示为：

$Dice Loss = 1 - \frac{2 \sum_{i = 1}^{N} p_{i} g_{i}}{\sum_{i = 1}^{N} p_{i} + \sum_{i = 1}^{N} g_{i}}$ (2)

其中，N表示样本总数， $p_{i}$ 为第i个样本的预测概率(如属于正类的概率)， $g_{i}$ 为第i个样本的真实标签(0或1)。为避免分母为零，通常在公式中加入一个小的平滑项( $ε$ )：

$Dice Loss = 1 - \frac{2 \sum_{i = 1}^{N} p_{i} g_{i} + ε}{\sum_{i = 1}^{N} p_{i} + \sum_{i = 1}^{N} g_{i} + ε}$ (3)

在MRI伪影检测中使用Dice Loss能够有效应对类别不平衡问题。由于伪影区域相较于背景区域较少，直接使用交叉熵损失可能导致模型过度关注背景而忽视伪影。Dice Loss通过最大化预测伪影与真实伪影的重叠区域，有效缓解了这一问题。它通过优化Dice系数(即预测与真实标签的重叠度)直接提升分割性能，使模型更准确地识别和分割伪影区域，从而提高检测精度。此外，Dice Loss在计算过程中引入平滑项，避免分母为零，增强了数值和训练的稳定性。

2.1.3. Weighted Joint Loss Function

为了进一步提升MRI伪影检测的性能，本文参考Chen [15]提出的用于图像分割的加权联合损失函数方法，将交叉熵损失(Cross-Entropy Loss)与Dice Loss相结合，创造性地将此加权联合损失函数用在目标伪影检测中，旨在同时优化全局分类准确性和局部区域重叠的优化效果。具体应用中，可以通过实验调整权重参数，以寻求最优的检测效果。加权联合损失函数利用了二者的优点，通过加权的方式实现平衡。在具体应用中，可以通过实验调整权重参数，以达到最佳的检测效果，可以写成如下形式：

$Combined Loss = α \cdot Cross-Entropy Loss + β \cdot Dice Loss$ (4)

其中： $α$ 和 $β$ 是权重因子，分别控制着交叉熵损失和Dice Loss在加权联合损失函数中的权重。具体表示为：

$Combined Loss = α \cdot [- \frac{1}{N} \sum_{i = 1}^{N} (y_{i} \log (p_{i}) + (1 - y_{i}) \log (1 - p_{i}))] - β \cdot [1 - \frac{2 \sum_{i = 1}^{N} p_{i} g_{i} + ε}{\sum_{i = 1}^{N} p_{i} + \sum_{i = 1}^{N} g_{i} + ε}]$ (5)

其中： $p_{i}$ 表示模型预测的第i个像素值概率。 $g_{i}$ 表示真实标签的第i个像素值(0或1)。 $y_{i}$ 表示真实标签的第i个类别(0或1)。 $ε$ 是一个小的平滑项，通常设置为1e−5。N是样本的总数。

加权联合损失函数结合了交叉熵损失和Dice Loss的优势。交叉熵损失通过最小化预测概率与真实标签的差异，提升全局分类准确性，而Dice Loss通过优化预测与真实标签的重叠度，增强模型对局部区域的关注，特别是在伪影检测中表现出色。两者结合，可以在处理类别不平衡时同时优化全局和局部的表现，提高整体检测性能。交叉熵损失更关注每个像素的准确性，适合细化边界，而Dice Loss则确保伪影区域的完整性和连续性。结合使用能够提升伪影区域的检测效果，减少误检漏检，并增强模型在不同数据集和应用场景下的稳定性和泛化能力。此外，交叉熵损失与Dice Loss的梯度信息互补，有助于加快模型收敛，优化训练效率。

2.2. AMAResNet模型

AMAResNet模型是结合了ResNet、分块、SE注意力机制、金字塔特征融合，以及交叉熵与Dice Loss的加权联合损失函数而新生成的网络架构模型。本文以ResNet18为基础，详细讨论了分块、SE注意力机制和金字塔特征融合在模型中的应用和调整，并形成最终的AMAResNet模型，并创造性地将此模型运用到MRI伪影检测中。

2.2.1. 分块

采用分块技术，将输入图像分为多个小块处理，减少计算复杂度并增强数据多样性，提高模型稳定性。对ResNet的调整主要体现在输入处理上：将图像分割为固定大小的块进行独立处理，并对每个块进行数据增强和归一化。

2.2.2. SE注意力机制

SE (Squeeze-and-Excitation)机制通过自适应调整通道权重，增强重要特征的表达。对ResNet18的改动是将其基本块替换为带有SE模块的基本块，提升特征选择能力。

2.2.3. 金字塔特征融合

在ResNet上增加金字塔特征融合模块，提取多层特征图并逐层上采样，实现多尺度信息的融合。修改后的ResNet18使用其layer1、layer2、layer3和layer4的输出作为输入进行特征融合，并通过全局平均池化得到最终的固定特征向量。

2.2.4. AMAResNet

AMAResNet模型通过结合ResNet、分块、SE注意力机制和金字塔特征融合以及加权联合损失函数，提高了模型对局部和多尺度特征的捕捉能力。分块技术细化了局部特征，增强了伪影检测，SE模块增强了特征选择性，而金字塔特征融合则提升了模型的多尺度特征感知。而加权联合损失函数则需要通过实验使模型达到最佳性能。图1展示了基于ResNet18改进的SEBasic Block，图2则为AMAResNet的整体结构。尽管这些改动增加了模型复杂度，但显著提升了对MRI伪影的检测精度和泛化能力。从理论的角度看，三个机制的组合肯定能提高ResNet18对于MRI伪影的识别精度。

3. 数据准备和实验结果

3.1. 数据准备

众所周知，尽管存在大量MRI图像数据集，但包含伪影的公开数据集仍难以获取。文献调研表明，大多数MRI伪影研究依赖于无法共享的私有数据集。因此，本研究采取双重策略：一方面系统检索现有开放数据集，另一方面自主构建专用数据集。

Figure 1. SEBasic Block of AMAResNet, based on ResNet’s Basic Block improved by adding SE (Squeeze-and-Excitation) Module

图1. AMAResNet的SEBasic Block，基于ResNet的Basic Block进行改进，添加了SE Modul

Figure 2. Basic network architecture of AMAResNet

图2. AMAResNet的基本网络结构

经过广泛筛选，本研究最终选定胎儿脑部MRI作为研究对象。该成像技术不仅为胎儿大脑可视化提供独特优势，还能建立形态发育的年龄参考标准。然而，胎儿大脑的动态发育特征、图像质量的不稳定性以及频繁出现的运动伪影等因素，使得年龄特异性神经发育评估面临重大挑战。本研究所用数据集包含741例经超声验证发育正常的胎儿脑部MRI (胎龄19~39周)，按标准化方案组织：每个独立编号文件夹(1~741)存储三平面(轴向、矢状、冠状)的二维JPEG图像，配套元数据文件(标签.xlsx)详细记录患者ID、孕周(日/周)、平面序列号及关键切片信息，总计51,426张图像。该数据集的结构完整性与规模适宜性使其成为理想的研究载体。

数据标注流程经过严格设计：由两家医疗机构的三名临床经验丰富的医学影像科专业人员执行独立标注，采用二元分类法(伪影存在 = 1，不存在 = 0)。通过比对三份独立标注结果，筛选出三位标注者达成共识的样本，最终形成高置信度的标注数据集。

值得注意的是，胎儿MRI数据集在图像分辨率、伪影特征等方面存在特异性，可能影响模型的泛化能力。鉴于此，本研究基于经典运动伪影生成机制，采用K空间扰动技术构建包含5000张模拟图像的扩展数据集。经三位专业医师盲法评估，最终筛选出1000张符合临床真实性的合成图像，有效补充了训练数据多样性。

3.2. 实验设置

测试和训练在一台具有16 GiB内存的NVIDIA GeForce RTX 3060显卡上进行。所建议的框架和用于比较的有效方法都是在Python (3.8.10)环境下的Pytorch (版本1.10.0 + cu113)上实现的。训练一个有10,000张图像的网络直到收敛花了1个小时。使用50个图像的批处理大小，整个测试集每200次迭代通过网络。初始学习率设置为0.001。

为了丰富训练数据集并提高模型的稳定性，对训练数据应用了以下数据增强操作：随机裁剪、随机水平翻转(50%的概率对图像进行水平翻转以增加数据的多样性)、张量转换、归一化处理，以提高模型的收敛速度和稳定性。优化器设置，为了优化模型参数，选择了Adam优化器，并设置了学习率和权重衰减(weight decay = 0.0001)以防止过拟合。损失函数一开始采用交叉熵损失函数(Cross-Entropy Loss)来衡量模型预测结果与真实标签之间的差异。

测试集中一共有1000张标记好的图片，按照1~1000的顺序进行重命名，前500张是标记为1的图片，即医学工作者认为有伪影的图像，后500张是标记为0的图片，即医学工作者认为没有伪影的图像。网络经过训练，直接在测试集里测试，会生成一个后缀为.csv的文件，它对1000张图片进行检测，检测出有位移的图像，后面标记1，检测出没有伪影的图像，后面标记为0。确定预测结果和真实标签。根据问题描述，分类任务的混淆矩阵指标定义为：TP (True Positives)：前500张真实为1的图片中，模型正确预测为1的数量。FN (False Negatives)：前500张真实为1的图片中，模型错误预测为0的数量。TN (True Negatives)：后500张真实为0的图片中，模型正确预测为0的数量。FP (False Positives)：后500张真实为0的图片中，模型错误预测为1的数量。以精准度(Accuracy)、精确度(Precision)、召回率(Recall)、F1分数来当作评测标准。

3.3. 实验与结果

3.3.1. 实验

根据表1和表2的消融实验结果，可对模型性能进行系统性分析：在胎儿数据集中(表1)，基线模型ResNet18在准确率(68.8%)、精确率(66.4%)和召回率(69.75%)上表现均衡，但对复杂伪影的区分能力有限。单独添加SE注意力模块的ResNet18 + SE模型整体性能显著下降，准确率降至56.7%，精确率暴跌至30.0%，但其对无伪影样本的召回率(64.38%)表明该模块在抑制背景噪声方面具有一定的潜力。引入金字塔结构的ResNet18 + pyramid模型通过多尺度特征融合显著提升了召回率(79.04%)，但精确率下降至55.8%，反映多尺度特征可能引入误检噪声。最终，融合SE与金字塔的ResNet18 + SE + pyramid模型实现全面优化，准确率达75.0%，精确率(72.0%)与召回率(76.6%)均衡提升，F1分数(74.23%)较基线提升6.2个百分点，验证了通道注意力与多尺度特征的协同增益效应。

Table 1. Comparation of the effects of different model plate additions on the performance in MRI artifact detection tasks (fetal dataset)

表1. 比较不同模型板块增加对在MRI伪影检测任务中性能的影响(胎儿数据集)

NET	ResNet18	ResNet18 + SE	ResNet18 + pyramid	ResNet18 + SE + pyramid
Acc (%)	68.8	56.7	70.5	75.0
Precision (%)	66.4	30.0	55.8	72.0
Recall (%)	69.75	64.38	79.04	76.6
F1 (%)	68.03	40.93	65.42	74.23

在扩展运动伪影数据集中(表2)，ResNet18 + SE + pyramid模型进一步展现了更强的泛化能力：准确率(79.5%)、精确率(76.8%)和召回率(81.4%)均显著优于基线模型(59.4%/35.6%/67.3%)，F1分数达79.03%，较单独添加SE (69.32%)或金字塔(76.68%)的模型分别提升9.7%和2.35%。值得注意的是，SE模块在该数据集中的表现优于胎儿数据集(准确率73.8% vs. 56.7%)，表明其对动态运动伪影的通道特征校准更具适应性。两类数据集的实验共同证明，SE注意力机制通过抑制冗余特征增强判别性，金字塔结构则通过跨尺度融合强化空间细节感知，二者的协同作用使模型在复杂伪影场景下的鲁棒性显著提升，为临床多类别伪影检测提供了可靠的解决方案。

Table 2. Comparation of the effects of different model plate additions on the performance in MRI artifact detection tasks (extended motion artifact dataset)

表2. 比较不同模型板块增加对在MRI伪影检测任务中性能的影响(扩展运动伪影数据集)

NET	ResNet18	ResNet18 + SE	ResNet18 + pyramid	ResNet18 + SE + pyramid
Acc (%)	59.4	73.8	77.6	79.5
Precision (%)	35.6	60.1	74.3	76.8
Recall (%)	67.3	81.9	79.2	81.4
F1 (%)	46.21	69.32	76.68	79.03

综上所述，通过结合SE注意力机制和金字塔特征融合机制，显著提升了ResNet18模型在MRI伪影检测任务中的表现。这一研究结果为进一步优化医疗图像分析模型提供了有力的支持。

3.3.2. 损失函数实验

本文提出了一种加权联合损失函数的方法，并进行了实验以确定最佳权重。具体而言，设定了0.1权重的Dice损失(Dice Loss)和0.9权重的交叉熵损失(Cross-Entropy Loss)，依此类推，进行了十组实验以确定最佳权重。实验结果如表3、表4所示。结果表明，当α = 0.3，β = 0.7时，实验效果最佳。特别从细节上看，越接近最佳配比0.3的时候，有伪影部分的正确率(即TP)有显著部分提高，越不接近最佳配比0.3时，无伪影图像的部分(即TN)的正确率更高。将所有类型的网络都与最佳的结合损失函数配对，并进行了进一步实验。实验结果表明，单独的ResNet18性能有所降低，但加上细节机制的其他网络的性能均有所提升。

Table 3. Comparation of the effects of different Dice weight weights on the performance in MRI artifact detection tasks (fetal dataset)

表3. 比较不同Dice weight加权比重对在MRI伪影检测任务中性能的影响(胎儿数据集)

Dice weight	0	0.1	0.2	0.3	0.4	0.5	0.6	0.7	0.8	0.9
Acc (%)	75.0	70.1	73.1	78.1	73.37	68.42	64.46	60.6	60.1	62.1
Precision (%)	72.0	57.4	80.2	88.2	68.82	59.02	59.02	36.6	40.0	44.0
Recall (%)	76.6	76.94	70.23	73.38	76.14	73.24	66.74	70.38	66.89	68.97
F1 (%)	74.23	65.75	74.88	80.11	72.3	65.36	62.64	48.16	50.06	53.72

Table 4. Comparation of the effects of different Dice weight weights on the performance in MRI artifact detection tasks (extended motion artifact dataset)

表4. 比较不同Dice weight加权比重对在MRI伪影检测任务中性能的影响(扩展运动伪影数据集)

Dice weight	0	0.1	0.2	0.3	0.4	0.5	0.6	0.7	0.8	0.9
Acc (%)	75.0	70.1	73.1	78.1	73.37	68.42	64.46	60.6	60.1	62.1
Precision (%)	72.0	57.4	80.2	88.2	68.82	59.02	59.02	36.6	40.0	44.0
Recall (%)	76.6	76.94	70.23	73.38	76.14	73.24	66.74	70.38	66.89	68.97
F1 (%)	74.23	65.75	74.88	80.11	72.3	65.36	62.64	48.16	50.06	53.72

3.3.3. 对比实验

在本研究中，对多种深度学习模型进行了实验比较，以评估它们在分类任务中的性能。选取了2DCNN [6]、Vgg16 [16]、Vgg19 [16]、Se-net [17]、Densenet [18]、U-net [15]和YOLOv5 [19]等七种模型，并对比了精准度(Accuracy)、精确度(Precision)、召回率(Recall)、F1分数等指标。实验结果如下图3所示。

Figure 3. Controlled experiment

图3. 对比实验

实验结果表明，在对多个网络模型的性能指标对比中，各模型呈现出不同的表现特点。2DCNN、VGG系列(VGG16、VGG19)、Se-net、DenseNet和U-net的准确率(Acc)集中在65%~68.22%之间。其中，VGG系列模型(VGG16、VGG19)的召回率(Recall)相对较高，在78.09%~79.84%之间，但精确率(Precision)较低，仅为41.2%~44.2%，这使得其F1分数表现一般，处于54.35%~56.45%的范围。Se-net的准确率为67.3%，精确率58.6%、召回率70.94%和F1分数64.18%，各项指标相对较为均衡。DenseNet的准确率是67.9%，精确率51.2%、召回率76.88%，F1分数为61.46%。U-net的准确率为68.22%，精确率56.08%、召回率74.67%，F1分数达到64.05%。YOLOv5展现出了较为优异的综合性能，其准确率达79.21%，F1分数为79.81%，同时精确率较高，为81.37%，召回率也达到了78.3%。本研究提出的AMAResNet-18模型在精确率上表现突出，达到了88.2%，显著优于YOLOv5。虽然其召回率(73.38%)略低于YOLOv5，但准确率(78.1%)和F1分数(80.11%)均接近YOLOv5的水平，表现较为出色。

在ROC曲线及AUC值方面(见图4)，各模型的曲线走势和AUC值反映了其分类性能的差异。YOLOv5和AMAResNet-18由于综合性能较好，其ROC曲线更靠近左上角，对应的AUC值相对较高，表明这两个模型在区分正负样本上具有更好的性能。而其他模型的ROC曲线和AUC值则反映出其在分类性能上相对较弱。整体而言，AMAResNet-18和YOLOv5在本次实验的多个模型中表现较为优异，具备较好的应用潜力。虽然两者的准确率相近，但值得注意的是，AMAResNet18模型相对而言具有更简单的网络结构和较低的计算复杂度。相比之下，YOLOv5模型是一种较为复杂的深度学习模型，包含了更深的层次和更复杂的特征提取机制。这使得YOLOv5在处理更为复杂的图像分类任务时表现出色，但也因此增加了计算资源的需求和模型训练的难度。另一方面，AMAResNet18模型通过采用分块和金字塔融合的方式，优化了特征提取过程，同时结合自定义的损失函数，使得模型在保持较高准确率的同时，依然保持了较低的模型复杂度和更快的训练速度。这使得该模型在一些计算资源有限的应用场景中具有显著的优势。

Figure 4. ROC curve and AUC values of controlled experiment

图4. 对比实验的ROC曲线以及AUC值

因此，尽管两者的准确率相近，但AMAResNet18模型在计算效率和易用性方面可能更具优势，适合在需要高效且准确的分类任务中使用。

4. 讨论与结论

4.1. 研究贡献

首先，本文在传统ResNet的基础上进行了多方面的改进。通过引入分块技术，将输入图像分割为多个小块，这不仅降低了计算复杂度，还增强了模型对不同伪影类型的适应能力。此外，SE注意力机制的应用使得模型能够更有效地关注重要特征，从而提高伪影检测的准确性。金字塔特征融合机制进一步增强了模型对多尺度特征的捕捉能力，有效提升了检测性能。而本文创造性地将此三种模块结合在一起，用于网络的构造以适用于MRI伪影的检测。

其次，在损失函数的设计上进行了创新。结合交叉熵损失和Dice Loss，不仅改善了模型在不同伪影类型下的稳定性，还提高了模型的训练效率和收敛速度。实验结果表明，这种结合损失函数的方法在伪影检测任务中表现出了优势，此损失函数在伪影检测方面也是首次运用。

4.2. 实验结果与分析

在实验部分，通过大量的对比实验验证了所提方法的有效性。与传统的MRI伪影检测方法相比，AMAResNet模型在多个评价指标上均取得了优异的表现。特别是在处理复杂伪影模式和多尺度特征方面，AMAResNet展示了较强的泛化能力和稳定性。AMAResNet通过引入分块技术、SE模块和金字塔特征融合机制，在保持较高检测精度的同时，简化了网络的复杂性。这一优势不仅减少了模型的计算成本，还提高了其在资源受限环境下的适用性。

4.3. 临床应用前景

MRI作为一种重要的医学成像技术，其图像质量直接影响到疾病的诊断与研究。然而，伪影的存在往往导致图像质量下降，影响诊断的准确性。传统的伪影检测方法依赖于额外的硬件设备，成本高且操作复杂。本研究提出的AMAResNet模型能够在不增加硬件成本的情况下，实现高效的伪影检测与识别，具有重要的临床应用价值。特别是在大型队列成像研究中，如英国生物银行和德国国家队列，自动化的伪影检测工具能够显著提高工作效率，减少人工成本。同时，AMAResNet模型的准确性和泛化能力有助于提高MRI图像的整体质量，进而提升疾病诊断的准确性和可靠性。

4.4. 研究局限与未来展望

尽管AMAResNet模型在伪影检测任务中表现出显著优势，但仍存在一些局限性。首先，深度学习模型通常需要大量标注数据进行训练，而在医学领域，获取高质量的标注数据往往需要高昂的时间和成本。未来研究可以探索半监督学习或无监督学习的方法，以减少对标注数据的依赖。现有的AMAResNet模型在处理某些特定类型的伪影时仍存在一定的局限性。未来可以考虑引入更多先进技术，如图像重建技术或生成对抗网络(GANs)，进一步提高模型的稳定性和检测性能。

尽管本文提出的方法在实验室环境中取得了良好的效果，但在实际临床应用中，还需要进行更大规模的验证和优化。未来的研究应注重模型的实际应用测试，确保其在不同临床环境中的稳定性和可靠性。

4.5. 总结

综上所述，本研究提出了一种名为AMAResNet模型架构，基于改进ResNet架构的MRI伪影检测方法，通过创造性地集成分块、SE注意力机制和金字塔特征融合机制，以及首次将交叉熵损失函数和Dice Loss损失函数组成的加权联合函数运用到伪影检测方面，有效提高了伪影检测的准确性和稳定性。实验结果表明，AMAResNet模型在多个评价指标上均优于传统方法，具有重要的临床应用价值。尽管仍存在一些局限性，但通过不断优化和改进，该方法有望在未来的医学图像处理领域发挥更大的作用。

通过本研究的探索，为MRI图像伪影检测提供了一种高效且实用的解决方案，为临床诊断和医学研究的精确性和可靠性提供了有力支持。未来的研究将继续致力于优化模型性能，扩大其应用范围，进一步提升MRI图像的质量和诊断水平。

致谢

本研究得益于多方支持，在此谨致诚挚的谢意。首先，感谢商琨教授在算法设计与实验验证过程中给予的宝贵建议与专业指导。同时，感谢九江附属医院影像科的三位医学专家对数据集标注工作的严谨审阅与专业支持，为本研究提供了高质量的标注数据基础。

感谢团队成员在算法实现、数据整理与论文修订中的通力合作。最后，感谢家人与朋友在科研过程中给予的理解与鼓励，他们的支持是本研究顺利完成的重要动力。

参考文献

[1]	Zaitsev, M., Maclaren, J. and Herbst, M. (2015) Motion Artifacts in MRI: A Complex Problem with Many Partial Solutions. Journal of Magnetic Resonance Imaging, 42, 887-901. [Google Scholar] [CrossRef] [PubMed]
[2]	Maclaren, J., Herbst, M., Speck, O. and Zaitsev, M. (2012) Prospective Motion Correction in Brain Imaging: A Review. Magnetic Resonance in Medicine, 69, 621-636. [Google Scholar] [CrossRef] [PubMed]
[3]	Heiland, S. (2008) From a as in Aliasing to Z as in Zipper: Artifacts in MRI. Clinical Neuroradiology, 18, 25-36. [Google Scholar] [CrossRef]
[4]	Wood, M.L. and Henkelman, R.M. (1985) MR Image Artifacts from Periodic Motion. Medical Physics, 12, 143-151. [Google Scholar] [CrossRef] [PubMed]
[5]	Meding, K., Loktyushin, A. and Hirsch, M. (2017) Automatic Detection of Motion Artifacts in MR Images Using CNNS. 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), New Orleans, 5-9 March 2017, 811-815. [Google Scholar] [CrossRef]
[6]	Küstner, T., Liebgott, A., Mauch, L., Martirosian, P., Bamberg, F., Nikolaou, K., et al. (2017) Automated Reference-Free Detection of Motion Artifacts in Magnetic Resonance Images. Magnetic Resonance Materials in Physics, Biology and Medicine, 31, 243-256. [Google Scholar] [CrossRef] [PubMed]
[7]	Kustner, T., Jandt, M., Liebgott, A., Mauch, L., Martirosian, P., Bamberg, F., et al. (2018) Automatic Motion Artifact Detection for Whole-Body Magnetic Resonance Imaging. 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Calgary, 15-20 April 2018, 995-999. [Google Scholar] [CrossRef]
[8]	Oksuz, I., Clough, J., Ruijsink, B., Puyol-Antón, E., Bustin, A., Cruz, G., et al. (2019) Detection and Correction of Cardiac MRI Motion Artefacts during Reconstruction from K-Space. In: Shen, D.G., et al., Eds., Medical Image Computing and Computer Assisted Intervention—MICCAI 2019, Springer International Publishing, 695-703. [Google Scholar] [CrossRef]
[9]	Oksuz, I., Clough, J.R., Ruijsink, B., Puyol-Anton, E. and Schnabel, J.A. (2020) Deep Learning-Based Detection and Correction of Cardiac MR Motion Artefacts during Reconstruction for High-Quality Segmentation. IEEE Transactions on Medical Imaging, 39, 4001-4010.
[10]	Ke, J., Liu, K., Sun, Y., Xue, Y., Huang, J., Lu, Y., et al. (2023) Artifact Detection and Restoration in Histology Images with Stain-Style and Structural Preservation. IEEE Transactions on Medical Imaging, 42, 3487-3500. [Google Scholar] [CrossRef] [PubMed]
[11]	Gu, X., Tian, Y., Li, C., Wei, Y. and Li, D. (2024) Improved Se-Resnet Acoustic-Vibration Fusion for Rolling Bearing Composite Fault Diagnosis. Applied Sciences, 14, Article No. 2182. [Google Scholar] [CrossRef]
[12]	Chen, X., Xing, X., Zhang, Y., Liu, R., Li, L., Zhang, R., et al. (2024) MSCR-FuResNet: A Three-Residual Network Fusion Model Based on Multi-Scale Feature Extraction and Enhanced Channel Spatial Features for Close-Range Apple Leaf Diseases Classification under Optimal Conditions. Horticulturae, 10, Article No. 953. [Google Scholar] [CrossRef]
[13]	He, K., Zhang, X., Ren, S. and Sun, J. (2016) Deep Residual Learning for Image Recognition. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas, 27-30 June 2016, 770-778. [Google Scholar] [CrossRef]
[14]	Khodadadi Shoushtari, F., Sina, S. and Dehkordi, A.N.V. (2022) Automatic Segmentation of Glioblastoma Multiform Brain Tumor in MRI Images: Using Deeplabv3+ with Pre-Trained Resnet18 Weights. Physica Medica, 100, 51-63. [Google Scholar] [CrossRef] [PubMed]
[15]	Chen, Y. (2023) Application of Resnet18-Unet in Separating Tumors from Brain MRI Images. Journal of Physics: Conference Series, 2580, Article ID: 012057. [Google Scholar] [CrossRef]
[16]	Simonyan, K. and Zisserman, A. (2014) Very Deep Convolutional Networks for Large-Scale Image Recognition. arXiv: 1409.1556.
[17]	Hu, J., Shen, L., Albanie, S., Sun, G. and Wu, E. (2020) Squeeze-and-Excitation Networks. IEEE Transactions on Pattern Analysis and Machine Intelligence, 42, 2011-2023. [Google Scholar] [CrossRef] [PubMed]
[18]	Huang, G., Liu, Z., Van Der Maaten, L. and Weinberger, K.Q. (2017) Densely Connected Convolutional Networks. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Honolulu, 21-26 July 2017, 2261-2269. [Google Scholar] [CrossRef]
[19]	Chen, S., Duan, J., Zhang, N., Qi, M., Li, J., Wang, H., et al. (2023) Msa-YOLOv5: Multi-Scale Attention-Based YOLOv5 for Automatic Detection of Acute Ischemic Stroke from Multi-Modality MRI Images. Computers in Biology and Medicine, 165, Article ID: 107471. [Google Scholar] [CrossRef] [PubMed]

为你推荐

友情链接