深度学习方法在乳腺癌医学图像诊断中的研究进展
Research Progress of Deep Learning Methods in the Diagnosis of Breast Cancer Medical Images
DOI: 10.12677/airr.2025.146123, PDF, HTML, XML,    科研立项经费支持
作者: 崔文升, 李 欣:大庆师范学院计算机科学与信息技术学院,黑龙江 大庆
关键词: 深度学习乳腺癌医学图像Deep Learning Breast Cancer Medical Image
摘要: 乳腺癌是全球女性中最常见的恶性肿瘤之一,早期且准确的诊断对提升患者生存率至关重要。近年来,深度学习凭借在特征提取、分类、分割与风险预测等任务中的优越表现,被广泛应用于医学图像分析。然而,现有综述多聚焦于单一影像模态或技术视角,缺乏对整体研究进展的系统梳理。为弥补这一不足,本文系统介绍了三类主流乳腺癌数据集,简介了基于深度学习方法的研究成果,并归纳了不同影像模态的特点。最后,探讨了深度学习在乳腺癌医学图像诊断中的面临挑战和未来的发展趋势。本文旨在为学者全面理解该领域的最新进展与创新提供有益参考。
Abstract: Breast cancer remains one of the most frequently diagnosed malignancies among women worldwide, and early and accurate diagnosis is crucial for enhancing patient survival outcomes. In recent years, deep learning has been increasingly utilized in the field of medical image analysis due to its outstanding capabilities in feature extraction, classification, segmentation, and risk prediction. However, the majority of existing reviews concentrate on a single imaging modality or a specific technical framework, resulting in a lack of comprehensive and systematic insights into recent advancements in this area. To address this limitation, this paper presents a systematic review of three major breast cancer datasets, outlines recent research achievements enabled by deep learning techniques, and elucidates the distinctive features of various imaging modalities. Additionally, it explores current challenges and proposes potential future directions for the application of deep learning in breast cancer image diagnosis. This review aims to serve as a valuable reference for researchers seeking a thorough understanding of the latest developments and innovations in this rapidly advancing field.
文章引用:崔文升, 李欣. 深度学习方法在乳腺癌医学图像诊断中的研究进展[J]. 人工智能与机器人研究, 2025, 14(6): 1314-1326. https://doi.org/10.12677/airr.2025.146123

1. 引言

根据国际癌症研究机构2022年发布的全球癌症统计数据,乳腺癌每年约有230万新发病例,占所有癌症病例的11.6%,仍是女性癌症相关死亡的主要原因[1],如图1 [2]。2022年,全球乳腺癌新发病例约290,560例,其中男性2710例、女性287,850例,预计死亡人数约43,780人[3]。其高发病率和死亡率使乳腺癌成为女性中最常见且最致命的恶性肿瘤。因此,早期检测与精准诊断对改善患者预后至关重要。然而,诊断效果常受医疗设备水平、临床医生经验及个体差异等限制。近年来,人工智能技术的兴起,尤其是旨在降低医疗成本、减少设备依赖的应用研究,为乳腺癌诊断效率的提升提供了新的契机。乳腺癌的亚型包括浸润性导管癌、浸润性小叶癌、导管原位癌、小叶原位癌以及其他特殊类型,增加了临床诊断的复杂性。目前常用的诊断方法主要依赖影像组学技术,如组织病理学、乳腺X线摄影、超声(US)、磁共振成像(MRI)、正电子发射断层显像/计算机断层扫描(PET/CT)及热成像等[4]。这些成像技术在乳腺癌诊断中表现出良好性能,但影像解读往往依赖专家经验,过程耗时且容易出错。为缓解这一问题,计算机辅助诊断(Computer aided-diagnosis, CAD)系统被提出并逐步应用于临床。为了方便研究人员研究计算机辅助诊断应用乳腺医学图像,本文对基于深度学习技术的诊断工作进行了如下研究:

(1) 选取三类主流医学影像,系统性地阐述深度学习于单一影像模态的问题。

(2) 介绍了DL在三类乳腺癌医学影像中的性能,同时总结了公开可用的主流医学影像数据集,从而突破现有综述仅限于技术的局限性。

(3) 分析了AI在乳腺癌诊断中的发展趋势,并总结了潜在挑战。

2. CAD应用于乳腺癌医学图像

自Ledley等人在1966年首次提出CAD理论模型以来[5],其逐渐活跃于临床医学领域。CAD系统将图像采集、处理与计算机分析相结合,广泛应用于医学影像的分割、检测与分类,帮助医生发现病灶并提升诊断准确率与效率。在乳腺癌诊断方面,Winsberg等人于1976年首次将CAD用于乳腺X线摄影异常检测[6]。进入21世纪,CAD进一步细分为计算机辅助检测与计算机辅助诊断:前者主要用于发现癌变或转移病灶,后者则用于癌症类型判别[7]。随着人工智能技术的快速发展,机器学习(Machine Learning, ML)与深度学习(Deep Learning, DL)逐渐成为推动CAD精准化的重要手段[8]图2为CAD应用于乳腺癌辅助诊断的模型框架。

Figure 1. Estimated number of new cases in 2022 [2]

1. 2022年预计新增病例数[2]

机器学习作为人工智能的重要分支,能够在有限监督下对数据进行分析与建模。过去几十年,ML已广泛应用于乳腺癌诊断、医学影像处理及大规模医学数据的分析与评估。在乳腺癌诊断任务中,ML通常被建模为分类问题,通过特征提取与分类器训练实现良恶性区分。典型流程包括图像预处理、人工分割感兴趣区域(ROI)、手工提取纹理、形状及几何特征,最终使用逻辑回归(LR)、随机森林(RF)、支持向量机(SVM)、朴素贝叶斯(NB)等分类器完成判别[9]-[12]。然而,传统ML依赖人工特征设计,极易受到经验与特征选择质量的限制,导致整体性能受限。同时,ML在处理大规模数据时往往面临过程繁琐、时间消耗大及误差累积等问题[13] [14]

深度学习作为ML的子领域,基于分层特征学习与数据驱动的自动表征方式,有效突破了传统ML的瓶颈。DL通过模拟生物神经网络结构,以多层非线性模块逐级提取高层次特征,能够自动捕捉乳腺癌影像中复杂而抽象的病灶特征。在大规模数据和GPU算力支持下,卷积神经网络(CNN)、循环神经网络(RNN)和深度神经网络(DNN)等经典架构已被广泛用于乳腺癌影像分割与分类任务,并展现出显著优势。与传统ML相比,DL不仅能够自动提取多维度特征,还能利用端到端的训练方式实现病灶定位和癌症类型识别,从而显著提升CAD的性能与临床应用价值。因此,本文以深度学习模型为主,综述其在不同类型乳腺癌医学图像的研究进展。

3. 深度学习在乳腺癌组织病理学图像研究

病理诊断通常通过穿刺活检获取组织样本,并在显微镜下进行组织学检查以确诊疾病。目前,其主要形式包括分子病理学、细胞学、组织病理学和免疫组织化学。尽管各类医学影像技术不断发展,但病理诊断因其高度的准确性和稳定性,仍被广泛认为是肿瘤检测的“金标准”,并在临床实践中发挥着核心作用。在组织病理学诊断过程中,病理学家会采集病变组织切片,经苏木精和伊红(Hematoxylin and Eosin, H&E)染色后,在光学显微镜下进行观察,并通过对病变形态学特征的综合分析得出结论。近年来,随着数字病理学的兴起,传统切片已能够借助高分辨率扫描仪转化为全切片图像(Whole-slide image, WSI),不仅提升了病理学研究与教学的效率,也为智能化和自动化诊断方法的发展奠定了基础。图3展示了四种常见乳腺癌的WSI样本,分别对应正常组织、良性病变、原位癌及浸润性癌。

Figure 2. CAD architecture for breast cancer based on ML and DL

2. 基于机器学习和深度学习的乳腺癌计算机辅助诊断架构

3.1. 乳腺癌组织病理学图像数据集

Bioimaging Challenge2015数据集[15]。该数据集由Teresa Araujo团队提供,作为2015年乳腺癌图像分类竞赛的基准数据集。其共包含269个未经压缩的H&E染色样本,其中包括55例正常组织、69例良性病变、63例原位癌及62例浸润性癌。所有图像均通过像素分辨率为0.42 µm × 0.42 µm的扫描仪获取,生成尺寸为2040 × 1536像素的高分辨率数字病理图像。该数据集标注完整,广泛应用于乳腺癌病理图像的分类与诊断研究。(获取地址:https://rdm.inesctec.pt/dataset/nis-2017-003)

Figure 3. Images of four breast cancer pathological tissues selected from Breast Cancer Histology (BACH) dataset [28]. (a) Normal; (b)Benign; (c) In situ carcinoma; (d) Invasive carcinoma

3. BACH数据集中选取的四例乳腺癌病理组织的图像[28]。(a) 正常组织;(b) 良性病变;(c) 原位癌;(d) 浸润性癌

乳腺癌组织学数据集(BACH) [16]。该数据集作为2018年ICIAR国际乳腺癌图像分析大赛的官方任务数据集,涵盖两类影像:H&E染色的乳腺组织病理学图像与全切片图像。每类影像均包含正常、良性、导管原位癌和浸润性癌四种病理类别。组织病理学图像子集共计400张,每类各100张。所有图像均以TIFF格式保存,采用RGB模型,尺寸为2048 × 1536像素,空间分辨率为0.42 µm × 0.42µm。该数据集具有较强的标准化特征和代表性,为乳腺癌计算机辅助诊断研究提供了重要的数据支持。(获取地址:https://iciar2018-challenge.grand-challenge.org/)

BreaKHis数据集[17]。该数据库由巴西P&D实验室(病理学、解剖学与细胞病理学部门)建立,并于2016年正式发布,是当前应用最广泛的乳腺癌组织病理学影像数据库之一。数据来源于82名患者,共计7909张图像,涵盖良性与恶性两大类。良性样本来自24名患者共2480张,细分为4个亚类:腺瘤样增生444张、纤维腺瘤1014张、叶状肿瘤453)和管状腺瘤569)。恶性样本来自58名患者共5429张,同样划分为4个亚类:导管癌3451张、小叶癌626张、黏液癌792张和管状癌560张。

该数据库的图像均提供四种放大倍数(40×、100×、200×、400×),尺寸为752 × 582像素,以PNG格式保存,并采用三通道RGB模型(8位/通道)。BreaKHis数据库不仅在数据规模和类别多样性方面具有优势,还因其多倍率设计而广泛应用于深度学习模型的分类、分割与特征提取研究。(获取地址:https://web.inf.ufpr.br/vri/databases/breast-cancer-histopathological-database-breakhis/)

CAMELYON17数据集[18]。该数据集由荷兰奈梅亨拉德堡德大学医学中心病理学科与诊断图像分析小组共同建立,并作为CAMELYON17国际挑战赛的官方数据集。数据来源于荷兰5家医疗中心,共包含500张经染色的淋巴结全切片图像。该数据集分为两部分:课程级别数据和患者级别数据。其中,CAMELYON16数据被用作病变级别的训练集,而患者级别数据则由每位患者的5个淋巴结切片组成,每个WSI对应一个淋巴结区域,并标注有pN分级信息。测试集同样包含500个全切片图像,每位患者提供5张切片,但测试集未附带病灶标注和pN分级结果。该数据集广泛用于乳腺癌转移检测及病理分级研究。(获取地址:https://camelyon17.grand-challenge.org/Data/)

TMI2015数据集[19]。该数据集于2015年发布,包含49名患者的乳腺癌病理切片图像,图像分辨率为2200 × 2200像素,总计约1500标注细胞核。该数据集多用于细胞核分割与形态学分析任务,能够为乳腺癌病理图像的细粒度特征提取及后续分类研究提供有价值的实验基础。(获取地址: http://haeckel.case.edu/data/TMI2015.tgz)

3.2. 基于深度学习的乳腺癌织病理学图像研究

Bioimaging2015数据集已在文献[20]-[22]中得到应用。在[20] [21]中,研究者提出了基于图像块的方法,通过深度学习模型实现乳腺癌分类。Li等人[20]提出了一种块级特征提取策略,分别生成不同大小的细胞级与组织级图像块,以充分保留多尺度病理信息。在四分类任务中,初始测试集与总体测试集的分类准确率分别为95.00%和88.89%。Yan等人[21]提出了一种融合CNN与RNN的混合模型,CNN用于提取块级多层次特征,而RNN则实现对块特征序列建模与融合,最终在四分类任务中取得了91.30% 的平均准确率。Alom等人[22]整合了Inception-v4、ResNet与RCNN的优势,能够同时处理二分类与多分类任务,在Bioimaging2015与BreakHis数据集上均表现出良好的性能。

BACH数据集被广泛用于乳腺癌病理图像分析,相关研究见文献[23]-[35]。Kasani等人[23]提出了一种结合全局池化与迁移学习的CNN模型对乳腺组织学图像进行分类。通过引入多样化的数据增强方法优化预训练Xception模型,最终实现了92.50%的平均分类准确率。Sanyal等人[24]提出了结合梯度提升树分类器的混合集成框架,在二分类与四分类任务中均取得了像素级与图像级的高准确率。Elmannai等人[25]采用并行CNN架构,将预训练的Inception与Xception模型结合提取差异化的图像特征。实验结果显示子图像分类的总体准确率达到97.29%,癌性病例的敏感度高达99.58%。此外,HWDCNN方法[26]基于哈达玛小波分解提取深层特征,从而有效缓解了传统CNN的计算瓶颈,并在BACH与BreakHis数据集上均展现出优异的分类性能。

BreaKHis数据集已在文献[27]-[41]中得到广泛应用。Jiang等人[27]设计了一种嵌入小型SE-ResNet模块的CNN用于乳腺癌分类。该模型有效减少了近三分之一的参数量,并结合高斯误差调度器,在二分类与多分类任务中均取得了较高精度。Budak等人[28]聚焦于高级特征的提取,提出将全卷积网络作为编码器提取高级特征与双向长短期记忆网络相结合的诊断模型。实验表明该方法在BreakHis数据集上的性能优于其他对照模型。Xie等人[29]采用Inception_V3与Inception_ResNet_V2两个CNN模型提取高级抽象特征,并通过数据增强缓解类别不平衡问题,显著提升了分类性能。文献[30]中提出的双重迁移学习策略分别在特征提取与组织结构层级上引入迁移学习,使分类准确率提高了3.70%。Sudarshan等人[31]以多实例学习(Multiple Instance Learning, MIL)方法为基准开展实验,在40×放大倍率下实现了92.1%的患者级分类准确率。文献[32]提出了一种统一实验设计参数优化方法,通过少量建模实验找到CNN架构中最优参数组合,分类准确率提升至84.41%。Togacar等人[33]提出了的模型融合了卷积块注意力模块、密集块、残差块与超列技术,其中超列技术保证了结果的稳定性并进一步提升分类性能。文献[34]中提出的分层多类模型AlexNet-BMIC_Net用于8种乳腺癌亚型的识别,一级分类器的最高准确率为95.48%,二级分类器的准确率分别为94.62%和92.45%。Hou等人[35]构建的CNN分类模型通过数据增强与迁移学习缓解过拟合问题,SoftMax分类器使分类准确率达到91.00%。文献[36]使用基于迁移学习的DenseNet121与ResNet50两种CNN模型,在二分类与多分类实验中分别获得100.00%与98.00%的准确率。Alkasasbeh等人[37]提出的分类方法在二分类与四分类任务中分别实现了99.00%与92.00%的准确率。Reshma等人[38]提出将遗传算法与CNN分类器相结合的深度学习模型。遗传算法通过锦标赛选择策略筛选最优特征,在BreakHis数据集上的性能优于对比模型。Li等人[39]强调了中间与高级特征在分类中的重要性,结合AlexNet与SVM方法在二分类任务中表现突出。Alqatrane等人[40]提出了三种乳腺癌分类模型,结果表明基于迁移学习的CNN模型取得了最佳分类效果。Maleki等人[41]将DenseNet201模型用作特征提取器,XGBoost用作分类器。在40倍、100倍、200倍和400倍放大倍数下,所提出方法的准确率分别为93.6%、91.3%、93.8%和89.1%。

除上述数据集外,其他数据集的研究也取得了重要进展。Su等人[42]开发了基于金字塔架构的深度学习模型,用于多层多尺度下的癌变区域自动检测。基于Camelyon2017与TIM2015数据集的实验结果表明,该模型在检测精度上显著优于仅使用组织层面信息的模型。Zsesel等人[43]提出了一种包含两个级联CNN的模型用于乳腺癌诊断,在BACH(B)、HASHI与TCGA数据集上的四分类实验中获得了最高的准确率与特异性。文献[44]提出基于深度信念网络的模型,在四个不同数据组上进行训练与测试,最终实现了86.00%的分类准确率。Pradeepa等人[45]提出的混合深度学习模型将用于多尺度特征提取的EfficientNetV2与通过注意力机制增强的门控循环单元相结合,能够有效地学习空间和上下文特征,从而提高从组织病理学图像中对乳腺癌分类的准确性和可解释性。

4. 深度学习在数字乳腺癌X光影像研究

乳腺X光检查被广泛认为是早期发现乳腺癌的重要且可靠的手段。数字乳腺X光影像(Digital Mammography, DM)作为以数字化图像形式存储于计算机系统中的影像,已在全球乳腺癌筛查中得到广泛应用。近年来,两项新兴的DM技术——数字乳腺断层成像与对比增强乳腺X光摄影在乳腺癌的精准诊断及新辅助治疗疗效评估方面展现出显著优势和广阔应用前景。正常乳腺与乳腺癌的典型DM影像如图4所示。

Figure 4. Examples of breast Mammogram images. (a) Normal; (b) Cancer

4. 乳腺X光检查影像示例。(a) 正常情况;(b) 癌症情况

4.1. 乳腺癌X光影像数据集

乳腺影像分析协会数据库(Mammographic Image Analysis Society, MIAS) [46]由英国研究团队建立,是早期较为经典的数字化乳腺X光片数据库之一。该数据库共包含322张图像,正常图像209张,异常图像113张,分辨率为1024 × 1024像素,采用PGM格式存储。在异常病例中,进一步区分为良性61例与恶性52例,并细分为六类典型病灶类型,包括钙化、边界清晰的局灶性肿块、呈毛刺状的肿块、边界不清的肿块、结构扭曲以及乳腺不对称。该数据库为乳腺癌CAD研究提供了重要的早期实验平台(访问链接:http://peipa.essex.ac.uk/info/mias.html)。

筛查乳腺X光摄影数字数据库(Digital Database for Screening Mammography, DDSM) [47]由美国多家科研机构联合建立,是目前应用最广泛的扫描胶片乳腺X光片公共数据库之一。该数据库包含约2500项研究,共计2620张图像,分辨率高达3000 × 5000像素,灰度级为16位。其病例类型划分为正常、良性和恶性三类,能够支持不同层次的乳腺癌诊断研究。(DDSM获取网址: http://www.eng.usf.edu/cvprg/Mammography/Database.html)

与DDSM相对应的事乳腺癌筛查数据库的扩展版本Curated Breast Imaging Subset of DDSM (CBIS-DDSM) [48]。它由专业乳腺X光技师进行筛选和整理,进一步提升了数据质量和标注精度。CBIS-DDSM数据集包含753例钙化病例和891例肿块病例,并同样分为正常、良性和恶性三类。与DDSM不同,CBIS-DDSM采用标准化的DICOM格式存储,并在感兴趣区域的分割与边界框标注上进行了优化,并为训练数据增加了病理学诊断信息。这一更新显著提升了数据集在临床相关性和模型训练适配性方面的价值,为深度学习方法的应用提供了更加可靠的支撑。(CBIS-DDSM获取网址: https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM)

INbreast数据集[49]由葡萄牙波尔图圣若昂大学医院乳腺中心提供,是目前应用较为广泛的全视野数字乳腺成像(Digital Mammography, DM)数据集之一。该数据库共包含115个病例的410张高质量图像,其中良性图像310张,恶性图像100张。具体而言,90个病例为双侧乳腺影像,每个病例对应4张图像;其余25个病例来自乳房切除患者,每个病例包含2张图像。数据库对病灶类型进行了精确标注,包括正常、类别、主细胞、不对称、多重发现以及结构扭曲,为乳腺癌的检测与分类研究提供了重要支撑。(获取网址:https://www.kaggle.com/datasets/martholi/inbreast?select=inbreast.tgz)

4.2. 基于深度学习的乳腺X影像研究

MIAS数据集在文献[50]-[53]中得到广泛应用。Saber等人[50]提出了一种结合80-20划分与交叉验证的深度学习模型,用于检测和诊断乳腺癌可疑区域。该研究分别采用5种卷积神经网络模型从乳腺X光图像中提取特征,结果表明VGG16与迁移学习相结合的分类模型取得了最佳准确率。Sha等人[51]提出了一种基于综合策略的方法,利用蚱蜢优化算法对图像分割与特征选择进行优化,从而实现乳腺癌病灶区域的精准定位。在MIAS与DDSM数据集上的实验结果显示,该方法的最佳准确率为92%,灵敏度达96%。Houssein等人[52]则将卷积神经网络与改进的海洋捕食者算法结合,并通过迁移学习实现异常检测。在MIAS与CMIIS-DDSM数据集上,海洋捕食者算法与ResNet50的组合显著优于其他对照模型。Kavitha等人[53]提出了一种OKMT-SGO技术与CapsNet模型的融合方法,用于乳腺癌图像的分割与特征提取。在Mini-MIAS与DDSM数据集上的实验结果分别实现了98.50%与97.55%的分类准确率。

DDSM数据集在文献[54] [55]中被深入研究。Salama等人[54]将ResNet50与VGG-16分别与SVM分类器相结合用于乳腺X光片的分类。实验结果表明,ResNet50与SVM的组合中准确率97.98%、AUC值98.46%。Lotter等人[55]提出了一种注释高效的深度学习方法,在数字乳腺X光摄影分类中表现卓越,并成功推广至数字乳腺断层摄影。与五名全职乳腺影像专家相比,该方法的绝对灵敏度平均提高了14%。

INbreast数据集被应用于文献[56] [57]。Asma Baccouche等人[56]设计了一种由两个级联的U-Net组成的架构,并引入注意力机制、残差块与ASPP模块用于乳腺X光片肿瘤分割。在INbreast、CBIS-DDSM及私有数据集上的实验均表现出优异性能。Shu等人[57]提出了基于两种新型池化结构的卷积神经网络,用于乳腺X光片分类。实验表明,在INbreast与CBIS数据集上,该方法与现有最佳分类模型相比具有竞争力。

5. 深度学习在乳腺超声成像研究

作为数字化乳腺X线影像的重要补充手段,超声成像在乳腺癌的临床筛查与诊断过程中被广泛应用[58]。超声检查与X线图像相比具有无辐射、实时成像、对乳腺致密组织敏感等优势,因此在年轻女性和高风险人群中更为常用。超声技师通常借助超声探头获取二维图像,并结合临床经验完成检查与报告。然而,由于超声图像易受噪声干扰、边界模糊且对比度较低,其分析与解读在很大程度上依赖操作者的经验和主观判断,从而影响诊断的稳定性和准确性。随着人工智能与医学影像处理技术的不断发展,智能诊断方法逐渐成为提高超声图像解读效率与客观性的重要途径。在本节中,我们将系统归纳和分类智能诊断技术在乳腺癌超声图像分析与辅助诊断中的研究进展。

5.1. 乳腺癌超声成像数据集

目前,美国公开可用的乳腺超声图像数据集数量有限,其中应用最广泛的是乳腺超声图像数据集(Breast Ultrasound Images, BUSI) [59],由开罗大学的Ali Fahmy教授于2018年建立并公开。该数据集共收集了600名年龄在25至75岁女性的超声检查结果,包含780张PNG格式的图像,平均分辨率为500 × 500像素。所有图像按照病灶类别被划分为三类:正常133张、良性210张以及恶性487张(图5),为乳腺癌超声影像智能诊断的研究提供了重要的实验基础。

Figure 5. Examples of breast US images from BUSI [59]. (a) Benign; (b) Malignant; (c) Normal

5. BUSI数据集[59]的乳腺超声图像示例图。(a) 为良性;(b) 为恶性;(c) 为正常

5.2. 基于深度学习的乳腺癌超声成像研究

在超声图像的乳腺癌诊断中,研究主要使用BUSI公共数据集探索了深度学习方法的有效性。2021年,Byra等[60]提出了一种基于深度表示缩放层的新型迁移学习方法,用于乳腺癌超声图像分类。该方法在实验中表现突出,AUC值达到0.955,分类准确率为91.50%。Pourasad等[61]则尝试了多种技术组合,利用分形方法提取特征,并通过四种机器学习方法进行分类,同时设计卷积神经网络直接对超声图像进行识别。在训练集上,所提出方法的准确率高达99.80%,并能有效定位乳腺癌病灶,92%的图像位于高性能区。2022年,Balaha等[62]提出结合深度学习与遗传算法的混合框架,通过遗传算法优化超参数,并借助14种具备迁移学习能力的预训练卷积神经网络进行实验,其中基于Xception的模型在所有指标上表现最佳,准确率为92.80%,F1值为92.93%,精确率为93.34%。此外,Jabeen等[63]提出了结合卷积神经网络与特征选择融合的框架,利用改进的差分评估和改进的灰狼算法筛选最优特征,并通过概率方法将其与机器学习模型结合,最终BUSI数据集上实现了99.10%的分类准确率,超越了其他对比方法。

6. 当前挑战和未来方向

尽管深度学习在乳腺癌医学图像诊断中的应用已取得了突破性进展,但仍存在若干亟待解决的挑战。首先,数据层面的不足依然突出。多数公开数据集样本数量有限,且存在类别不平衡和标注不一致的问题,这直接影响了模型的泛化能力和临床适用性。其次,不同成像设备、成像参数及患者群体之间的差异导致模型在跨机构、跨人群的迁移过程中性能下降,限制了其临床推广。第三,深度学习模型普遍存在“黑箱”问题,缺乏可解释性,诊断依据难以直观呈现,降低了医生的信任度和临床应用的可接受性。此外,模型训练和推理对计算资源的高度依赖,使其在资源受限的基层医疗机构中推广受限。

面向未来,研究者需要在多个方向上持续探索。其一,应推动多中心合作与数据共享,构建标准化、规模化且具有代表性的数据集,以增强模型的稳健性和普适性。其二,轻量化与高效化深度学习模型的设计将是重要趋势,通过结合边缘计算、移动设备与云平台,有望实现智能诊断在临床一线的广泛应用。其三,加强模型的可解释性研究,引入可解释人工智能与可视化技术,使模型决策过程更透明,为医生提供可靠的辅助证据。其四,探索多模态信息融合,将影像学、临床特征、基因组学和病理学信息有机结合,推动乳腺癌诊断和预后预测的综合化发展。最后,未来的计算机辅助诊断系统应注重与临床医生的协同,构建人机共诊的新型模式,从而实现乳腺癌诊断的智能化、精准化与可持续发展。

基金项目

黑龙江省属本科高校基本科研业务费项目(项目编号yw2023zrqc03);大庆市指导性科技计划项目(项目编号zd-2023-10)。

参考文献

[1] Bray, F., Laversanne, M., Sung, H., Ferlay, J., Siegel, R.L., Soerjomataram, I., et al. (2024) Global Cancer Statistics 2022: GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries. CA: A Cancer Journal for Clinicians, 74, 229-263. [Google Scholar] [CrossRef] [PubMed]
[2] Cancer Today.
https://gco.iarc.fr/today/home
[3] Siegel, R.L., Miller, K.D., Fuchs, H.E. and Jemal, A. (2022) Cancer Statistics, 2022. CA: A Cancer Journal for Clinicians, 72, 7-33. [Google Scholar] [CrossRef] [PubMed]
[4] Shallu, and Mehra, R. (2018) Breast Cancer Histology Images Classification: Training from Scratch or Transfer Learning? ICT Express, 4, 247-254. [Google Scholar] [CrossRef
[5] Ledley, R.S., Jacobsen, J. and Belson, M. (1966) BUGSYS: A Programming System for Picture Processing-Not for Debugging. Communications of the ACM, 9, 79-84. [Google Scholar] [CrossRef
[6] Winsberg, F., Elkin, M., Macy, J., Bordaz, V. and Weymouth, W. (1967) Detection of Radiographic Abnormalities in Mammograms by Means of Optical Scanning and Computer Analysis. Radiology, 89, 211-215. [Google Scholar] [CrossRef
[7] Mahmood, T., Li, J., Pei, Y., Akhtar, F., Imran, A. and Rehman, K.U. (2020) A Brief Survey on Breast Cancer Diagnostic with Deep Learning Schemes Using Multi-Image Modalities. IEEE Access, 8, 165779-165809. [Google Scholar] [CrossRef
[8] Pramanik, P.K.D., Solanki, A., Debnath, A., Nayyar, A., El-Sappagh, S. and Kwak, K. (2020) Advancing Modern Healthcare with Nanotechnology, Nanobiosensors, and Internet of Nano Things: Taxonomies, Applications, Architecture, and Challenges. IEEE Access, 8, 65230-65266. [Google Scholar] [CrossRef
[9] Lahoura, V., Singh, H., Aggarwal, A., Sharma, B., Mohammed, M.A., Damaševičius, R., et al. (2021) Cloud Computing-Based Framework for Breast Cancer Diagnosis Using Extreme Learning Machine. Diagnostics, 11, Article 241. [Google Scholar] [CrossRef] [PubMed]
[10] Khalid, S., Khalil, T. and Nasreen, S. (2014) A Survey of Feature Selection and Feature Extraction Techniques in Machine Learning. 2014 Science and Information Conference, London, 27-29 August 2014, 372-378. [Google Scholar] [CrossRef
[11] Jalalian, A., Mashohor, S., Mahmud, R., et al. (2017) Foundation and Methodologies in Computer-Aided Diagnosis Systems for Breast Cancer Detection. EXCLI Journal, 16, 113-117.
[12] Yassin, N.I.R., Omran, S., El Houby, E.M.F. and Allam, H. (2019) Machine Learning Techniques for Breast Cancer Computer Aided Diagnosis Using Different Image Modalities: A Systematic Review. Computer Methods and Programs in Biomedicine, 156, 25-45. [Google Scholar] [CrossRef] [PubMed]
[13] Yu, X., Zhou, Q., Wang, S. and Zhang, Y. (2022) A Systematic Survey of Deep Learning in Breast Cancer. International Journal of Intelligent Systems, 37, 152-216. [Google Scholar] [CrossRef
[14] Sultan, H.H., Salem, N.M. and Al-Atabany, W. (2019) Multi-Classification of Brain Tumor Images Using Deep Neural Network. IEEE Access, 7, 69215-69225. [Google Scholar] [CrossRef
[15] Araújo, T., Aresta, G., Castro, E., Rouco, J., Aguiar, P., Eloy, C., et al. (2017) Classification of Breast Cancer Histology Images Using Convolutional Neural Networks. PLOS ONE, 12, e0177544. [Google Scholar] [CrossRef] [PubMed]
[16] Aresta, G., Araújo, T., Kwok, S., Chennamsetty, S.S., Safwan, M., Alex, V., et al. (2019) BACH: Grand Challenge on Breast Cancer Histology Images. Medical Image Analysis, 56, 122-139. [Google Scholar] [CrossRef] [PubMed]
[17] Spanhol, F.A., Oliveira, L.S., Petitjean, C. and Heutte, L. (2016) A Dataset for Breast Cancer Histopathological Image Classification. IEEE Transactions on Biomedical Engineering, 63, 1455-1462. [Google Scholar] [CrossRef] [PubMed]
[18] Bandi, P., Geessink, O., Manson, Q., Van Dijk, M., Balkenhol, M., Hermsen, M., et al. (2019) From Detection of Individual Metastases to Classification of Lymph Node Status at the Patient Level: The CAMELYON17 Challenge. IEEE Transactions on Medical Imaging, 38, 550-560. [Google Scholar] [CrossRef] [PubMed]
[19] Xu, J., Xiang, L., Liu, Q., Gilmore, H., Wu, J., Tang, J., et al. (2016) Stacked Sparse Autoencoder (SSAE) for Nuclei Detection on Breast Cancer Histopathology Images. IEEE Transactions on Medical Imaging, 35, 119-130. [Google Scholar] [CrossRef] [PubMed]
[20] Li, Y., Wu, J. and Wu, Q. (2019) Classification of Breast Cancer Histology Images Using Multi-Size and Discriminative Patches Based on Deep Learning. IEEE Access, 7, 21400-21408. [Google Scholar] [CrossRef
[21] Yan, R., Ren, F., Wang, Z., Wang, L., Zhang, T., Liu, Y., et al. (2020) Breast Cancer Histopathological Image Classification Using a Hybrid Deep Neural Network. Methods, 173, 52-60. [Google Scholar] [CrossRef] [PubMed]
[22] Alom, M.Z., Yakopcic, C., Nasrin, M.S., Taha, T.M. and Asari, V.K. (2019) Breast Cancer Classification from Histopathological Images with Inception Recurrent Residual Convolutional Neural Network. Journal of Digital Imaging, 32, 605-617. [Google Scholar] [CrossRef] [PubMed]
[23] Kassani, S.H., Kassani, P.H., Wesolowski, M.J., Schneider, K.A. and Deters, R. (2019) Breast Cancer Diagnosis with Transfer Learning and Global Pooling. 2019 International Conference on Information and Communication Technology Convergence (ICTC), Jeju, 16-18 October 2019, 519-524. [Google Scholar] [CrossRef
[24] Sanyal, R., Kar, D. and Sarkar, R. (2022) Carcinoma Type Classification from High-Resolution Breast Microscopy Images Using a Hybrid Ensemble of Deep Convolutional Features and Gradient Boosting Trees Classifiers. IEEE/ACM Transactions on Computational Biology and Bioinformatics, 19, 2124-2136. [Google Scholar] [CrossRef] [PubMed]
[25] Elmannai, H., Hamdi, M. and AlGarni, A. (2021) Deep Learning Models Combining for Breast Cancer Histopathology Image Classification. International Journal of Computational Intelligence Systems, 14, 1003-1013. [Google Scholar] [CrossRef
[26] Kausar, T., Wang, M., Idrees, M. and Lu, Y. (2019) HWDCNN: Multi-Class Recognition in Breast Histopathology with Haar Wavelet Decomposed Image Based Convolution Neural Network. Biocybernetics and Biomedical Engineering, 39, 967-982. [Google Scholar] [CrossRef
[27] Jiang, Y., Chen, L., Zhang, H. and Xiao, X. (2019) Breast Cancer Histopathological Image Classification Using Convolutional Neural Networks with Small Se-Resnet Module. PLOS ONE, 14, e0214587. [Google Scholar] [CrossRef] [PubMed]
[28] Budak, Ü., Cömert, Z., Rashid, Z.N., Şengür, A. and Çıbuk, M. (2019) Computer-Aided Diagnosis System Combining FCN and Bi-LSTM Model for Efficient Breast Cancer Detection from Histopathological Images. Applied Soft Computing, 85, Article 105765. [Google Scholar] [CrossRef
[29] Xie, J., Liu, R., Luttrell, J. and Zhang, C. (2019) Deep Learning Based Analysis of Histopathological Images of Breast Cancer. Frontiers in Genetics, 10, Article ID: 80. [Google Scholar] [CrossRef] [PubMed]
[30] Matos, J.D., Britto, A.D.S., Oliveira, L.E.S. and Koerich, A.L. (2019) Double Transfer Learning for Breast Cancer Histopathologic Image Classification. 2019 International Joint Conference on Neural Networks (IJCNN), Budapest, 14-19 July 2019, 1-8. [Google Scholar] [CrossRef
[31] Sudharshan, P.J., Petitjean, C., Spanhol, F., Oliveira, L.E., Heutte, L. and Honeine, P. (2019) Multiple Instance Learning for Histopathological Breast Cancer Image Classification. Expert Systems with Applications, 117, 103-111. [Google Scholar] [CrossRef
[32] Lin, C. and Jeng, S. (2020) Optimization of Deep Learning Network Parameters Using Uniform Experimental Design for Breast Cancer Histopathological Image Classification. Diagnostics, 10, Article 662. [Google Scholar] [CrossRef] [PubMed]
[33] Toğaçar, M., Özkurt, K.B., Ergen, B. and Cömert, Z. (2020) Breastnet: A Novel Convolutional Neural Network Model through Histopathological Images for the Diagnosis of Breast Cancer. Physica A: Statistical Mechanics and its Applications, 545, Article 123592. [Google Scholar] [CrossRef
[34] Murtaza, G., Shuib, L., Mujtaba, G. and Raza, G. (2020) Breast Cancer Multi-Classification through Deep Neural Network and Hierarchical Classification Approach. Multimedia Tools and Applications, 79, 15481-15511. [Google Scholar] [CrossRef
[35] Hou, Y. (2020) Breast Cancer Pathological Image Classification Based on Deep Learning. Journal of X-Ray Science and Technology: Clinical Applications of Diagnosis and Therapeutics, 28, 727-738. [Google Scholar] [CrossRef] [PubMed]
[36] Yari, Y., Nguyen, T.V. and Nguyen, H.T. (2020) Deep Learning Applied for Histological Diagnosis of Breast Cancer. IEEE Access, 8, 162432-162448. [Google Scholar] [CrossRef
[37] Alkassar, S., Jebur, B.A., Abdullah, M.A.M., Al‐Khalidy, J.H. and Chambers, J.A. (2021) Going Deeper: Magnification‐invariant Approach for Breast Cancer Classification Using Histopathological Images. IET Computer Vision, 15, 151-164. [Google Scholar] [CrossRef
[38] Bera, A., Bhattacharjee, D. and Krejcar, O. (2024) PND-Net: Plant Nutrition Deficiency and Disease Classification Using Graph Convolutional Networks. Scientific Reports, 14, Article Number 15537. [Google Scholar] [CrossRef] [PubMed]
[39] Li, X., Li, H., Cui, W., Cai, Z. and Jia, M. (2021) Classification on Digital Pathological Images of Breast Cancer Based on Deep Features of Different Levels. Mathematical Problems in Engineering, 2021, Article ID: 8403025. [Google Scholar] [CrossRef
[40] Maleki, A., Raahemi, M. and Nasiri, H. (2023) Breast Cancer Diagnosis from Histopathology Images Using Deep Neural Network and XGBoost. Biomedical Signal Processing and Control, 86, Article 105152. [Google Scholar] [CrossRef
[41] Alkhathlan, L. and Saudagar, A.K.J. (2022) Predicting and Classifying Breast Cancer Using Machine Learning. Journal of Computational Biology, 29, 497-514. [Google Scholar] [CrossRef] [PubMed]
[42] Sui, D., Liu, W., Chen, J., Zhao, C., Ma, X., Guo, M., et al. (2021) A Pyramid Architecture-Based Deep Learning Framework for Breast Cancer Detection. BioMed Research International, 2021, Article ID: 2567202. [Google Scholar] [CrossRef] [PubMed]
[43] Zeiser, F.A., da Costa, C.A., Ramos, G.D.O., Bohn, H.C., Santos, I. and Roehe, A.V. (2021) Deepbatch: A Hybrid Deep Learning Model for Interpretable Diagnosis of Breast Cancer in Whole-Slide Images. Expert Systems with Applications, 185, Article 115586. [Google Scholar] [CrossRef
[44] Hirra, I., Ahmad, M., Hussain, A., Ashraf, M.U., Saeed, I.A., Qadri, S.F., et al. (2021) Breast Cancer Classification from Histopathological Images Using Patch-Based Deep Learning Modeling. IEEE Access, 9, 24273-24287. [Google Scholar] [CrossRef
[45] Pradeepa, M., Sharmila, B. and Nirmala, M. (2025) A Hybrid Deep Learning Model EfficientNet with GRU for Breast Cancer Detection from Histopathology Images. Scientific Reports, 15, Article No. 24633. [Google Scholar] [CrossRef] [PubMed]
[46] Matheus, B.N. and Schiabel, H. (2011) Online Mammographic Images Database for Development and Comparison of CAD Schemes. Journal of Digital Imaging, 24, 500-506. [Google Scholar] [CrossRef] [PubMed]
[47] Saravanan, S., Hailu, M., Gouse, G.M., Lavanya, M. and Vijaysai, R. (2019) Optimized Secure Scan Flip Flop to Thwart Side Channel Attack in Crypto-Chip. International Conference on Advances of Science and Technology, 274, 410-417. [Google Scholar] [CrossRef
[48] Lee, R.S., Gimenez, F., Hoogi, A. and Rubin, D. (2016) Curated Breast Imaging Subset of DDSM. The Cancer Imaging Archive, 8.
[49] Moreira, I.C., Amaral, I., Domingues, I., Cardoso, A., Cardoso, M.J. and Cardoso, J.S. (2012) INbreast: Toward a Full-Field Digital Mammographic Database. Academic Radiology, 19, 236-248. [Google Scholar] [CrossRef] [PubMed]
[50] Saber, A., Sakr, M., Abo-Seida, O.M., Keshk, A. and Chen, H. (2021) A Novel Deep-Learning Model for Automatic Detection and Classification of Breast Cancer Using the Transfer-Learning Technique. IEEE Access, 9, 71194-71209. [Google Scholar] [CrossRef
[51] Sha, Z., Hu, L. and Rouyendegh, B.D. (2020) Deep Learning and Optimization Algorithms for Automatic Breast Cancer Detection. International Journal of Imaging Systems and Technology, 30, 495-506. [Google Scholar] [CrossRef
[52] Houssein, E.H., Emam, M.M. and Ali, A.A. (2022) An Optimized Deep Learning Architecture for Breast Cancer Diagnosis Based on Improved Marine Predators Algorithm. Neural Computing and Applications, 34, 18015-18033. [Google Scholar] [CrossRef] [PubMed]
[53] Kavitha, T., Mathai, P.P., Karthikeyan, C., Ashok, M., Kohar, R., Avanija, J., et al. (2022) Deep Learning Based Capsule Neural Network Model for Breast Cancer Diagnosis Using Mammogram Images. Interdisciplinary Sciences: Computational Life Sciences, 14, 113-129. [Google Scholar] [CrossRef] [PubMed]
[54] Salama, W.M., Elbagoury, A.M. and Aly, M.H. (2020) Novel Breast Cancer Classification Framework Based on Deep Learning. IET Image Processing, 14, 3254-3259. [Google Scholar] [CrossRef
[55] Lotter, W., Diab, A.R., Haslam, B., Kim, J.G., Grisot, G., Wu, E., et al. (2021) Robust Breast Cancer Detection in Mammography and Digital Breast Tomosynthesis Using an Annotation-Efficient Deep Learning Approach. Nature Medicine, 27, 244-249. [Google Scholar] [CrossRef] [PubMed]
[56] Baccouche, A., Garcia-Zapirain, B., Castillo Olea, C. and Elmaghraby, A.S. (2021) Connected-UNets: A Deep Learning Architecture for Breast Mass Segmentation. npj Breast Cancer, 7, Article No. 151. [Google Scholar] [CrossRef] [PubMed]
[57] Shu, X., Zhang, L., Wang, Z., Lv, Q. and Yi, Z. (2020) Deep Neural Networks with Region-Based Pooling Structures for Mammographic Image Classification. IEEE Transactions on Medical Imaging, 39, 2246-2255. [Google Scholar] [CrossRef] [PubMed]
[58] Berg, W.A., et al. (2012) Detection of Breast Cancer with Addition of Annual Screening Ultrasound or a Single Screening MRI to Mammography in Women with Elevated Breast Cancer Risk. JAMA, 307, 1394-1404. [Google Scholar] [CrossRef] [PubMed]
[59] Al-Dhabyani, W., Gomaa, M., Khaled, H. and Fahmy, A. (2020) Dataset of Breast Ultrasound Images. Data in Brief, 28, Article 104863. [Google Scholar] [CrossRef] [PubMed]
[60] Byra, M. (2021) Breast Mass Classification with Transfer Learning Based on Scaling of Deep Representations. Biomedical Signal Processing and Control, 69, Article 102828. [Google Scholar] [CrossRef
[61] Pourasad, Y., Zarouri, E., Salemizadeh Parizi, M. and Salih Mohammed, A. (2021) Presentation of Novel Architecture for Diagnosis and Identifying Breast Cancer Location Based on Ultrasound Images Using Machine Learning. Diagnostics, 11, Article 1870. [Google Scholar] [CrossRef] [PubMed]
[62] Balaha, H.M., Saif, M., Tamer, A. and Abdelhay, E.H. (2022) Hybrid Deep Learning and Genetic Algorithms Approach (HMB-DLGAHA) for the Early Ultrasound Diagnoses of Breast Cancer. Neural Computing and Applications, 34, 8671-8695. [Google Scholar] [CrossRef
[63] Jabeen, K., Khan, M.A., Alhaisoni, M., Tariq, U., Zhang, Y., Hamza, A., et al. (2022) Breast Cancer Classification from Ultrasound Images Using Probability-Based Optimal Deep Learning Feature Fusion. Sensors, 22, Article 807. [Google Scholar] [CrossRef] [PubMed]