1. 引言
乳腺癌作为全球女性最常见的恶性肿瘤之一,严重威胁着女性的生命健康。在我国,乳腺癌的发病率和死亡率呈逐年上升趋势,且发病年龄逐渐年轻化。研究表明,早期乳腺癌患者经及时有效的治疗,五年生存率可高达90%以上,而晚期患者的五年生存率则大幅下降[1]。面对癌症发病率和死亡率的快速增加,精确预测癌症患者的生存期[2]不仅有助于避免过度治疗,还能为临床决策提供科学依据。
20世纪末,国内外已有针对癌症患者生存期相关问题的研究[3]。传统的研究方法主要依据患者肿瘤部位、分化程度等临床和病理数据,采用统计学方法分析。随着测序和医学图像技术的发展,高通量、高维度的组学和图像数据为癌症预后预测研究提供了新方向,而传统方法已不能满足预后预测的技术要求。近年来,人工智能技术应用于医学领域的研究有显著进展[4],特别是深度学习技术在探索准确高效的辅助诊断方法方面存在巨大潜力[5]。例如,卷积神经网络(Convolutional Neural Network, CNN)擅长通过局部感知和权值共享处理具有网格状拓扑结构的数据(如图像、视频);Transformer (Transformer Neural Network Architecture)凭借自注意力机制,在处理序列数据(如文本、语音)时能捕捉长距离依赖关系等。基于该技术在医学图像和多组学数据处理上的优势和潜力,为癌症预后预测提供了新思路[6],逐渐成为癌症预后预测的研究热点。
结合人工智能技术在乳腺癌预后预测中的研究,本文将从以下几个方面进行阐述:(1) 乳腺癌预后预测公开数据集;(2) 性能评估指标;(3) 人工智能技术在乳腺癌预后预测中的研究进展;(4) 面向乳腺癌预后的多模态信息融合策略;(5) 人工智能在乳腺癌预后预测中面临的挑战与未来发展趋势。
2. 数据集与评估指标
2.1. 数据集
乳腺癌的预后预测受多种因素影响,如激素受体状态、HER-2状态等。因乳腺癌样本获取存在难度,且对样本处理和存储要求严格;同时,数据标注需专业病理医生耗费大量时间精力,这都导致乳腺癌数据稀缺。目前常用的数据集包括TCGA (The Cancer Genome Atlas) [7]、SEER (Surveillance, Epidemiology, and End Results) [8]等(见表1)。这些数据集包含了大量的乳腺癌患者数据,如临床资料、基因数据和图像数据等多模态信息,为研究人员提供了全面了解乳腺癌生物学特征和疾病发展机制的平台。
Table 1. Prognostic dataset
表1. 预后预测数据集
2.2. 评估指标
在预后预测研究中,选择合适的评价指标对准确评估和比较模型性能至关重要[10]。主要评价指标包括曲线下面积(area under the curve, AUC)、准确率(accuracy rate, ACC)、一致性指数(consistency index, C-index)等(见表2)。这些指标不仅能反映模型对数据的拟合度,也指示了模型在实际临床应用中的潜在价值。
Table 2. Main outcome measures
表2. 主要评估指标
指标 |
定义 |
意义 |
AUC |
真正例率和假正例率 之间的关系图 |
比较不同预测模型的性能, 应对预后预测数据不平衡问题 |
ACC |
正确预测的样本数占 总样本数的比例 |
衡量预测模型在可能的分类 阈值上的整体表现 |
C-index |
模型正确预测事件顺序的比例 |
评估和比较生存时间, 预测模型的性能 |
3. 基于机器学习的乳腺癌预后预测研究进展
乳腺癌预后预测对于避免患者过度治疗、推动临床研究及药物研发,进而改善患者治疗效果与生活质量意义重大。机器学习技术近年来在乳腺癌预后分析领域应用广泛,接下来将着重探讨用于预测乳腺癌生存期的相关模型。
3.1. 梯度提升算法及其变体
梯度提升算法(Gradient Boosting, GB)是一种集成学习算法[11],它通过迭代地训练多个弱学习器,沿着损失函数的负梯度方向不断纠正前一个模型的错误,将它们组合起来构建一个强大的预测模型。通过对数据的深入剖析和理解,实现乳腺癌生存期的精准预测(见表3)。
借鉴机器学习在其他领域的成功应用,Chen等人[12]提出了一种基于梯度提升的生存分析算法GBMCI,通过直接优化一致性指数来预测生存时间。结果显示,GBMCI在多数特征设置下表现更优,证实了非参数集成模型在生存分析中的有效性。Hongya等人[13]提出了一种基于遗传算法的在线梯度提升(Online Gradient Boosting, OGB)模型,用于乳腺癌的增量预后预测。模型将遗传算法集成到OGB框架中,通过优化OGB的关键参数,以实现实时参数优化和模型更新。GB的变体极端梯度提升(eXtreme Gradient Boosting, XGBoost)通过优化的分布式梯度提升框架,在大规模数据集和复杂问题上表现出卓越的性能。Liu等人[14]提出了一种基于XGBoost框架和Cox比例风险模型的生存分析方法,用于预测乳腺癌患者的疾病进展。结果显示,该模型优于Cox、RSF等传统模型。
总体来看,GB及其变体用于乳腺癌预后预测时,优势在于能通过集成弱学习器提升预测精度,但存在计算资源需求大、超参数调整复杂、对特定数据集依赖等问题,部分模型在复杂数据下效率及临床解释性不足。未来可结合多算法优势,优化参数自适应机制,加强与临床场景融合,提升模型实用性与可解释性,推动精准医疗应用。
Table 3. A prognostic prediction model based on GB
表3. 基于梯度提升算法的预后预测模型
文献 |
数据集 |
数据类型 |
模型性能 |
预测结果 |
ACC |
AUC |
C-index |
Chen等[12] |
Metabric |
基因 拷贝数变异 |
— |
— |
0.73 |
生存 |
Hongya等[13] |
SEER、UCI |
微阵列数据 |
0.75 |
0.75 |
— |
生存 |
Liu等[14] |
华西医院临床研究中心 |
病理 |
— |
0.83 |
0.83 |
5年生存 10年生存 |
3.2. 决策树及其变体
决策树(Decision Tree, DT)是一种通过对特征进行递归划分,构建树状结构实现分类或回归的机器学习算法[15],其基于信息增益等准则选择最优分裂特征,将样本从根节点逐步划分至叶节点以确定类别(见表4)。
为了解决乳腺癌患者生存数据不平衡问题,研究者们基于DT提出多种方法。Wang等人[16]运用成本敏感分类(Cost-Sensitive Classification, CSC)等方法处理不平衡数据,通过特征选择和剪枝优化模型。结果证实了CSC和特征优化在不平衡数据中提升预测准确性的有效性。Liu等人[17]采用C5DT算法,结合欠采样方法平衡数据,并引入Bagging算法集成多个DT提升分类效果。结果证实该模型能有效改善不平衡数据下的乳腺癌生存预测性能。Wang等人[18]提出了一种结合合成少数过采样技术(Synthetic Minority Over-sampling Technique, SMOTE)与粒子群优化算法(Particle Swarm Optimization, PSO)的混合分类器。结果显示,SMOTE + PSO + C5混合模型性能最佳,证实SMOTE与PSO结合能有效改善不平衡数据下的分类效果。
研究表明,DT可通过递归划分特征处理临床数据以预测乳腺癌预后,借助欠采样等方式解决生存数据不平衡问题,提升准确性;经模糊化等改进及规则权重优化,能增强个性化医疗中预测的鲁棒性与可解释性。尽管部分变体在处理高维复杂数据时存在模型复杂、计算成本高及对噪声敏感等需优化的问题,但总体上DT及其变体在乳腺癌预后预测中仍具重要价值与应用潜力。
Table 4. A prognostic prediction model based on DT
表4. 基于决策树的预后预测模型
文献 |
数据集 |
数据类型 |
模型性能 |
预测结果 |
ACC |
AUC |
C-index |
Wang等[16] |
SEER |
临床、病理 |
— |
0.82 |
— |
5年生存 |
Liu等[17] |
SEER |
临床、病理 |
0.76 |
0.76 |
— |
5年生存 |
Wang等[18] |
SEER |
临床、病理 |
0.94 |
— |
— |
5年生存 |
Momenyan等[19] |
伊朗德黑兰沙希德贝赫什提医科大学 |
临床、病理 |
0.86 |
— |
— |
5年生存 |
3.3. 局限性与挑战
虽然GB和DT在乳腺癌预后预测中已取得较大进步,但仍然存在局限性且面临一些挑战。GB在乳腺癌预后预测中对计算资源消耗巨大,在大规模数据集下训练时间显著增加,同时超参数调整复杂且缺乏通用策略,对特定数据集依赖性强,部分变体模型临床解释性和运行效率不足。而DT应用于乳腺癌预后预测时过拟合风险突出,尤其在树结构复杂时表现明显。另外,在处理高维复杂数据时能力有限且对噪声敏感,复杂模型或集成变体的解释性优势大幅减弱。
综上所述,在乳腺癌预后预测场景中,若数据集为基因、拷贝数变异等特殊类型,或需预测长期多时间节点生存,且有一定计算资源支撑超参数调优等,GB有其适配性;当数据集是临床、病理这类常规类型,追求模型快速构建、结果直观可解释,或数据维度低、计算资源有限时,DT更为合适。
4. 基于深度学习的乳腺癌预后预测研究进展
深度学习技术近年来也在乳腺癌预后分析领域应用广泛,特别是用于处理大规模、多模态数据。接下来将着重探讨深度学习用于预测乳腺癌生存期的相关模型。
4.1. 卷积神经网络及其变体
卷积神经网络由卷积层、池化层和全连接层组成[20]。在处理预后预测任务时,能利用卷积操作捕捉医学影像中与预后相关的空间特征,通过端到端学习减少人工特征工程依赖,且多层特征提取可提升对复杂病灶模式的识别能力,适合从乳腺影像数据中挖掘预后相关信息(见表5)。
4.1.1. 基于单模态的乳腺癌预后预测
借鉴CNN在其他医学领域的成功研究,Colomba等人[21]基于迁移学习,利用CNN从DCE-MRI中提取低层次特征,结合临床变量构建SVM分类模型,实现对患者三年乳腺癌复发BCR的早期预测。研究表明CNN特征是BCR的强预测因子,结合临床变量可进一步提升预测性能。Wetstein等人[22]以ResNet-34为骨干网络,筛选top 5高概率图块进行训练,最终通过多数投票预测全切片分级。生存分析结果表明模型预测的两组患者总生存期、无远处复发生存期和无复发生存期有显著差异。
4.1.2. 基于多模态的乳腺癌预后预测
若仅依靠单模态数据对癌症生存期进行预测,往往会因信息获取不全面,致使预测的准确性与可靠性受到影响。而多模态预测能够捕捉癌症相关的复杂关联及多维度影响因素,进而提升预测精度,增强个性化治疗的有效性[23]。韩珺琪[24]利用乳腺X线摄影及超声图像构建ResNet50,选择预测效能最高的深度学习模型联合临床模型建立综合模型。实验结果表明,综合模型具有最高的预测性能。曹广硕等人[25]为了减少单一模态数据异质性对全局特征造成的影响,将深度可分离卷积和多头自注意力机制作为多模态模块架构对数据进行特征融合,捕获患者多模态基因组数据的全局信息。
Table 5. A prognostic prediction model based on CNN
表5. 基于卷积神经网络的预后预测模型
文献 |
数据集 |
数据类型 |
模型性能 |
预测结果 |
ACC |
AUC |
C-index |
Colomba等[21] |
SPY1 TRIAL |
DCE-MRI |
0.91 |
— |
— |
3年BCR |
Wetstein等[22] |
PARADIGM |
WSIs病理 |
0.80 |
— |
— |
8年生存 |
韩珺琪[24] |
青岛大学附属医院 |
乳腺X线摄影、超声图、病理 |
— |
0.88 |
— |
生存状态 |
曹广硕等[25] |
METABRIC |
EXPR、CNGM、SNV、CNA |
0.79 |
0.71 |
— |
4年生存 |
研究表明,CNN能自动提取影像局部特征并逐层抽象,借多层结构捕捉乳腺癌预后相关空间特征,其变体技术可增强对医学数据的适应性,减少人工特征工程依赖;整合多模态数据并结合特征融合与注意力机制,能提升预测性能、解决单模态信息不全问题,为精准预测与个性化治疗提供支持。尽管部分CNN模型处理高维多模态数据时存在计算复杂、需大量样本及对噪声和数据异质性敏感等需优化的问题,但其仍具价值。
4.2. 图神经网络及其变体
图神经网络(Graph Neural Network, GNN)作为一种新兴的深度学习模型[26],擅长处理具有拓扑结构的非欧几里得数据。相较于传统神经网络,GNN无需将数据强制转换为规则的网格结构,这使其在处理具有不规则拓扑的数据时更具优势。当应用于乳腺癌数据处理时,GNN可以将多源信息构建成图结构,每个节点代表不同的数据实体,边则表示实体间的关联。凭借其强大的关系建模能力,能够挖掘数据间潜在的复杂关系,从而辅助医生更准确地评估病情、制定个性化治疗方案(见表6)。
基于GNN在多模态数据信息挖掘上的优势,研究人员不断探索新的方法进一步提升其在乳腺癌预后预测中的表现。Palmal等人[27]聚焦于利用多模态数据预测乳腺癌患者的长短生存期情况。研究通过图对比学习利用图卷积网络结合对比损失提取潜在特征,再用跨模态注意力机制整合。结果显示,该模型优于随机森林等基线模型。Gao等人[28]提出了一种多模态GNN框架用于癌症患者生存预测。通过GNN在二分图上聚合邻居信息更新患者嵌入,最后通过多模态融合神经层拼接多模态嵌入。为了实现多源异构数据应用于该预测任务的效果提升,薛婧瑶[29]提出一种基于对比学习的生存期预测模型Multi-Con。利用异质图对关系建模并提出基于边增强的图注意力机制以提升特征提取能力,通过定义两种不同对比学习正负样本对,得到能够增强不同类别患者区分度的混合对比学习方案。
研究表明,GNN及其变体具备处理含不同类型节点与边的图结构的能力,可捕捉节点间复杂依赖关系,进而从中挖掘与患者生存期预测相关的特征。基于此,能够借助GNN这类模型对多模态数据进行整合与分析,提升癌症生存期预测在准确性和效率方面的表现。
Table 6. A prognostic prediction model based on GNN
表6. 基于图神经网络的预后预测模型
文献 |
数据集 |
数据类型 |
模型性能 |
预测结果 |
ACC |
AUC |
C-index |
Palmal等[27] |
TCGA |
基因、WSIs、mRNA测序等 |
0.93 |
0.94 |
— |
长期/短期生存 |
Gao等[28] |
TCGA |
基因、CNV |
0.95 |
0.98 |
— |
生存 |
薛婧瑶[29] |
METABRIC TCGA |
临床、基因、CNV |
0.95 |
— |
— |
长期/短期生存 |
Huang等[30] |
TCGA |
RNA测序 |
0.87 |
0.62 |
— |
生存状态 |
4.3. Transformer及其变体
Transformer模型的架构包含编码器与解码器两部分。编码器的组成单元,是多头注意力层与简易前馈神经网络[31]。解码器则在编码器结构基础上,额外增设一个多头注意力层,用于聚焦编码器输出内容[32]。在癌症预后预测场景中,这样重复堆叠的层级结构,可助力模型挖掘更复杂的语言特征。同时,自注意力机制能够高效融合不同模态来源的数据。凭借精准捕捉数据间关联,该模型可提升预后预测结果的准确性(见表7)。
近年来,Transformer在乳腺癌预后预测中的研究有更进一步的进展。Luo等人[33]采用全切片图像构建PathoHR框架来预测总生存期。该框架结合预训练UNI编码器生成高维特征,并系统评估多种相似性度量优化特征表示,利用ViTAR编码器的自适应令牌合并和模糊位置编码处理多分辨率patch。Mbaye等人[34]提出了一种多模态电子健康记录模型M-BEHRT,用于预测乳腺癌患者术后3年DFS。该模型结合Transformer将患者就诊轨迹视为序列,通过掩码语言模型学习患者轨迹表示。针对多示例学习,Wu等人[35]针对HR+/HER2-早期乳腺癌患者,构建了整合病理图像与临床特征的多模态复发风险预测模型。通过两种基于注意力机制的深度学习管道,利用组织特异性特征编码器提取图像特征,再通过Cox回归等方法整合多模态特征。
上述研究成果显示,Transformer及其变体在癌症生存期预测领域展现出可观潜力。其依托自注意力机制,能够有效捕获输入数据间的长距离依赖关系,助力挖掘与病情严重程度、预后关联的细微特征,进而强化模型预测效能。
Table 7. A prognostic prediction model based on Transformer
表7. 基于Transformer的预后预测模型
文献 |
数据集 |
数据类型 |
模型性能 |
预测结果 |
ACC |
AUC |
C-index |
Luo等[33] |
TCGA |
WSIs |
0.97 |
0.90 |
— |
总生存期 |
Mbaye等[34] |
法国居里研究所 |
文本报告 生物标志物 |
— |
0.77 |
— |
3年生存 |
Wu等[35] |
四川大学华西医院、TCGA |
病理图像 |
— |
0.86 |
— |
5年生存 |
Wang等[36] |
TCGA |
病理图像 |
— |
— |
0.668 |
总生存期 |
4.4. 混合模型
乳腺癌预后预测常使用多模态数据进行分析,根据不同的模态特性使用有针对性的模型处理能进一步提高预测精度。Boehm等人[37]开发了多模态深度学习工具,用ResNet-50提取全切片图像局部特征,并通过滑动窗口机制覆盖全切片,再用Transformer处理病理报告。研究表明,模型对转移复发风险的评估准确性显著高于复发评分本身。Palmal等人[38]提出了基于GCN和Choquet模糊积分的乳腺癌生存预后模型。该模型通过GCN构建多模态图结构,再利用Choquet模糊积分集成逻辑回归等模型作为基分类器,通过模糊测度动态融合各分类器概率输出,结果证实多组学与GCN结合能有效提升乳腺癌生存预后预测性能。Othman等人[39]通过CNN从各单模态数据提取特征,将提取的CNA和基因表达等特征拼接成堆叠特征,分别输入LSTM和GRU进行分类,再利用硬投票集成模型融合两者决策,来预测5年内生存期(见表8)。
Table 8. A prognostic prediction model based on Hybrid Model
表8. 基于混合模型的预后预测模型
文献 |
数据集 |
数据类型 |
模型性能 |
预测结果 |
ACC |
AUC |
C-index |
Boehm等[37] |
安德森癌症中心 |
WSIs 病理报告 |
— |
0.89 |
— |
复发评分 复发风险分层 |
Palmal等[38] |
METABRIC |
基因、CNA |
0.82 |
— |
— |
5年生存 |
Othman等[39] |
METABRIC |
基因、CNA |
0.98 |
0.98 |
— |
5年生存 |
Arya等[40] |
METABRIC |
临床、基因CNA |
0.91 |
0.95 |
— |
5年生存 |
4.5. 局限性与挑战
虽然深度学习模型在乳腺癌预后预测中取得显著进展,但仍存在局限。CNN因其局部感受野特性,在处理多模态数据时,不同模态特征的空间关联性难以通过单一卷积操作充分捕捉,导致特征融合效率低下;其常用的医学影像数据存在模态内噪声(如影像伪影)和模态间异质性(如MRI与超声的成像原理差异),而CNN的参数共享机制对这类数据分布差异的适应性较弱,使得模型在跨中心、跨设备数据上的泛化能力受限。GNN的挑战在于其性能高度依赖图结构的合理性,构建基因、影像和临床特征三者的关联边时,若缺乏明确的生物学或临床逻辑支撑,易引入虚假关联;常用的多源异构数据在节点特征维度和分布上差异显著,GNN的聚合函数难以平衡不同类型节点的贡献权重,且复杂图结构会导致梯度传播困难,增加模型训练的不稳定性。Transformer及其变体的自注意力机制在计算时复杂度随序列长度呈平方级增长,处理全切片图像的海量patch或长时序电子健康记录时,会产生极高的计算开销;其依赖的大规模序列数据在乳腺癌预后场景中常存在信息稀疏性(如患者随访记录不完整),导致注意力权重分配不合理。混合模型的局限性体现在模态适配与融合策略的协同优化上,例如CNN提取的影像特征与LSTM处理的时序特征在维度和语义层面存在鸿沟,硬投票等简单融合方式难以充分挖掘跨模态互补信息;不同子模型的训练目标存在差异,会导致梯度冲突,增加整体模型的收敛难度。
从适用场景来看,当数据以单模态医学影像为主,且需挖掘局部病灶的空间形态特征(如肿瘤边界、密度分布),同时具备一定规模的标注样本时,CNN较为适用;若数据包含明确拓扑关系的多源信息,且需揭示特征间的潜在关联以辅助机制解释,GNN更具优势;当处理长时序数据(如患者多次随访的临床记录)或需捕捉多模态数据的长距离依赖(如病理报告文本与影像特征的关联),且有充足计算资源支撑时,Transformer及其变体可发挥作用;而对于多模态数据需深度融合,且追求综合各模态优势以提升预测精度,混合模型则更为合适。
5. 面向乳腺癌预后的多模态信息融合策略
在乳腺癌预后评估中,多模态信息融合策略能够整合多种数据中的互补信息,从而提高预测的准确性与可靠性,为临床决策提供更有力的支持。常用的特征融合技术包括拼接、协同训练、注意力机制和门控机制等。接下来将介绍前文提及的多模态特征融合方法(见表9)。
5.1. 基于拼接的特征融合
基于拼接的特征融合技术是指将来自不同模态或不同特征提取阶段的特征向量(或特征图)沿着预设维度(如通道、空间或样本维度)进行连接,形成一个包含所有输入特征信息的高维特征向量(或特征图)的融合方法。韩珺琪[24]将临床、病理和影像学特征筛选得到的独立预测因素以拼接的方式输入预测效能最高的深度学习模型(X线 + 超声深度学习模型)的全连接层,输出总预测值,从而建立综合模型。Palmal等[38]将GCN提取的基因表达特征、CNA特征与临床特征进行拼接,形成多模态融合的特征向量,并保留各模态的原始信息。Othman等[39]将自注意力模块输出的病理特征向量与分子特征、临床特征进行拼接,形成多模态融合特征向量。该向量输入全连接层,结合生存分析模型输出最终的DFS风险评分,同时预测患者生存概率与生存时间,两者乘积作为最终预测结果。
通过将不同模态特征沿预设维度连接形成高维特征,拼接融合技术既能整合多源信息以打破单一模态局限,又能保留各模态原始属性以挖掘关联,还能适配模型输入结构,为综合预测模型提供支撑,助力提升乳腺癌预后任务的效能。
5.2. 基于注意力机制的特征融合
注意力机制特征融合技术是目前较为常用的特征融合手段,它通过计算不同模态或不同特征的权重,突出对任务更重要的特征、弱化次要特征,从而实现有针对性的多源信息整合的融合方法。Palmal等[27]将图对比学习得到的各模态特征,通过跨模态注意力机制进行融合。在这个过程中,为每个模态的特征计算查询、键和值表示。Gao等[28]在构建好的二分图上,利用GNN层来聚合邻居信息。通过定义聚合函数,将来自邻居节点(基因或CNA)的信息传播到患者节点,以精炼患者的嵌入表示。以患者–基因二分图为例,聚合函数会综合考虑患者自身的嵌入信息以及与其相连基因的嵌入信息,通过可训练的权重矩阵和激活函数进行计算,得到更新后的患者嵌入。Mbaye等[34]将两种单模态模型的输出通过跨注意力模块进行融合:文本嵌入经线性层调整维度后,与结构化特征嵌入进行交互。在跨注意力机制中,文本嵌入作为查询,结构化特征嵌入作为键和值,通过计算注意力权重聚焦两类模态中对预后预测最关键的信息。
该方法通过计算并分配权重,聚焦多模态中对任务关键的信息,弱化次要信息,解决了不同模态特征重要性差异问题,实现了更具针对性的信息整合,提升多模态融合的有效性。
5.3. 融合技术对比及其适用场景
在乳腺癌预后评估中,基于拼接的特征融合技术将不同模态特征沿预设维度连接,操作相对简单直接,能快速整合多源信息,保留各模态原始属性,适配模型输入结构。从表中数据来看,该方法在模型性能方面有一定表现,如Palmal等[38]采用此方法的模型ACC值达到0.82。但该方法存在明显局限,当融合的特征维度过高时,可能出现维度灾难问题,且拼接过程只是简单合并,对各模态特征间深层次关联挖掘不足,模型性能表现存在提升空间。而注意力机制特征融合技术通过计算权重突出关键信息、弱化次要信息,可实现更具针对性的信息整合,能有效挖掘不同模态特征间的重要关联。从数据上看,采用该技术的模型在性能上普遍表现较好,像Gao等[28]研究中模型的ACC值为0.95,AUC值为0.98,表现出色;然而,其计算权重的过程增加了模型复杂度与计算量,且若权重计算不准确,可能导致重要信息被忽视。
在适用场景方面,基于拼接的特征融合技术适用于当各模态特征相对独立,且模型对特征原始结构有要求时,如韩珺琪[24]将临床、病理和影像学特征筛选结果拼接输入深度学习模型,因其简单直接的特点,能快速构建综合模型。注意力机制特征融合技术则适用于对特征重要性区分要求高,需要模型聚焦关键信息以提升预测准确性的场景,像Mbaye等[34]将文本与结构化特征通过跨注意力模块融合,精准聚焦对预后预测关键的信息,适用于乳腺癌预后评估这类对信息精准度要求高的任务。
Table 9. Multimodal feature fusion methods
表9. 多模态特征融合方法
融合方法 |
文献 |
数据类型 |
模型性能 |
预测结果 |
ACC |
AUC |
C-index |
拼接 |
韩珺琪[24] |
乳腺X线摄影、超声图、病理 |
— |
0.88 |
— |
生存状态 |
Palmal等[38] |
基因、CNA |
0.82 |
— |
— |
5年生存 |
自注意力 机制 + 拼接 |
Othman等[39] |
基因、CNA |
0.98 |
0.98 |
— |
5年生存 |
注意力机制 |
曹广硕等[25] |
EXPR、CNGM、SNV、CNA |
0.79 |
0.71 |
— |
4年生存 |
Palmal等[27] |
基因、WSIs、mRNA测序等 |
0.93 |
0.94 |
— |
长期/短期生存 |
Gao等[28] |
基因、CNV |
0.95 |
0.98 |
— |
生存 |
薛婧瑶[29] |
基因、CNV |
0.95 |
— |
— |
长期/短期生存 |
Mbaye等[34] |
文本报告、生物标志物 |
— |
0.77 |
— |
3年生存 |
Wu等[35] |
病理图像 |
— |
0.86 |
— |
5年生存 |
Boehm等[37] |
WSIs 病理报告 |
— |
0.89 |
— |
复发评分 复发风险分层 |
6. 总结与展望
深度学习模型凭借对数据内在模式的学习与理解,可精准预测乳腺癌患者的生存时间,为临床个性化治疗方案的制定提供关键参考。通过对前文的分析可知,尽管其在乳腺癌预后预测领域已取得显著进展,但在实际应用中仍面临诸多挑战。接下来将对这些挑战进行总结概况并提出未来的研究方向。
1) 样本数据不足与过拟合风险。乳腺癌预后预测依赖的多模态数据获取难,多数研究基于小样本,而深度学习模型对样本量依赖强,易因样本不足过拟合,影响泛化能力。虽预训练模型和迁移学习可提升性能,但未根本解决数据稀缺问题,未来可借数据模拟、生成对抗网络扩展数据集,以降低模型对数据量的依赖,提升小样本下的预测稳定性。
2) 多模态数据融合与异质性挑战。预后预测需整合多模态数据,但各模态特征空间等差异显著,易致融合时信息冲突或冗余。当前常用特征拼接等方式融合,却难充分捕捉模态间复杂关联。未来可设计自适应多模态融合机制,结合对比学习与动态权重分配增强异质数据兼容性,同时优化计算架构以降低处理成本。
3) 模型可解释性与临床转化障碍。深度学习模型决策过程难以向临床医生直观解释,导致实际诊疗中信任度不足。虽然部分研究通过GradCAM算法等增强透明度,但整体解释性仍弱于传统统计模型。未来可开发可解释性框架,结合知识图谱等技术,将预测逻辑与临床病理机制结合,提升医生理解与接受度,推动技术向临床转化。
4) 临床场景适配与实时更新需求。乳腺癌治疗具有动态性,而现有模型多为静态训练,难以实时整合新临床数据。现有技术如在线学习机制应用少,多数模型仍缺乏增量学习能力,导致历史成果难迁移且重复训练又增加成本。未来可设计增量学习框架,结合流式数据处理,使模型动态整合新信息,并且借助知识蒸馏保留历史知识,实现临床场景中模型的持续优化与实时预测,提升个性化治疗时效性。
通过对前文的分析与思考,在乳腺癌预后预测领域,可探索“基于动态疾病进展阶段的多模态模型自适应切换机制”与“小样本罕见乳腺癌亚型的预后模型迁移学习框架”两个方向:前者针对当前模型多适配固定数据类型或统一目标的局限,依托能感知患者疾病阶段(如早期、晚期、治疗后复发风险期)的判断模块,结合临床分期等元数据,在早期调用强化局部特征提取的CNN变体处理病理切片数据,在晚期切换至侧重多源关系挖掘的GNN与Transformer混合模型,实现不同阶段模型与数据特征的精准匹配,解决单一模型全病程适应性不足的问题;后者则针对罕见亚型(如炎性乳腺癌、三阴性乳腺癌)样本稀缺且数据分布特殊导致的预测性能不佳问题,以常见亚型预训练模型为基础,通过元学习设计“亚型特异性特征适配器”,结合多中心罕见病例的协作训练模式,在保护隐私的前提下扩充样本量,快速微调模型对独特分子标记和临床表型的识别权重,填补罕见亚型预后预测的研究空白。
随着人工智能技术的发展,其在癌症预后预测中的应用边界不断拓展,临床转化前景渐清。人工智能将凭借解析多源医疗数据的能力,逐渐从研究走向临床,通过构建精准预后模型,为癌症患者个体化治疗与疗效评估提供及时决策支持,推动肿瘤精准医疗更精细化、智能化。
基金项目
上海市虹口区卫健委临床重点扶持专科建设项目(HKLCFC202404)。
NOTES
*通讯作者。