多模态医学影像在肝细胞癌精准诊断与预后预测中的融合策略进展
Recent Advances in Multimodal Medical Imaging Fusion Strategies for Precision Diagnosis and Prognostic Prediction of Hepatocellular Carcinoma
DOI: 10.12677/acm.2025.15123694, PDF, HTML, XML,   
作者: 孙桂鹏*, 李绎畅*, 韩 旭, 路德昊#:青岛大学青岛医学院,山东 青岛;韩松霖:山东第一医科大学口腔医学院,山东 济南;孙浩哲:桂林医科大学临床医学院,广西 桂林
关键词: 肝细胞癌多模态影像影像组学深度学习预后预测Hepatocellular Carcinoma Multimodal Imaging Radiomics Deep Learning Prognosis Prediction
摘要: 肝细胞癌(HCC)是我国发病率与致死率均居高的重大恶性肿瘤,传统单模态影像在早期诊断与复发预测中受限于信息维度与主观差异。近年来,融合CT、MRI、CEUS及PET等多模态影像的智能分析策略,结合影像组学与深度学习技术,显著提升了病灶检出率、病理分型及术前风险分层的准确性。多模态模型通过在数据、特征与决策层实现信息互补,已广泛应用于微血管侵犯预测、免疫治疗反应评估及个体化预后管理。尽管在多中心异质性、隐私保护与可解释性等方面仍存挑战,基于联邦学习和自监督预训练的多模态框架,正为构建可落地的HCC智能决策支持体系奠定基础。未来,规范化数据采集、临床验证及与指南流程的深度融合,将是多模态影像实现临床转化的关键路径。
Abstract: Hepatocellular carcinoma (HCC) is a major malignant tumor with high incidence and mortality rates in China. Traditional single-modality imaging is limited by information dimensions and subjective variations in early diagnosis and recurrence prediction. In recent years, intelligent analysis strategies integrating multi-modality imaging such as CT, MRI, CEUS, and PET, combined with radiomics and deep learning technologies, have significantly improved lesion detection rates, pathological classification accuracy, and preoperative risk stratification. Multimodal models, achieving complementary information across data, feature, and decision layers, have been widely applied in predicting microvascular invasion, evaluating immunotherapy response, and personalized prognosis management. Despite ongoing challenges in multicenter heterogeneity, privacy protection, and interpretability, multimodal frameworks based on federated learning and self-supervised pretraining are laying the foundation for establishing a practical intelligent decision support system for HCC. Moving forward, standardized data collection, clinical validation, and deep integration with guideline workflows will be critical pathways for translating multimodal imaging into clinical practice.
文章引用:孙桂鹏, 李绎畅, 韩松霖, 韩旭, 孙浩哲, 路德昊. 多模态医学影像在肝细胞癌精准诊断与预后预测中的融合策略进展[J]. 临床医学进展, 2025, 15(12): 2601-2611. https://doi.org/10.12677/acm.2025.15123694

1. 引言

肝细胞癌(hepatocellular carcinoma,HCC)是全球范围内发病率和病死率均居前列的恶性肿瘤之一,在东亚及我国尤为高发,主要与乙型/丙型病毒性肝炎、酒精性肝病及代谢相关脂肪性肝病负担持续上升密切相关。最新流行病学数据显示,原发性肝癌在全球新发癌症及癌症相关死亡中占据重要比例,未来二十年其发病和死亡人数仍呈上升趋势,对公共卫生与医疗资源构成长期压力。我国多学科协作诊疗模式及更新版原发性肝癌诊疗规范的实施,虽在一定程度上改善了诊疗依从性及长期生存,但“早诊率不足、复发率较高、精准分层有限”等核心问题依然突出[1]

目前临床实践仍主要依赖增强CT、MRI、超声等单模态影像结合影像科医师经验性判读完成病灶检出、良恶性鉴别及分期评估。此种“单模态 + 主观阅片”范式在多灶病变、亚厘米级小病灶、弥漫浸润型病变及高度异质性肿瘤中表现出明显局限:一方面,细微灌注差异与功能学改变易被忽略,导致早期或非典型HCC漏诊、误诊;另一方面,对微血管侵犯、分子分型、免疫微环境等关键生物学特征多依赖侵袭性活检,难以通过常规影像实现稳定、可重复的风险评估。此外,不同中心间检查设备、扫描协议及阅片经验差异,也限制了现有影像评估在疗效预测和复发监测中的一致性和可推广性[2]

随着影像组学(radiomics)与放射基因组学(radiogenomics)技术的发展,以及卷积神经网络、Transformer等深度学习模型在医学影像中的广泛应用,HCC的影像诊疗正逐步从经验驱动走向数据驱动与模式识别[3]。多模态影像(包括多期增强CT、多序列/功能MRI、造影超声及PET/CT或PET/MRI等)分别从解剖结构、血流动力学、细胞弥散、组织灌注及代谢分子层面刻画肿瘤表型,为重构肿瘤异质性提供了天然互补的信息基础[4]。基于此,多模态融合策略——在数据层、特征层或决策层整合不同影像模态及临床、生化乃至分子指标——有望提升HCC病灶检出率与诊断准确性,强化术前风险分层和复发预测能力,并为个体化治疗路径选择提供更加客观、可量化的决策支持[5] [6]

已有研究与综述从影像组学、放射基因组学及人工智能应用角度,对HCC的精准诊疗进展进行了初步梳理,为多模态融合研究提供了重要理论与方法学基础。然而,针对“多模态医学影像在HCC精准诊断与预后预测中的系统化融合策略”的专门总结仍相对有限,尚缺乏从技术路径、模型性能、临床证据与转化障碍等多维度的综合评估[7]。鉴此,本文拟聚焦近五年相关研究,围绕多模态影像特征提取与融合方法、在HCC早期诊断、病理分型、预后评估及疗效预测中的应用进展,以及多中心标准化、隐私保护与可解释人工智能等关键问题进行系统综述,旨在为构建可临床落地的HCC多模态智能决策支持体系提供循证依据与发展思路。

2. 多模态医学影像的特点与临床作用

2.1. 不同影像模态在HCC诊疗中的角色

2.1.1. 增强CT

多期增强CT是目前HCC影像诊断与分期评估的核心工具之一,可通过动脉期强化与门脉期/延迟期“快进快出”模式提示典型HCC血供特征,并用于评估肿瘤数目、大小及血管受侵情况,是多项国际指南推荐的首选影像手段[8]。然而CT主要反映解剖与灌注信息,对部分非典型、小体积或弥漫浸润型病灶敏感性有限,且无法直接表征细胞密度、弥散及分子水平改变,这为后续与MRI、CEUS及PET等模态在多模态框架中的互补融合预留了空间[9]

2.1.2. MRI及功能成像

MRI具有优越的软组织分辨率,可通过T1/T2加权像、DWI、DCE-MRI及肝特异性对比剂(如Gd-EOB-DTPA)综合评估肿瘤血供、细胞密度、胆道排泄与肝实质储备功能,在小肝癌、早期病灶及复杂背景肝(如结节样再生、再生结节)中的检出与定性方面优于CT [10]。功能序列与肝特异性对比剂为定量影像组学与放射基因组学分析提供高维特征来源,适于与CT、CEUS及临床、生物标志物等信息在特征层或决策层进行深度融合,用于反映肿瘤异质性和分子分型,为多模态智能模型提供关键支撑[11]

2.1.3. 超声与造影超声(CEUS)

常规超声因其无创、低成本和可重复性,被广泛用于高危人群HCC筛查和随访。然而B超对小病灶、深部或脂肪肝背景病灶的敏感性受限。CEUS通过实时动态观察对比剂灌注过程,可更精细地显示肿瘤血流动力学特征,并在部分指南和共识中被纳入可选诊断工具,用于补充CT/MRI结果或在禁忌情况下替代评估[12]

近年来,多模态超声(弹性成像、定量血流、CEUS)及基于深度学习的自动检测算法被用于提高筛查灵敏度和结节表征精度,使超声成为多模态体系中重要的“前端筛查与动态监测”信息源,可与CT/MRI在纵向随访及疗效评估中形成互补。

2.1.4. PET-CT与PET-MRI

PET-CT及PET-MRI通过^18F-FDG或氟胆碱等示踪剂提供代谢和功能层面的信息,在评估肿瘤分期、远处转移及复发方面具有价值,尤其对分化差、代谢活跃或传统影像表现不典型的病灶具有补充意义[13]

然而,PET在常规初诊和普遍筛查中的应用受到成本、可及性及部分HCC对^18F-FDG摄取不敏感等因素限制,更适合作为高危人群精细分层、复杂病例鉴别诊断及疗效评估的“高级模态”。在多模态融合框架中,PET所提供的代谢与分子信号可与CT/MRI结构特征及临床指标联合,提高对侵袭性表型和不良预后的识别能力。

2.2. 多模态影像的互补性及融合逻辑

不同影像模态从各自维度刻画HCC的形态与功能特征:多期增强CT与常规MRI提供宏观解剖与血供信息;DWI、DCE-MRI及肝特异性对比剂揭示细胞密度、灌注及肝功能储备;CEUS与多模态超声实现实时、动态的血流和弹性监测;PET-CT/PET-MRI则反映糖代谢、脂质代谢及肿瘤分子通路活动[5]

当这些异质但互补的信号与临床变量(如AFP、肝功能评分、病毒学状态)及病理/分子数据相结合时,可构建从解剖结构、血流动力学、细胞与分子水平到临床结局的多尺度表型图谱。然而,在真实世界环境下,单一中心、单一模态检查往往难以充分覆盖HCC高度异质性的生物学谱系:不同病因背景(HBV、HCV、代谢相关脂肪性肝病)、不同分化程度和免疫微环境状态常表现为重叠或部分非典型的影像表现,单模态定性和主观阅片易在边界型病灶、小体积结节以及疗效与复发评估中出现不稳定和不一致[7]

这一现实驱动了“多模态影像 + 定量影像组学 + 深度学习”策略的出现:通过在数据层实现多期/多序列协同输入,在特征层提取并融合不同模态的高维表型特征,在决策层联合临床、生物标志物及随访信息构建综合预测模型,从而实现对HCC诊断、风险分层和预后评估的系统化、可量化与可重复描述。

在这一框架下,多模态影像不再仅是“并列呈现”的信息叠加,而是构成可计算的、跨尺度的“肿瘤数字表型”。既往关于HCC radiomics/radiogenomics的研究已证实,整合多模态CT/MRI特征与临床/分子信息有助于提升对微血管侵犯、分子亚型及复发风险的预测性能,为后续构建多模态融合算法及智能决策支持系统提供了明确的方法学基础[14]。这也为本文在后续章节系统评估多模态融合策略在HCC精准诊断与预后预测中的应用价值奠定了逻辑起点。

3. 多模态影像融合的技术路径

3.1. 融合层级框架

多模态影像融合的核心目标在于充分整合不同模态(CT、MRI、CEUS、PET等)所蕴含的互补信息,以最大化肿瘤表型信息量与模型决策能力。依据信息整合的深度与处理阶段,当前研究普遍将多模态融合划分为数据层、特征层和决策层三种典型策略[15]

(1) 数据层融合(Data-level Fusion)

数据层融合是最直接的融合方式,主要在影像输入阶段对多模态数据进行空间配准与强度归一化处理,使其在同一解剖坐标系下实现像素级或体素级的对齐。典型方法包括刚性或非刚性配准、插值重采样以及多期增强CT或多序列MRI拼接输入。该策略可直接将不同模态的灰度与纹理特征作为联合输入进入深度网络,从源数据层面实现“早期融合”,适用于CT多期图像(动脉期、门脉期、延迟期)或MRI多序列(T1WI、T2WI、DWI、DCE)等结构相似的模态组合[16]。然而,其对配准精度与噪声敏感度较高,一旦存在扫描参数差异或患者体位偏差,易造成信息混叠和误导性特征学习。

(2) 特征层融合(Feature-level Fusion)

特征层融合是当前HCC多模态研究中最具活力的方向。该策略先在各模态独立提取影像组学或深度特征,再通过拼接、加权或注意力机制实现高层表征整合。传统放射组学多采用特征拼接、主成分分析或典型相关分析(CCA)降低冗余维度;而深度学习模型中,常见做法是设置多分支卷积网络分别处理不同模态特征,并利用注意力加权、通道选择或跨模态Transformer (cross-attention Transformer)进行特征交互[16]。近年来,图神经网络(GNN)与多模态Transformer在跨模态特征对齐与语义映射中的应用,进一步提升了模型在异构模态间的表征一致性与非线性关联捕获能力。特征层融合能够在兼顾模态独立性的同时实现深度语义交互,已成为当前HCC多模态智能分析的主流路径。

(3) 决策层融合(Decision-level Fusion)

决策层融合多用于多中心或模态缺失情况下,通过对各模态独立模型的预测结果进行整合以获得最终诊断结论。其典型形式包括加权平均、投票机制、堆叠(stacking)或贝叶斯概率融合等。此类“后期融合”不依赖精确配准,可灵活处理部分模态缺失或不同中心影像协议差异的问题,特别适合真实临床环境中的异质性数据集[17]。该策略在多模态HCC预后预测和多中心风险建模中表现出较好的可推广性,但信息交互较弱,难以完全捕获模态间深层语义关联。

3.2. 模型类型与融合策略进展

当前多模态影像融合模型总体呈现“从卷积表征到跨模态注意”的演进趋势。早期研究多基于卷积神经网络(CNN),采用多分支结构分别输入CT、MRI或CEUS等影像序列,并在中间层通过特征拼接或全连接层整合输出;随后,融合Transformer架构的模型引入跨模态注意力(cross-attention)机制,使模型能够在不同模态间动态分配权重、学习潜在语义对齐关系。此类模型在识别小病灶、复杂边界及非典型强化模式方面较传统CNN显著提升[18]

此外,将影像特征与临床、生化及分子数据协同建模的“影像–临床联合模型”成为HCC精准诊断的新趋势。研究表明,将深度影像特征与AFP、Child-Pugh评分或分子突变状态联合输入的多模态网络,可在术前复发风险预测与生存分析中显著优于单一影像或临床模型[19]。例如,三维多模态融合网络在预测术后复发时,通过引入时间维度和动态增强特征,实现了对肿瘤侵袭性和血供模式的综合刻画,为“DLR (Deep Learning Radiomics) + 列线图”的个体化风险评估提供可行方案。

4. 多模态影像在HCC精准诊断中的应用

4.1. 病灶检测与分级诊断

在病灶检出与初步分级阶段,多模态影像联合智能分析的核心价值在于:提高小病灶和非典型病灶的可见性,降低阅片者间差异,并实现与标准化分级体系的对接。多期增强CT联合MRI多序列信息,已被用于训练多输入卷积网络与nnU-Net等分割框架,以实现肝脏、门静脉系统及肿瘤区域的自动勾画和体积定量,部分研究在Dice系数和病灶检出敏感度方面已接近甚至优于经验丰富放射科医师,尤其在亚厘米级病灶与复杂背景肝中表现出更高稳定性[20]。这一类模型通过整合多期灌注信息与形态特征,将传统“主观目测”转化为可重复的定量评估,为后续分级、分期与疗效监测提供可靠基础。

在分级与定性诊断方面,多模态AI模型正逐步与肝脏影像报告和数据系统(Liver Imaging Reporting and Data System, LI-RADS)深度融合。一方面,通过自动分割与特征抽取,模型可识别动脉期强化、门/延迟期洗脱、肿瘤栓塞、包膜征等关键征象,并据此生成结构化报告;另一方面,基于深度学习或放射组学的LI-RADS自动或半自动分级系统已在多中心数据上显示出对LR-3至LR-5病灶分类准确度的显著提升,可有效减少不同阅片者间的一致性差异[21]。此类工作标志着从“描述性叙述”向“可计算规则 + 数据驱动评分”的过渡,为多模态融合模型与临床决策路径的无缝衔接提供了技术抓手。总体而言,多模态分割与LI-RADS智能分级使HCC的初始识别和风险分层趋向客观化、标准化,是精准诊断链条中的前端关键环节。

4.2. 鉴别诊断与分型预测

HCC与局灶结节性增生(FNH)、肝内胆管癌(ICC)及转移瘤等疾病在常规影像上存在表现重叠,仅依赖单模态与经验判读时易出现误诊或延误治疗。多模态radiomics与深度学习模型通过联合多期CT、功能MRI、CEUS乃至PET特征,能够从纹理、形态、灌注与弥散等多维度提取高阶特征,实现对不同病变亚型的量化表征。多项研究显示,多模态特征融合模型在区分HCC与ICC/HCC变异亚型方面的AUC明显优于单模态模型,提示跨模态整合能够更敏感地捕捉组织学差异和血供重构模式[22]

在生物学行为分层方面,多模态影像组学已被广泛用于术前预测微血管侵犯(microvascular invasion, MVI)、肿瘤分化程度及侵袭性表型。基于多期CT或多参数MRI构建的融合模型,通过综合强化曲线形态、边缘不规则度、肿瘤–门静脉关系及周围肝组织信号改变等特征,可较好地区分MVI阳性与阴性患者,其预测性能在多项研究和荟萃分析中达到临床可用水平;部分工作进一步引入超声及临床变量形成多模态列线图,提高了外部验证队列中的稳健性[23]。这些模型为术式选择(解剖性切除vs非解剖切除)、切缘设计以及辅助/新辅助治疗决策提供了重要参考,使多模态融合从“诊断工具”延伸为“治疗决策中枢”的一部分。

4.3. 影像–基因组学(Radiogenomics)在非侵袭性分子分型中的探索

Radiogenomics通过关联影像特征与基因组、转录组及免疫微环境信息,旨在构建由多模态影像驱动的“非侵袭性分子表型”。在HCC领域,已有研究利用多期增强CT或多参数MRI的radiomics特征,预测TP53、CTNNB1等驱动基因突变状态、分子亚型或肿瘤微环境特征,并将其与总生存(OS)、无复发生存(RFS)等终点相关联,构建综合预后模型。新近研究亦尝试将超声radiomics与基因状态(如TP53突变)相结合,提示即便是易获取的模态,在多模态框架与机器学习支持下同样具备分子层面指示意义[24]

多模态radiogenomics的优势在于,其不再局限于单一影像模态或孤立分子指标,而是通过CT/MRI/超声乃至PET信号与多组学数据的联合建模,刻画肿瘤生物学特征的跨尺度连续谱,从而为免疫治疗、靶向治疗及联合方案提供患者级精细分层依据。当前相关研究仍受限于样本量有限、测序平台与影像采集方案异质性、多中心标准化不足等问题,但已有证据显示,多模态影像组学–基因组模型在预后预测和免疫微环境评估中优于传统临床评分,具备发展为“影像活检(imaging biopsy)”工具的潜力[25]。随着前瞻性队列和多中心协作的推进,多模态radiogenomics有望成为连接宏观影像表型与微观分子机制的关键枢纽,为真正意义上的个体化治疗策略提供可量化的决策基础。

5. 多模态影像在预后评估与疗效预测中的研究进展

5.1. 术前风险分层与复发预测

术前基于多模态影像的风险分层与复发预测,是多模态融合技术从“诊断工具”走向“预后决策中枢”的关键入口。近年多项研究利用多期增强CT、复合MRI序列联合临床指标(如AFP、肿瘤数量与直径、Child-Pugh分级等),构建列线图或深度学习/影像组学模型,用于预测术后早期复发、远处转移及长期生存。三维多模态模型通过整合CT多期与MRI多参数特征,相较单模态Radiomics或传统BCLC、TNM分期,显示出更高的一致性指数(C-index)与时间依赖ROC曲线下面积,部分研究在多中心外部验证队列中证实其对早期复发的预测性能具有稳定可迁移性[26]

同时,深度学习与Radiomics的结合推动了由“手工特征 + 逻辑回归”向“深度表征 + 多变量集成”的演进。基于动态增强MRI、DCE-MRI及肝特异性对比剂序列的模型可自动完成肿瘤分割与高维特征提取,并与AFP、纤维化程度等变量共同纳入列线图,构建个体化复发风险评分工具,在区分高危复发人群方面优于单一影像或临床模型[27]。新近工作进一步引入“radiopathomics”等多模态范式,将影像特征与病理数字切片特征联合建模,用于整体生存预测与血管包裹型肿瘤簇等侵袭行为评估,显示出多模态深度模型在反映肿瘤生物学本质方面的优势。总体来看,多模态影像组学联合临床变量构建的复发风险模型,在多中心研究中已表现出优于传统评分体系的一致性和区分度,为术式选择及围手术期管理提供了更精细的量化依据。

5.2. 局部治疗与系统治疗疗效预测

在局部与全身治疗场景中,多模态影像融合逐渐被用于构建“疗效预测与反应评估”的非侵袭性生物标志物体系。对于TACE人群,多期增强CT/多参数MRI Radiomics模型可在治疗前预测客观缓解、坏死程度及TACE不应答风险,一些研究通过多器官或多ROI特征(包括肿瘤、本征肝实质及脾脏等)提高模型稳健性,并显示综合模型显著优于单一影像或mRECIST评估,适合用于筛选获益人群及优化初始治疗策略。对于RFA、消融及放疗,基于MRI/CT多模态特征的预测模型可在治疗前识别高复发风险患者,指导是否联合TACE、系统治疗或扩大安全边界,从而推动从“统一方案”向“风险驱动型个体化局部治疗”的转变[19]

在系统治疗与免疫治疗领域,多模态radio-immunomics逐渐成为研究热点。以多期CT或多参数MRI Radiomics联合临床与免疫学指标构建的模型,已被用于预测免疫检查点抑制剂(ICIs)及其联合方案的疗效和生存结局,部分研究报道其在区分获益与非获益人群方面优于单纯临床因素或传统炎症评分[28]。同时,基于多时相影像变化(如治疗前后强化模式、肿瘤纹理及边界重构)的纵向Radiomics特征被引入疗效早期评估,用于识别“影像学稳定但生物学进展”人群,为早期调整治疗方案提供量化依据。这一系列证据表明,多模态影像已从单纯记录肿瘤大小变化,转向刻画免疫应答、微环境重塑及药物敏感性的综合指标,是构建“治疗反应预测–动态监测–策略优化”闭环的重要基础。

5.3. 动态随访与个体化决策支持

预后与疗效评估本质上是时间维度上的连续过程,单一时间点的基线影像难以充分反映HCC在治疗过程中的演化轨迹。多模态融合在动态随访场景中的前沿方向,主要体现在引入时间序列建模与纵向多模态数据整合:一方面,将随访过程中重复获得的CT/MRI/超声影像序列,与AFP动态变化、肝功能波动及用药信息共同输入循环神经网络、时序Transformer或生存分析模型,可实现对复发风险和生存概率的动态更新预测;另一方面,通过纵向Radiomics特征捕捉疗程中血供、纹理和形态的细微改变,有望早于传统影像标准提示治疗失败或复发信号,从而支持更为主动的干预策略[18] [29]

在此基础上,多模态决策支持平台的构想逐渐清晰:将多期CT、多参数MRI、CEUS及必要时PET信息与实验室检查、病理及多组学数据在统一框架下建模,形成可视化的个体化风险曲线与治疗反应曲线,为临床提供“何时复查、是否调整方案、是否升级或联合治疗”等具体决策建议。当前相关研究仍多停留在回顾性与单中心或有限多中心验证层面,模型泛化性、数据标准化与工作流程集成尚需进一步验证,但趋势已十分明确——多模态、动态化与智能化将成为HCC长期管理的重要技术方向,为实现真正意义上的精准随访与个体化治疗提供实现路径。

6. 临床实施的现实障碍与可行路径

6.1. 多模态数据标准化与跨系统信息整合的瓶颈

多模态影像在临床落地首先面临来自数据标准与医院信息架构的深层限制。尽管DICOM为影像数据提供了基础规范,但不同厂商、不同版本与不同检查协议之间的差异依然导致序列标签、元数据结构与图像参数的不一致,使深度模型难以在真实医院环境中稳定调用。与此同时,新兴的FHIR标准虽在结构化病历、化验结果及病理信息管理中表现出较好的扩展性,但在多序列、多时相、多模态影像场景下仍缺乏原生支持,使得构建跨系统的统一数据流面临结构复杂性。RIS、PACS与EMR在大多数医院仍以半隔离状态运行,信息无法在这些系统间自然流通,导致模型输入端的数据无法自动与临床路径对齐。多模态系统的实施因此需要在数据标准、接口规范及元数据管理等方面形成系统化解决方案,以确保模型能够在真实环境中持续接收高质量、结构一致的输入[30]

6.2. AI模型与医院核心工作流的集成障碍

多模态模型要想真正服务临床,不仅依赖算法性能,更依赖于其是否能够无缝嵌入实际工作流程。在绝大多数医院,临床影像的获取、浏览与结构化报告均围绕PACS系统展开,而当前大部分AI模型仍以独立程序、外部平台或云端部署的形式存在,使得其输出无法自然融入医生的既定操作界面。如果模型不能在PACS内部自动触发、自动加载多时相序列并将分析结果直接呈现于阅片界面,则很难真正实现流程级的价值提升。此外,多模态模型在临床使用中往往牵涉影像、病理、实验室结果与治疗信息的跨部门协同,而不同科室的系统接口规范并不统一,使得整合后的信息难以以结构化方式呈现,这不仅影响效率,也削弱了模型在多学科团队讨论中的可调用性。因此,未来的技术路径应以“嵌入式AI”为核心,使模型在现有工作流中自然运行,从数据接入、自动配准到证据可视化输出均保持流程级一致性,实现与RIS/PACS/EMR的深度适配[31]

6.3. 监管合规、模型可审查性与安全性的现实要求

在监管层面,多模态模型的临床应用通常被归类为计算机辅助诊断(CADx)或计算机辅助检测(CADe)系统,需要满足药监部门对于安全性、性能稳定性、模型更新可追溯性以及可解释性的严格要求。单中心回顾性研究的结果远不足以支持正式临床注册批准流程。监管机构通常要求模型在多中心、跨设备和跨人群的真实世界环境中进行性能验证,以确保其在不同应用场景下保持一致性。同时,随着监管理念从“黑箱容忍”转向“透明可信”,模型必须提供能够被医生理解和复核的证据链,使其决策过程可解释、可追踪并与临床征象建立对应关系。模型的版本管理、软件更新机制、风险报警逻辑以及人工介入边界也需要在监管框架中获得明确定义。因此,未来的多模态模型必须在算法开发早期即考虑可解释性设计、模型生命周期管理与软件工程规范,以确保满足不断提升的临床AI监管标准[31]

6.4. 放射科医生——AI协同模式下的实践挑战与能力再训练

多模态AI系统的引入不仅意味着技术的升级,也意味着工作方式与专业角色的变化。尽管AI可在长期减少重复性判读负担,但在部署初期,放射科医师往往需要投入更多时间来核对模型生成的证据、理解不同模态间的特征权重分布,并逐渐熟悉AI在报告生成与多学科讨论中的实际作用。这种“学习曲线效应”使得AI工具在短期内可能增加认知负担,尤其是当模型输出方式与传统阅片方式存在显著差异时。因此,临床实施必须伴随系统性的培训机制,使医师能够理解AI模型的适用条件、潜在偏差与误差来源,并在必要时对模型结果进行人为校正。随着使用经验的积累,AI工具将从辅助角色逐步转变为临床决策的协同伙伴,既可帮助初级医师提升阅片能力,又可在复杂或低可见度病例中提供第二诊断视角。在这一过程中,医生的角色将从“图像观察者”向“证据整合者”转型,使人机协作真正成为临床价值的关键来源[21]

7. 挑战与未来展望

7.1. 多模态影像融合的关键技术瓶颈

多模态影像融合在肝细胞癌诊疗中的应用虽然取得了显著进展,但在真实临床环境中,其稳定性和可扩展性仍受到多重因素制约。不同中心在扫描设备类型、重建算法、对比剂方案以及随访节律等方面的差异,使得影像信号的基线分布存在显著不一致性,进而影响深度特征和影像组学特征的跨中心重现性。即便在同一模态内部,不同厂商与不同参数条件下的扫描也可能产生系统性偏移,使模型在移植到外部数据集时出现性能下降的现象。此外,真实世界中影像检查往往随临床路径而变化,患者影像数据呈现出高度不齐全的状态。许多患者仅接受CT或MRI检查,而高级功能序列如DCE-MRI、EOB-MRI或PET成像并非标准化获得,这使得多模态模型无法稳定依赖完整输入,从而导致推理阶段的不确定性增加[28]

与此同时,多模态网络需要在结构、功能与代谢等不同维度之间建立统一表征,而CT、MRI、CEUS与PET之间的语义落差决定了跨模态信息融合并非简单的拼接或堆叠。这些模态之间缺乏天然一致的空间与语义锚点,使得深度模型在学习跨模态表征时面临显著困难,特别是在复杂边界结节、非典型强化模式或低对比度肝实质背景下往往表现出不稳定性。此外,高维融合模型的复杂性也带来了新的问题,即其决策路径难以被临床医师完全理解。虽然部分方法通过注意力可视化、显著性图或基于特征贡献度的解释策略来增强透明度,但现有解释方式多数停留在“图像热点”层面,尚不足以提供可用于临床复核的结构化证据链,因此难以满足重大临床决策场景中对于可审查性的要求[30]

7.2. HCC背景肝病复杂性对多模态融合的特异挑战

肝细胞癌几乎总是发生于病变肝脏之上,而不同病因背景导致的肝实质损伤模式差异,使得多模态模型在特征学习过程中面临比其他实体肿瘤更为复杂的干扰因素。病毒性肝炎相关肝硬化、代谢相关脂肪性肝病、酒精性肝病等多种背景肝状态,不仅影响肝实质在CT与MRI上的灌注模式和弥散特征,也会改变肝细胞对比剂摄取、肝内血流动力学与组织信号分布,导致早期肝癌与背景结节之间的影像表现出现重叠。再生结节、高级别异型结节及早期HCC形成连续光谱,其动脉期轻度强化、边缘模糊或弥散受限均可呈现近似模式,使得模型难以单纯依赖局部影像信号来判别良恶性。更复杂的是,不同病因背景并不会呈现统一的影像特征。例如HBV患者常同时存在富血供的再生结节,HCV患者部分结节表现偏向ICC样强化,而NASH患者弥漫脂肪变性造成的基线信号偏移又可能掩盖肿瘤的真实特征。如果模型没有建立独立的“背景肝表型”识别机制,就容易被背景噪声或伪强化模式误导,从而影响对早期病灶、低级别恶变结节及边界型结节的识别能力[32]

因此,未来的多模态模型应在架构上将肝实质与肿瘤特征的学习过程明确分离,通过构建独立的肝实质功能、弥散与灌注表征子空间,使模型能够捕捉背景肝损伤的模式,并在决策层通过差异映射的方式凸显真正来源于肿瘤的异常信号。此外,背景肝病因的差异在深度表征空间中常导致“跨人群偏移”,因此在模型设计时需要引入病因敏感的学习策略,使网络能够根据HBV/HCV/NASH等状态调整注意力分布或优化特征对齐,从而增强对不同背景下早期、非典型及侵袭性表型的可靠识别[33]

7.3. 面向临床落地的未来发展方向

要让多模态技术真正进入肝癌诊疗主流路径,未来发展必须从“提升模型性能”迈向“增强临床可迁移性”。在模型结构上,未来系统需要具备对模态缺失的弹性适应能力,使其能够在不同检查组合下保持一致输出,并利用模态补全、自适应注意力或可插拔组件实现从最小信息集到完整多模态输入的平滑过渡。在数据治理方面,大规模、前瞻性、多中心的数据协作将是提高泛化性的关键,通过标准化影像协议、跨模态强度和谐化以及特征校准机制,使模型在跨设备、跨病人群与跨病因背景下保持稳定表现。此外,模型输出亟需从现有的概率分数和热点图升级为包含强化动力学、弥散指标、EOB摄取率等可复核参数的结构化证据,使AI决策能够被纳入多学科讨论体系并用于术前规划、治疗选择和预后管理。未来的多模态系统也需要纳入时间维度,通过整合随访影像与实验室指标,构建动态风险曲线,从而支持对复发、治疗反应与长期预后的连续预测。更长远来看,随着多模态基础模型的发展,影像、病理与分子信息将逐步融为统一表征,使构建“患者级数字孪生”成为可能。通过实时模拟不同治疗策略下的生物学演变趋势,数字孪生有望成为未来HCC智能医学的决策核心[34]

8. 结语

多模态医学影像融合在肝细胞癌中的应用已基本完成从概念提出到初步模型验证的过渡,相关研究在早期筛查、病灶定性与分型、术前风险分层、预后评估及局部与系统治疗疗效监测等关键环节,整体呈现出较单模态策略更高的判别效能与更丰富的生物学指示信息,显示出作为精准诊疗基础工具的现实潜力。然而,要推动多模态智能系统真正服务临床决策,还需在多中心规范化数据采集与质量控制、特征与模型的跨平台重现性验证、面向真实世界场景的模态缺失与人群异质性鲁棒建模、联邦学习与隐私计算框架下的合规协作,以及与现行指南、LI-RADS体系和多学科诊疗流程的深度对接等方面形成系统性进展,以在循证基础上完成由“技术可行”向“临床可靠与可推广”的过渡。

NOTES

*共一作者。

#通讯作者。

参考文献

[1] Teng, X., Luo, Q., Chen, Y. and Peng, T. (2025) From Texture Analysis to Artificial Intelligence: Global Research Landscape and Evolutionary Trajectory of Radiomics in Hepatocellular Carcinoma. Discover Oncology, 16, Article No. 1694. [Google Scholar] [CrossRef
[2] Afyouni, S., Zandieh, G., Nia, I.Y., Pawlik, T.M. and Kamel, I.R. (2024) State-of-the-Art Imaging of Hepatocellular Carcinoma. Journal of Gastrointestinal Surgery, 28, 1717-1725. [Google Scholar] [CrossRef] [PubMed]
[3] Jiang, H., Wei, H., Liang, L., Wang, Y., Kuang, M., Ronot, M., et al. (2025) The Evolving Role of Imaging in Hepatocellular Carcinoma: From Pathomolecular Profiling to Prognostic Decision-Making. Liver Cancer, 1-26. [Google Scholar] [CrossRef
[4] Ren, L., Chen, D.B., Yan, X., She, S., Yang, Y., Zhang, X., et al. (2024) Bridging the Gap between Imaging and Molecular Characterization: Current Understanding of Radiomics and Radiogenomics in Hepatocellular Carcinoma. Journal of Hepatocellular Carcinoma, 11, 2359-2372. [Google Scholar] [CrossRef] [PubMed]
[5] Fu, J., Cao, S., Song, L., Tong, X., Wang, J., Yang, M., et al. (2022) Radiomics/Radiogenomics in Hepatocellular Carcinoma: Applications and Challenges in Interventional Management. iLIVER, 1, 96-100. [Google Scholar] [CrossRef] [PubMed]
[6] Amin, N., Anwar, J., Sulaiman, A., Naumova, N.N. and Anwar, N. (2025) Hepatocellular Carcinoma: A Comprehensive Review. Diseases, 13, Article 207. [Google Scholar] [CrossRef] [PubMed]
[7] Ma, Y., Gong, Y., Qiu, Q., Ma, C. and Yu, S. (2024) Research on Multi-Model Imaging Machine Learning for Distinguishing Early Hepatocellular Carcinoma. BMC Cancer, 24, Article No. 363. [Google Scholar] [CrossRef] [PubMed]
[8] Kazi, I.A., Jahagirdar, V., Kabir, B.W., Syed, A.K., Kabir, A.W. and Perisetti, A. (2024) Role of Imaging in Screening for Hepatocellular Carcinoma. Cancers, 16, Article 3400. [Google Scholar] [CrossRef] [PubMed]
[9] Okada, M., Aoki, R., Nakazawa, Y., Tago, K. and Numata, K. (2024) CT and MR Imaging of Hepatocellular Carcinoma and Liver Cirrhosis. Gastroenterology Insights, 15, 976-997. [Google Scholar] [CrossRef
[10] Alshomrani, F. (2025) Recent Advances in Magnetic Resonance Imaging for the Diagnosis of Liver Cancer: A Comprehensive Review. Diagnostics, 15, Article 2016. [Google Scholar] [CrossRef
[11] Wang, Q., Sheng, Y., Jiang, Z., Liu, H., Lu, H. and Xing, W. (2023) What Imaging Modality Is More Effective in Predicting Early Recurrence of Hepatocellular Carcinoma after Hepatectomy Using Radiomics Analysis: CT or MRI or Both? Diagnostics, 13, Article 2012. [Google Scholar] [CrossRef] [PubMed]
[12] Granata, V., Fusco, R., Setola, S.V., Simonetti, I., Cozzi, D., Grazzini, G., et al. (2022) An Update on Radiomics Techniques in Primary Liver Cancers. Infectious Agents and Cancer, 17, Article No. 6. [Google Scholar] [CrossRef] [PubMed]
[13] Jiang, C., Zhao, L., Xin, B., Ma, G., Wang, X. and Song, S. (2022) 18F-FDG PET/CT Radiomic Analysis for Classifying and Predicting Microvascular Invasion in Hepatocellular Carcinoma and Intrahepatic Cholangiocarcinoma. Quantitative Imaging in Medicine and Surgery, 12, 4135-4150. [Google Scholar] [CrossRef] [PubMed]
[14] Liu, Q., Zhu, W., Song, F., Lou, T., He, L., Zhou, W., et al. (2024) Radio-Immunomics in Hepatocellular Carcinoma: Unraveling the Tumor Immune Microenvironment. Meta-Radiology, 2, Article 100098. [Google Scholar] [CrossRef
[15] Wu, C., Chen, Q., Wang, H., Guan, Y., Mian, Z., Huang, C., et al. (2024) A Review of Deep Learning Approaches for Multimodal Image Segmentation of Liver Cancer. Journal of Applied Clinical Medical Physics, 25, e14540. [Google Scholar] [CrossRef] [PubMed]
[16] Siam, A., Alsaify, A.R., Mohammad, B., Biswas, M.R., Ali, H. and Shah, Z. (2023) Multimodal Deep Learning for Liver Cancer Applications: A Scoping Review. Frontiers in Artificial Intelligence, 6, Article ID: 1247195. [Google Scholar] [CrossRef] [PubMed]
[17] Sun, Z., Li, X., Liang, H., Shi, Z. and Ren, H. (2024) A Deep Learning Model Combining Multimodal Factors to Predict the Overall Survival of Transarterial Chemoembolization. Journal of Hepatocellular Carcinoma, 11, 385-397. [Google Scholar] [CrossRef] [PubMed]
[18] Wang, F., Chen, Q., Chen, Y., Zhu, Y., Zhang, Y., Cao, D., et al. (2023) A Novel Multimodal Deep Learning Model for Preoperative Prediction of Microvascular Invasion and Outcome in Hepatocellular Carcinoma. European Journal of Surgical Oncology, 49, 156-164. [Google Scholar] [CrossRef] [PubMed]
[19] Xia, Y., Zhou, J., Xun, X., Zhang, J., Wei, T., Gao, R., et al. (2024) CT-Based Multimodal Deep Learning for Non-Invasive Overall Survival Prediction in Advanced Hepatocellular Carcinoma Patients Treated with Immunotherapy. Insights into Imaging, 15, Article No. 214. [Google Scholar] [CrossRef] [PubMed]
[20] Gu, Y., Huang, H., Tong, Q., Cao, M., Ming, W., Zhang, R., et al. (2023) Multi-view Radiomics Feature Fusion Reveals Distinct Immuno-Oncological Characteristics and Clinical Prognoses in Hepatocellular Carcinoma. Cancers, 15, Article 2338. [Google Scholar] [CrossRef] [PubMed]
[21] Hu, G., Qu, J., Gao, J., Chen, Y., Wang, F., Zhang, H., et al. (2024) Radiogenomics Nomogram Based on MRI and Micrornas to Predict Microvascular Invasion of Hepatocellular Carcinoma. Frontiers in Oncology, 14, Article ID: 1371432. [Google Scholar] [CrossRef] [PubMed]
[22] Wei, H., Zheng, T., Zhang, X., Wu, Y., Chen, Y., Zheng, C., et al. (2024) MRI Radiomics Based on Deep Learning Automated Segmentation to Predict Early Recurrence of Hepatocellular Carcinoma. Insights into Imaging, 15, Article No. 120. [Google Scholar] [CrossRef] [PubMed]
[23] He, Y., Hu, B., Zhu, C., Xu, W., Ge, Y., Hao, X., et al. (2022) A Novel Multimodal Radiomics Model for Predicting Prognosis of Resected Hepatocellular Carcinoma. Frontiers in Oncology, 12, Article ID: 745258. [Google Scholar] [CrossRef] [PubMed]
[24] Masokano, I.B., Liu, W., Xie, S., Marcellin, D.F.H., Pei, Y. and Li, W. (2020) The Application of Texture Quantification in Hepatocellular Carcinoma Using CT and MRI: A Review of Perspectives and Challenges. Cancer Imaging, 20, Article No. 67. [Google Scholar] [CrossRef] [PubMed]
[25] Bartnik, K., Krzyziński, M., Bartczak, T., Korzeniowski, K., Lamparski, K., Wróblewski, T., et al. (2024) A Novel Radiomics Approach for Predicting TACE Outcomes in Hepatocellular Carcinoma Patients Using Deep Learning for Multi-Organ Segmentation. Scientific Reports, 14, Article No. 14779. [Google Scholar] [CrossRef] [PubMed]
[26] Qi, L., Zhu, Y., Li, J., Zhou, M., Liu, B., Chen, J., et al. (2024) CT Radiomics-Based Biomarkers Can Predict Response to Immunotherapy in Hepatocellular Carcinoma. Scientific Reports, 14, Article No. 20027. [Google Scholar] [CrossRef] [PubMed]
[27] Deng, K., Chen, T., Leng, Z., Yang, F., Lu, T., Cao, J., et al. (2024) Radiomics as a Tool for Prognostic Prediction in Transarterial Chemoembolization for Hepatocellular Carcinoma: A Systematic Review and Meta-Analysis. La Radiologia Medica, 129, 1099-1117. [Google Scholar] [CrossRef] [PubMed]
[28] Chen, M., Kong, C., Qiao, E., Chen, Y., Chen, W., Jiang, X., et al. (2023) Multi-Algorithms Analysis for Pre-Treatment Prediction of Response to Transarterial Chemoembolization in Hepatocellular Carcinoma on Multiphase MRI. Insights into Imaging, 14, Article No. 38. [Google Scholar] [CrossRef] [PubMed]
[29] Wang, L., Fatemi, M. and Alizad, A. (2024) Artificial Intelligence Techniques in Liver Cancer. Frontiers in Oncology, 14, Article ID: 1415859. [Google Scholar] [CrossRef] [PubMed]
[30] Kwak, L. and Bai, H. (2023) The Role of Federated Learning Models in Medical Imaging. Radiology: Artificial Intelligence, 5, e230136. [Google Scholar] [CrossRef] [PubMed]
[31] Yao, S., Ye, Z., Wei, Y., Jiang, H. and Song, B. (2021) Radiomics in Hepatocellular Carcinoma: A State-of-the-Art Review. World Journal of Gastrointestinal Oncology, 13, 1599-1615. [Google Scholar] [CrossRef] [PubMed]
[32] Li, C., Feng, X., Li, D. and Dong, J. (2025) A Retrospective Validation of a Federated Machine Learning Framework (Hepa-Fedboost) for Improving Liver Cancer CT Diagnosis across Heterogeneous Hospital Networks. Intelligent Medicine. [Google Scholar] [CrossRef
[33] Lévi-Strauss, T., Tortorici, B., Lopez, O., Viau, P., Ouizeman, D.J., Schall, B., et al. (2023) Radiomics, a Promising New Discipline: Example of Hepatocellular Carcinoma. Diagnostics, 13, Article1303. [Google Scholar] [CrossRef] [PubMed]
[34] Xie, X. and Chen, R. (2025) Research Progress of MRI-Based Radiomics in Hepatocellular Carcinoma. Frontiers in Oncology, 15, Article ID: 1420599. [Google Scholar] [CrossRef] [PubMed]