机器学习在原发性肝癌术后复发预测中的应用与可解释性进展
Machine Learning in Predicting Postoperative Recurrence of Hepatocellular Carcinoma: Advances in Application and Explainability
DOI: 10.12677/acm.2026.163847, PDF, HTML, XML,   
作者: 张芷艳:重庆医科大学研究生院,重庆;杨 慷*:重庆医科大学附属第二医院肝胆外科,重庆
关键词: 肝细胞癌机器学习术后复发预测模型可解释人工智能影像组学Hepatocellular Carcinoma Machine Learning Postoperative Recurrence Predictive Model Explainable Artificial Intelligence Radiomics
摘要: 原发性肝癌(HCC)是世界上常见的恶性肿瘤之一,全球超过半数新发病例都发生在中国,手术切除是目前最主要的根治性治疗手段,但由于其术后复发率居高不下,严重影响患者的长期生存。因此,术后复发风险的精准预测对个体化治疗策略的制定具有至关重要的意义。近年来,随着人工智能的发展,机器学习(Machine learning)技术在肝癌的预后预测中展现出显著优势,其通过多模态数据融合与复杂模型构建显著提升了预测性能。然而,大多数先进机器学习模型具有“黑箱”特性,其决策过程不透明,限制了其在临床实践中的可信度与推广。本文系统综述了机器学习在肝癌术后复发预测中的应用进展,重点分析了基于临床数据、影像组学、病理图像等不同数据源的机器学习预测模型构建方法与性能,并深入探讨了以SHAP (Shapley Additive Explanations)为代表的可解释性技术在提升模型透明度及临床信任度方面的作用。文章进一步总结了当前研究面临的挑战,如数据异质性、模型泛化能力不足、可解释性标准缺失等,并展望了未来发展方向。
Abstract: Primary liver cancer (HCC) is one of the most common malignant tumors worldwide, with more than half of new cases occurring in China. Surgical resection is currently the primary curative treatment, but its high postoperative recurrence rate significantly affects long-term patient survival. Therefore, accurate prediction of postoperative recurrence risk is crucial for developing personalized treatment strategies. In recent years, with the advancement of artificial intelligence, machine learning (ML) technology has demonstrated significant advantages in prognostic prediction for liver cancer, notably enhancing predictive performance through multimodal data fusion and complex model construction. However, most advanced ML models exhibit “black box” characteristics, with opaque decision-making processes that limit their credibility and generalizability in clinical practice. This article systematically reviews the application progress of ML in postoperative recurrence prediction for liver cancer, focusing on the construction methods and performance of ML prediction models based on different data sources such as clinical data, radiomics, and pathological images. It also explores the role of interpretable techniques, represented by SHAP (Shapley Additive Explanations), in improving model transparency and clinical trust. The article further summarizes current research challenges, such as data heterogeneity, insufficient model generalization, and a lack of interpretability standards, and outlines future research directions.
文章引用:张芷艳, 杨慷. 机器学习在原发性肝癌术后复发预测中的应用与可解释性进展[J]. 临床医学进展, 2026, 16(3): 774-780. https://doi.org/10.12677/acm.2026.163847

1. 引言

根据2023年全球癌症患者数据统计,肝细胞癌(hepatocellular carcinoma, HCC)目前已成为全球第五大常见恶性肿瘤和第三大癌症相关死亡原因,其发病率和死亡率呈逐年上升趋势[1]。在中国,肝癌是第四大常见恶性肿瘤及第二大肿瘤致死病因,疾病负担沉重[2]。根治性肝切除术是早期肝癌患者获得长期生存的主要手段,但术后5年内复发率高达40%~70%。因此,如何准确及时地识别高复发风险患者,并实施个体化辅助治疗,已成为临床上一大重要挑战。

传统的预测模型主要依赖于肿瘤分期系统(如BCLC、CNLC)、血清标志物(如AFP)及病理特征(如微血管侵犯、分化程度),但这些指标大多较单一、静态,难以全面反映肿瘤的异质性及宿主的免疫微环境状态。随着人工智能(AI)、云计算等的发展,机器学习(ML)技术为肝癌预后预测带来了新的机遇。机器学习(machine learning, ML)属于AI的一个分支,专注于使用数据和算法模仿人类的学习方式,并能逐步提高算法的准确性[3];与传统的预测模型相比,ML算法的关键优势是具有强大的预测能力,其能够从高维、多模态数据中自动提取复杂特征,识别非线性关系,构建预测性能更优的模型。在肝癌领域,机器学习技术已被广泛应用于治疗决策、术前评估、手术实施、术后辅助治疗及预后预测等多个环节。

然而,机器学习(尤其是深度学习)模型常因为其内部决策机制不透明,医生难以理解模型为何做出特定预测而被视为“黑箱”,这种不可解释性严重阻碍了模型在临床实践中的信任度与应用推广[4]。因此,如何提升机器学习模型的可解释性,使其预测结果能够被临床医生理解、验证与采纳,成为了当前研究的热点与难点。本文旨在系统梳理机器学习在肝癌术后复发预测中的应用现状,重点探讨可解释性技术的进展、挑战与未来方向,以促进人工智能在肝癌精准医疗中的临床转化。

2. 机器学习用于预测原发性肝细胞癌术后复发

2.1. 基于临床数据的预测模型

临床数据是肝癌复发预测的基础,包括患者的基本信息、实验室检验指标、肿瘤特征等,是构建复发预测模型最常用的数据源。传统统计方法(如Cox回归、Logistic回归)虽可解释性强,但难以处理变量间的复杂交互关系。而机器学习方法则能够更好地整合多维度临床变量,提升预测性能。近年来,研究人员利用机器学习算法对临床数据进行深度挖掘,构建了一系列复发预测模型。例如,吴中立等[5]发现术后1个月外周血RBM15 mRNA及血清GDF-15蛋白变化率是HCC术后复发的独立预测因子,联合预测AUC达0.866。李佳等[6]针对老年HCC患者,基于术前肠道菌群失调(双歧杆菌/肠杆菌比值 < 1)、营养状况(GNRI ≤ 98)及微血管侵犯构建了预测模型,AUC为0.855 (95%CI: 0.776~0.934),灵敏度为79.17%,特异度为84.62%。此外,炎症指标如中性粒细胞–淋巴细胞比值(NLR)、血小板-淋巴细胞比值(PLR)等也被证实与复发风险相关[7] [8]

在机器学习算法选择上,随机森林(RF)、极端梯度提升(XGBoost)、支持向量机(SVM)等集成学习方法表现出较优性能。张夕[9]基于山西省471例HCC患者数据,采用RF筛选变量(包括年龄、凝血酶原时间、肝叶位置、AST、脉管侵犯等),经SMOTE平衡数据后构建的XGBoost模型在测试集中准确率达0.905,AUC为0.905。Liu等[10]比较了多层感知机(MLP)、自适应提升(AB)、随机森林等六种算法,发现MLP在测试集中AUC最高(0.680),并通过SHAP方法解释了关键特征(如GGT、纤维蛋白原、中性粒细胞)的贡献度。

基于临床数据的机器学习模型具有数据获取相对容易、可解释性较强的优势,尤其适合在资源有限的环境中推广,但其局限性也显而易见。首先,临床数据往往存在缺失,影响模型的准确性;其次,单一数据源难以全面反映肿瘤的生物学行为和患者的整体状况。未来研究人员应探索多模态数据融合的方法,以提升模型的预测性能,注重动态临床指标(如治疗后生化指标变化)的纳入,以提升模型的时效性与个性化程度。

2.2. 基于影像组学的预测模型

近年来,影像组学与机器学习结合已成为研究热点。影像组学通过从CT、MRI等医学影像中高通量提取定量特征,包括形状特征、纹理特征、强度特征等,能够无创反映肿瘤异质性、微环境等信息,在术前预测复发风险方面具有独特优势。多项研究表明,基于CT或MRI影像组学的模型对肝癌术后复发具有较高的预测价值。刘杨军等[11]基于MSCT特征(肿瘤最大径、体积、动脉期CT值等)构建的预测模型AUC为0.860。杨春燕等[12]基于多期增强CT瘤周影像组学特征联合临床指标构建的混合模型AUC达0.743。在MRI方面,张孟溦等[13]利用钆塞酸二钠增强MRI深度学习模型(MViT)预测粗梁–团块型HCC复发风险,AUC为0.803。董致成等[14]基于平扫MRI影像组学构建的模型AUC高达0.968,这提示了即使没有增强扫描,影像组学仍具潜力。

深度学习进一步提升了影像特征的自动提取能力。陈超[15]基于多期CT影像构建的3DUXENet深度学习模型,在预测术后TACE治疗患者无复发生存(RFS)方面,验证集C-index达0.855。刘鑫雨[16]基于薄层多期增强CT影像组学联合临床特征构建的生存预测模型,在训练集和验证集中AUC分别为0.722和0.719。

影像组学模型能够提供人眼无法辨识的定量信息,尤其适用于术前无创评估。然而,影像组学特征易受扫描协议、重建参数影响,标准化与可重复性是当下的瓶颈。在将来,还需要持续推动多中心、标准化影像数据共享,并结合病理组学、基因组学等多组学数据,构建出更具生物学意义的预测标志物。

2.3. 基于病理图像的预测模型

病理图像能够提供丰富的肿瘤生物学信息。近年来,随着数字病理技术的发展,研究人员开始利用深度学习算法对病理图像进行自动分析,以预测肝癌术后复发。

数字病理与深度学习结合,可直接从全玻片图像(WSI)中提取形态学特征,预测复发风险。

Saito等[17]利用支持向量机(SVM)对HCC切除术后HE染色数字病理图像进行分析,构建了早期复发预测模型。最新研究表明,肿瘤内免疫细胞的空间分布特征对预后评估具有重要意义。中国科学技术大学的研究团队通过高分辨率空间转录组和蛋白组技术,系统绘制了HCC组织中的区域免疫异质性图谱,并构建了基于空间免疫特征的TIMES评分系统。该系统通过量化免疫细胞在肿瘤微环境中的空间分布特征,实现了对肝细胞癌复发风险的高精度预测[18]

这些研究表明,病理图像蕴含的纹理、结构、细胞排列等信息与肿瘤侵袭性、复发风险密切相关。所以,基于病理图像的预测模型在临床应用中具有广阔的前景。然而,目前的研究仍面临一些挑战,如病理图像的标准化采集和标注规范、深度学习模型的可解释性等。未来,随着技术的不断进步和数据的不断积累,基于病理图像的预测模型有望在肝癌术后复发预测中发挥更大的作用。

3. 可解释性进展

尽管机器学习模型在肝癌术后复发预测中表现优异,但其“黑箱”特性限制了其在临床实践中的应用。医生需要理解模型依据哪些特征做出决策,以评估其可靠性、排查偏差,并将预测结果整合到临床推理中。可解释人工智能(Explainable Artificial Intelligence, XAI)旨在解决这一问题,提升模型的透明度、公平性与可信度。

3.1. 传统可解释模型

线性模型(如Logistic回归)、决策树等本身具有较好的可解释性。例如,列线图(Nomogram)能够直观展示各变量对复发风险的贡献度,便于临床医生进行个体化评分[19] [20]。然而,这些简单模型往往预测性能有限,难以处理复杂数据。

3.2. 复杂模型的事后解释技术

对于深度学习、集成学习等复杂的机器学习模型,研究人员通常采用事后解释技术来揭示其决策过程。沙普利加法解释(SHapley Additive explanation, SHAP)是目前最受关注的方法之一,它通过计算每个特征的Shapley值来量化其对预测结果的贡献,提供全局与局部解释[21]

张夕[9]应用SHAP对XGBoost模型进行解释,展示了年龄、凝血酶原时间、肝叶位置等特征对复发风险的正负向影响,并通过瀑布图、依赖图等形式可视化。Liu等[10]利用SHAP解释了MLP模型中GGT、纤维蛋白原、中性粒细胞等关键特征的作用方向与强度。这些解释不仅增强了医生对模型的信任,还有助于发现新的生物学洞见,如炎症指标与复发风险的关联。

除此之外,部分依赖图(PDP)、局部可解释模型–敏感度分析(LIME)等技术也被用于解释机器学习模型。例如,王馨瑶[22]基于超声造影影像组学构建的随机森林模型中,通过特征重要性排序揭示了肿瘤大小、分化程度等关键预测因子。

SHAP等可解释性技术显著提升了复杂模型的临床可接受度[21],但目前多数研究仍停留在“事后解释”层面,尚未实现与临床决策流程的深度融合。未来应开发交互式解释工具,使医生能够实时调整模型输入、探索不同临床情景下的预测结果。

4. 挑战与展望

4.1. 当前研究面临的挑战

尽管机器学习在肝癌复发预测中取得了显著进展,但仍面临诸多挑战。一是在数据和模型层面:(1) 数据质量与标准化问题:回顾性数据存在选择偏倚、标注不一致等问题,影响模型泛化能力。(2) 模型泛化能力不足:大多数模型基于单中心数据构建,缺乏外部验证,跨机构、跨人群性能下降明显[23]。(3) 可解释性标准缺失:目前尚无统一的评估指标来衡量解释结果的临床合理性与实用性。二是在临床部署与监管层面:(1) 系统集成困难:当前预测模型多为独立系统,尚未与医院信息系统的电子病历、影像归档和通信系统无缝集成。模型输出无法直接推送至医生工作台,导致使用不便,阻碍其在真实临床流程中的应用。(2) 辅助决策的合规性问题:模型预测结果如何以合法、合规的方式辅助医生作出诊断或治疗决策,仍是未解难题。当前多数模型缺乏临床验证和监管审批,无法作为正式医疗决策依据。(3) 监管审批对可解释性的要求:美国食品药品监督管理局(FDA)与中国国家药品监督管理局(NMPA)对AI医疗器械的审批日益重视模型的可解释性。FDA在《基于人工智能/机器学习的医疗器械软件行动计划》中强调,模型应具备一定程度的可解释性,以便医生理解其输出依据[24];NMPA也在《人工智能医用软件注册审查指导原则》中提出,需对模型的决策逻辑进行说明[25]。然而,目前尚无统一的解释性评价标准,给产品的合规审批带来挑战。

4.2. 未来发展方向

在将来,机器学习在原发性肝癌术后复发预测领域将朝着以下几个方向发展:(1) 多模态数据融合:随着多模态数据采集技术的不断发展,研究人员将能够获取更全面、更丰富的患者信息。通过融合临床数据、影像组学特征、病理图像和基因组学数据等多模态信息,构建更全面、精准的预测系统。(2) 深化可解释性与因果推理:当前的可解释性方法如SHAP虽能提供特征贡献度,但其解释仍存在稳定性差、易受输入扰动影响等问题[26]。此外,SHAP等方法是基于相关性而非因果关系,容易混淆因果关联与虚假相关,可能误导临床判断[27]。因此,未来应引入因果推断方法,如结构方程模型、反事实推理等,提升解释的鲁棒性与可信度。反事实解释是一种新兴的可解释性技术,它通过回答“如果患者的某项指标不同,预测结果是否会改变”来提供直观、可操作的临床反馈,更符合医生的认知习惯[28]。(3) 设计“以人为本”的交互式解释界面:可解释性不仅仅是技术问题,更是人机交互问题。未来应开发面向临床医生的交互式解释工具,允许其动态调整输入变量、模拟不同临床情景下的预测结果,提升模型的可用性与信任度。例如,通过可视化界面展示关键特征对预测结果的边际影响,或通过自然语言生成技术提供文本化解释,增强医生的理解与接受度。(4) 推动多中心前瞻性验证与临床转化:目前的研究大多基于回顾性数据,缺乏前瞻性研究的验证。未来需要开展多中心、前瞻性的临床研究,验证模型的准确性和有效性。同时,还需探索如何将研究成果转化为临床应用产品,如开发与HIS/PACS系统无缝对接的在线预测平台、移动应用程序等,为医生提供便捷、高效的决策支持工具[29]。(5) 完善数据治理与隐私保护机制:随着医疗数据的不断积累和共享,数据治理和隐私保护成为重要问题。未来需要建立完善的数据治理体系,保证数据的安全性和隐私性。同时,还需探索如何在保护患者隐私的前提下,实现数据的共享和利用,推动机器学习技术在肝癌术后复发预测中的广泛应用。

综上所述,机器学习在原发性肝癌术后复发预测中已展现出了巨大的应用潜力,其能够从多模态数据中挖掘出深层特征,构建高性能的预测模型。然而,模型的“黑箱”特性限制了其临床转化。而可解释人工智能技术(如SHAP)的发展为提升模型透明度、增强医生信任提供了有效途径。当前关于机器学习方面仍面临着数据异质性、模型泛化能力不足、可解释性标准缺失等多重挑战。未来应通过多中心协作、多模态融合、人机协同等策略,推动可解释、可信赖的智能预测系统的发展,为改善肝癌患者的预后做出更大贡献。

NOTES

*通讯作者。

参考文献

[1] Sung, H., Ferlay, J., Siegel, R.L., Laversanne, M., Soerjomataram, I., Jemal, A., et al. (2021) Global Cancer Statistics 2020: GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries. CA: A Cancer Journal for Clinicians, 71, 209-249. [Google Scholar] [CrossRef] [PubMed]
[2] Llovet, J.M., Kelley, R.K., Villanueva, A., Singal, A.G., Pikarsky, E., Roayaie, S., et al. (2022) Hepatocellular Carcinoma. Nature Reviews Disease Primers, 7, Article No. 6. [Google Scholar] [CrossRef] [PubMed]
[3] Rattan, P., Penrice, D.D. and Simonetto, D.A. (2022) Artificial Intelligence and Machine Learning: What You Always Wanted to Know but Were Afraid to Ask. Gastro Hep Advances, 1, 70-78. [Google Scholar] [CrossRef] [PubMed]
[4] Topol, E.J. (2019) High-Performance Medicine: The Convergence of Human and Artificial Intelligence. Nature Medicine, 25, 44-56. [Google Scholar] [CrossRef] [PubMed]
[5] 吴中立, 罗超, 杨涌. 肝细胞癌患者肝切除术后1个月外周血RBM15 mRNA及血清GDF-15蛋白变化率对术后复发的预测价值[J]. 检验医学与临床, 2026, 23(1): 7-12+19.
[6] 李佳, 胡海燕, 胡巧丽, 等. 老年肝细胞癌患者根治切除术后复发的影响因素及预测模型构建[J]. 中华老年多器官疾病杂志, 2025, 24(10): 774-778.
[7] 钟丘, 刘权焰. 基于倾向性评分匹配的术前炎症指标预测肝细胞癌术后复发[J]. 武汉大学学报(医学版), 2023, 44(6): 744-749.
[8] 刘春龙. 原发性肝细胞癌肝切除术后早期复发危险因素分析及列线图预测模型的建立[D]: [硕士学位论文]. 合肥: 安徽医科大学, 2024.
[9] 张夕. 基于可解释机器学习算法构建肝癌术后复发预测模型的应用[D]: [硕士学位论文]. 太原: 山西医科大学, 2024.
[10] Liu, R., Wu, S., Yu, H.y., Zeng, K., Liang, Z., Li, S., et al. (2023) Prediction Model for Hepatocellular Carcinoma Recurrence after Hepatectomy: Machine Learning-Based Development and Interpretation Study. Heliyon, 9, e22458. [Google Scholar] [CrossRef] [PubMed]
[11] 刘杨军, 刘淑珍, 李鹏, 等. 基于MSCT特征构建肝细胞癌根治性切除术后复发的预测模型[J]. 中国医学物理学杂志, 2026, 43(2): 261-267.
[12] 杨春燕, 魏小琴, 杨琼, 等. 基于多期增强CT影像组学模型预测肝细胞癌切除术后复发的价值[J]. 中国医学影像学杂志, 2025, 33(3): 245-251.
[13] 张孟溦, 范艳芬, 诗涔, 等. 钆塞酸二钠增强MRI深度学习在粗梁-团块型肝细胞癌诊断及术后复发预测的双中心研究[J]. 中国医学影像学杂志, 2026, 34(1): 90-97.
[14] 董致成, 张金标, 邢梦杨, 等. 基于MRI影像组学对肝细胞癌术后复发的预测价值[J]. 中国医学装备, 2025, 22(5): 57-61.
[15] 陈超. 基于CT图像的机器学习在肝癌术后TACE治疗患者预后预测中的应用研究[D]: [硕士学位论文]. 西安: 西安医学院, 2025.
[16] 刘鑫雨. 基于薄层多期增强CT影像组学探索肝癌预后因素并建立肝癌预后模型[D]: [硕士学位论文]. 西安: 中国人民解放军空军军医大学, 2025.
[17] Saito, A., Toyoda, H., Kobayashi, M., Koiwa, Y., Fujii, H., Fujita, K., et al. (2021) Prediction of Early Recurrence of Hepatocellular Carcinoma after Resection Using Digital Pathology Images Assessed by Machine Learning. Modern Pathology, 34, 417-425. [Google Scholar] [CrossRef] [PubMed]
[18] Sun, C., Li, J., Zhang, T., et al. (2025) Spatial Immune Landscape Reveals Prognostic Immune Signatures and a Risk Score for Recurrence of Hepatocellular Carcinoma. Nature, 636, 513-521.
[19] 郑郭群, 郭丽萍, 陈挺, 等. 原发性肝细胞癌术后早期复发预测模型的建立与评价[J]. 浙江临床医学, 2025, 27(6): 844-847+850.
[20] 王兆阳, 张楠. 基于CT影像组学与中医舌象特征构建肝细胞癌根治术后早期复发的Nomogram预测模型[J]. 实用医学杂志, 2025, 41(16): 2590-2596.
[21] Lundberg, S.M., Nair, B., Vavilala, M.S., Horibe, M., Eisses, M.J., Adams, T., et al. (2018) Explainable Machine-Learning Predictions for the Prevention of Hypoxaemia during Surgery. Nature Biomedical Engineering, 2, 749-760. [Google Scholar] [CrossRef] [PubMed]
[22] 王馨瑶. 超声影像组学对肝细胞肝癌微波消融术后早期复发的预测研究[D]: [硕士学位论文]. 延安: 延安大学, 2024.
[23] 赵仁卿, 吴奇新. 基于MRI深度学习预测肝细胞癌微血管侵犯的研究进展[J]. 磁共振成像, 2025, 16(10): 191-195.
[24] U.S. Food and Drug Administration (2021) Artificial Intelligence/Machine Learning (AI/ML)-Based Software as a Medical Device (SaMD) Action Plan.
[25] 国家药品监督管理局医疗器械技术审评中心. 人工智能医疗器械注册审查指导原则: 2022年第8号通告[EB/OL].
https://www.cmde.org.cn/flfg/zdyz/zdyzwbk/20220309091014461.html, 2022-03-09.
[26] Slack, D., Hilgard, S., Jia, E., Singh, S. and Lakkaraju, H. (2020) Fooling LIME and Shap: Adversarial Attacks on Post hoc Explanation Methods. Proceedings of the AAAI/ACM Conference on AI, Ethics, and Society, New York, 7-9 February 2020, 180-186. [Google Scholar] [CrossRef
[27] Rudin, C. (2019) Stop Explaining Black Box Machine Learning Models for High Stakes Decisions and Use Interpretable Models Instead. Nature Machine Intelligence, 1, 206-215. [Google Scholar] [CrossRef] [PubMed]
[28] Wachter, S., Mittelstadt, B. and Russell, C. (2017) Counterfactual Explanations without Opening the Black Box: Automated Decisions and the GDPR. Harvard Journal of Law & Technology, 31, 841.
[29] Perez-Lopez, R., Ghaffari Laleh, N., Mahmood, F. and Kather, J.N. (2024) A Guide to Artificial Intelligence for Cancer Researchers. Nature Reviews Cancer, 24, 427-441. [Google Scholar] [CrossRef] [PubMed]