1. 前言
肝恶性肿瘤(HCC)占原发性肝癌病例的75%~85%,是全球每年癌症死亡的第三大原因[1],预计2025年,每年将有>100万患者受到影响。大多数HCC患者一经确诊已达晚期,预后不佳[2]。晚期HCC全身治疗的试验未能显示结局改善,直到酪氨酸激酶抑制剂索拉非尼问世[3],此后,其他多激酶抑制剂也已获得批准,瑞戈非尼在索拉非尼治疗进展的HCC患者中取得成功,预示着二线治疗的新时代。然而,并非所有在索拉非尼上进展的患者都适合二线治疗[4]。在临床实践中,只有约30%的患者有资格接受二线瑞戈非尼治疗[5]。
门静脉高压症PHT和HCC经常合并,必须一起管理,晚期HCC患者其患病率可能高于可切除的HCC [6]。对于门静脉高压合并晚期HCC病人,在选择系统治疗方案时,必须兼顾门静脉高压的处理[7]。一项动物实验表明,瑞戈非尼的长期治疗可以减少血管生成并改善门静脉高压症(PHT),急性给药可改善门静脉血流动力学,表明它可能特别适合PHT患者和保留肝功能的患者[8]。目前有关肝细胞癌晚期二线靶向药物瑞戈非尼临床治疗期间对患者门静脉血流动力学的影响尚无文献报道。针对上述研究现状和临床需求,本研究旨在探究瑞戈非尼对晚期肝细胞癌患者门静脉血流动力学的影响,并基于机器学习算法利用治疗前基线临床资料构建瑞戈非尼治疗后门静脉高压变化的预测模型指导临床实践。
2. 资料与方法
2.1. 研究对象
本回顾性研究的研究对象纳入自2017年3月至2023年8月期间在青岛大学附属医院接受瑞戈非尼作为一线靶向药物治疗失败后的二线序贯治疗,服药前评估为不可切除的晚期肝细胞癌患者,共202例。纳入标准如下:1) 符合条件的患者是根据美国肝病研究协会对确诊肝硬化患者的标准,通过病理评估或无创评估确诊的HCC成人患者;2) ≥30周岁、≤80周岁的患者;3) 不适合根治性手术切除;4) 根据修改后的HCC实体瘤反应评估标准(mRECIST)和RECIST 1.1版至少有1个可测量的病灶;5) 在治疗过程中,靶向治疗仅使用一线药物索拉非尼和仑伐替尼以及二线药物瑞戈非尼;6) 存在服用瑞戈非尼前和一个月后的超声报告。排除标准如下:1) 临床资料不完整;2) 无故自愿停用瑞戈非尼超过1周;3) 治疗过程中接受其他的靶向药物治疗;4) 患有其他类型的恶性疾病。本研究根据赫尔辛基宣言进行,并获得了青岛大学临床研究伦理委员会的批准(参考编号:QYFY WZLL 28152)。鉴于本研究为回顾性分析,已豁免了患者的个人同意要求。
2.2. 研究设计
本研究的研究设计包括3个步骤:基线资料的收集、模型的开发验证和最优模型的局部和全局解释。首先,使用队列的75%作为训练队列来开发预测模型。随后,将队列的剩余25%用于验证。Shapley加法解释(SHAP)算法用于阐明预测模型中特征的重要性,并识别风险预测因子之间的非线性关系。
患者基线数据分析首先对定量数据进行正态性检验。正态分布的连续数据以均值 ± 标准差(Mean ± SD)表示,并通过独立样本t检验进行组间比较。偏态数据使用中位数(P25, P75)描述,组间比较通过Mann-Whitney U检验进行。计数数据以频率(百分比,%)表示,统计分析使用卡方检验。使用单因素分析,将P值小于0.1的变量纳入多因素分析,双尾P值小于0.05被视为具有统计学意义,最终确定独立预测因子,从而消除冗余特征。
2.3. 数据采集
本研究通过查看电子病历和实验室管理系统,收集了患者基线资料、影像学数据和实验室检测结果数据。
2.4. 模型建立和验证
使用R4.4.1版结合Mlr3包开发机器学习算法模型。Mlr3是一套专为机器学习设计的软件包。在本研究中,使用了六种机器学习算法——决策树(DT)、逻辑回归(Logistic)、k近邻(Kknn)、极端梯度提升(Xgboost)、支持向量机(SVM)和随机森林(RF)——通过mlr3软件包分别构建了门静脉压力降低组和升高组诊断模型。模型构建如下:使用引擎设置为“rpart”的决策树模型;使用引擎设置为“kknn”的k近邻模型;使用引擎设置为“xgboost”的极端梯度提升模型;使用引擎设置为“log_reg”的逻辑回归模型;使用引擎设置为“svm”的向量机模型;以及使用引擎设置为“ranger”的随机森林模型。对每种机器学习算法分别通过5折交叉验证进行内部超参数调优。在选择最佳超参数后,模型在完整的训练子集中重新训练,以最终确定权重并生成锁定模型。这些锁定模型随后在验证队列上进行评估。训练模型性能的评估包括比较ROC曲线、DCA曲线、校准曲线等。评估了六种机器学习算法的有效性,最终挑选出最优模型。
3. 结果
3.1. 瑞戈非尼对门静脉血流动力学的影响
肝静脉压力梯度(HVPG)的测量是评估肝病中门静脉高压症的金标准,但其有创性和操作复杂性限制了其在所有患者中的广泛应用。门静脉充血指数是门静脉横截面面积与其血流速度的比值,有效反映门静脉内径和血流速度的综合变化情况,可相对准确地用于评估门静脉压力。从基线到瑞戈非尼治疗1月后的门静脉充血指数的变化见图1,门静脉面积充血指数CI显著降低:0.06 (0.04, 0.07) vs. 0.05 (0.04, 0.06) cm∙sec,P = 0.04。这提示瑞戈非尼可能是改善门静脉高压的药物。然而并非接受瑞戈非尼治疗的所有患者门静脉充血指数都降低。根据给药后个体充血指数的变化分为门静脉压力降低组(n = 99)和升高组(n = 103),比较两组的基线资料(表1)。比较两组接受瑞戈非尼前后的治疗没有明显的统计学差异(表2),因此两组具有可比性,比较两组的预后(图2),发现门静脉压力降低组的中位ROS (瑞戈非尼后OS)为15.0个月,门静脉压力升高组的ROS为12.0个月,降低组预后优于升高组,P = 0.029。
Figure 1. Changes in the portal vein congestion index after regorafenib administration. CI: Congestion Index
图1. 瑞戈非尼给药后门静脉充血指数的变化。CI:充血指数
Table 1. Baseline data of the study cohort
表1. 研究队列的基线资料
变量 |
共计 (n = 202) |
升高组 (n = 103) |
降低组 (n = 99) |
Statistic |
P value |
年龄 |
61.50 (54.00, 66.00) |
61.00 (55.00, 68.00) |
62.00 (52.00, 64.00) |
Z = −1.58 |
0.114 |
性别 |
|
|
|
χ2 = 0.83 |
0.363 |
女 |
30 (14.85) |
13 (12.62) |
17 (17.17) |
|
|
男 |
172 (85.15) |
90 (87.38) |
82 (82.83) |
|
|
HBV |
|
|
|
χ2 = 0.22 |
0.641 |
无 |
31 (15.35) |
17 (16.50) |
14 (14.14) |
|
|
有 |
171 (84.65) |
86 (83.50) |
85 (85.86) |
|
|
AFP |
|
|
|
χ2 = 0.32 |
0.571 |
<200 |
162 (80.20) |
81 (78.64) |
81 (81.82) |
|
|
≥200 |
40 (19.80) |
22 (21.36) |
18 (18.18) |
|
|
肿瘤大小 |
|
|
|
χ2 = 0.25 |
0.620 |
<5 cm |
66 (32.67) |
32 (31.07) |
34 (34.34) |
|
|
≥5 cm |
136 (67.33) |
71 (68.93) |
65 (65.66) |
|
|
肿瘤数量 |
|
|
|
χ2 = 0.17 |
0.680 |
单发 |
37 (18.32) |
20 (19.42) |
17 (17.17) |
|
|
多发 |
165 (81.68) |
83 (80.58) |
82 (82.83) |
|
|
肝硬化 |
|
|
|
χ2 = 0.12 |
0.730 |
无 |
47 (23.27) |
25 (24.27) |
22 (22.22) |
|
|
有 |
155 (76.73) |
78 (75.73) |
77 (77.78) |
|
|
BCLC分期 |
|
|
|
χ2 = 0.38 |
0.826 |
0 |
16 (7.92) |
7 (6.80) |
9 (9.09) |
|
|
1 |
90 (44.55) |
46 (44.66) |
44 (44.44) |
|
|
2 |
96 (47.52) |
50 (48.54) |
46 (46.46) |
|
|
ALBI分级 |
|
|
|
χ2 = 7.39 |
0.025 |
1 |
73 (36.14) |
28 (27.18) |
45 (45.45) |
|
|
2 |
102 (50.50) |
60 (58.25) |
42 (42.42) |
|
|
3 |
27 (13.37) |
15 (14.56) |
12 (12.12) |
|
|
WBC |
4.41 (3.56, 5.62) |
4.35 (3.25, 5.61) |
4.47 (3.79, 5.69) |
Z = −1.49 |
0.137 |
N |
2.78 (2.18, 3.77) |
2.63 (1.92, 3.67) |
2.91 (2.21, 3.85) |
Z = −1.62 |
0.106 |
L |
1.31 (1.01, 1.77) |
1.25 (0.88, 1.77) |
1.41 (1.08, 1.76) |
Z = −1.37 |
0.170 |
PLT |
118.00 (83.25, 159.75) |
115.00 (72.50, 151.00) |
132.00 (87.50, 176.00) |
Z = −2.13 |
0.033 |
Hb |
131.43 ± 16.91 |
132.84 ± 17.31 |
129.95 ± 16.44 |
t = 1.22 |
0.225 |
GGT |
44.50 (25.05, 73.75) |
48.00 (25.10, 92.00) |
42.00 (25.50, 65.50) |
Z = −1.76 |
0.078 |
ALP |
84.50 (63.00, 136.75) |
102.00 (58.70, 141.00) |
76.00 (63.00, 123.00) |
Z = −0.69 |
0.491 |
TBA |
8.82 (5.31, 17.82) |
10.80 (6.43, 17.20) |
7.92 (3.38, 22.75) |
Z = −2.71 |
0.007 |
LDH |
242.45 (201.62, 276.75) |
249.00 (217.50, 284.50) |
223.00 (181.90, 268.25) |
Z = −3.46 |
<0.001 |
ACHE |
7076.00 (5534.75, 8747.75) |
6764.00 (5479.00, 8164.00) |
7530.00 (5769.00, 9352.50) |
Z = −2.27 |
0.023 |
ADA |
16.00 (11.00, 19.00) |
16.00 (12.00, 20.50) |
15.00 (10.00, 16.00) |
Z = −2.74 |
0.006 |
Fib |
2.68 (2.21, 3.29) |
2.85 (2.33, 3.64) |
2.44 (1.97, 3.08) |
Z = −3.32 |
<0.001 |
TT |
18.29 ± 1.91 |
18.35 ± 1.97 |
18.22 ± 1.86 |
t = 0.50 |
0.619 |
APTT |
32.71 ± 5.15 |
32.49 ± 5.26 |
32.94 ± 5.04 |
t = −0.62 |
0.537 |
CA125 |
11.30 (8.30, 19.15) |
11.60 (8.38, 20.65) |
10.36 (7.95, 17.00) |
Z = −0.92 |
0.356 |
CA19-9 |
15.37 (8.07, 28.12) |
15.33 (9.09, 28.22) |
15.80 (7.79, 26.85) |
Z = −0.80 |
0.421 |
CEA |
2.51 (1.79, 4.09) |
2.40 (1.67, 3.78) |
2.56 (1.84, 4.47) |
Z = −1.08 |
0.281 |
ALB |
38.40 ± 5.60 |
37.54 ± 5.42 |
39.29 ± 5.68 |
t = −2.23 |
0.027 |
PA |
175.00 (145.07, 224.82) |
170.90 (131.50, 223.15) |
177.60 (150.30, 226.40) |
Z = −1.57 |
0.116 |
ALT |
27.50 (20.20, 48.25) |
27.00 (21.00, 38.65) |
28.00 (20.10, 50.00) |
Z = −0.09 |
0.931 |
AST |
35.65 (27.00, 51.15) |
35.00 (28.85, 51.10) |
37.00 (23.65, 53.50) |
Z = −1.08 |
0.278 |
TB |
18.54 (13.20, 26.57) |
19.90 (14.88, 27.87) |
16.80 (11.37, 25.15) |
Z = −2.03 |
0.042 |
Cr |
72.00 (59.70, 80.75) |
71.00 (63.00, 82.00) |
72.00 (59.60, 74.65) |
Z = −1.49 |
0.136 |
PT |
81.25 (68.78, 89.90) |
78.00 (63.45, 85.00) |
87.00 (72.40, 94.90) |
Z = −3.99 |
<0.001 |
NLR |
2.18 (1.47, 2.95) |
2.02 (1.39, 3.22) |
2.20 (1.67, 2.79) |
Z = −0.40 |
0.692 |
PLR |
87.26 (59.58, 134.77) |
83.45 (61.27, 119.33) |
88.27 (57.39, 138.10) |
Z = −0.48 |
0.629 |
PNI |
45.53 ± 7.03 |
44.47 ± 7.17 |
46.62 ± 6.75 |
t = −2.19 |
0.030 |
注:HBV为乙型肝炎;AFP为甲胎蛋白;ALBI分级为白蛋白–胆红素评分;WBC为白细胞计数;N为中性粒细胞计数;L为淋巴细胞计数;PLT为血小板计数;Hb为血红蛋白计数;GGT为γ-谷氨酰转肽酶;ALP为碱性磷酸酶;TBA为总胆汁酸;LDH为碱性磷酸酶;ACHE为胆碱酯酶;ADA为腺苷脱氢酶;Fib为纤维蛋白原;TT为凝血酶时间;APTT为活化部分凝血活酶时间;CA125为糖类抗原125;CA19-9为糖类抗原19-9;CEA为癌胚抗原;ALB为白蛋白;PA为前白蛋白;ALT为谷丙转氨酶;AST为谷草转氨酶;TB为总胆红素;Cr为肌酐;PT为凝血酶原活动度;NLR为为中性粒细胞计数与淋巴细胞计数比值;PLR为血小板计数与淋巴细胞计数比值;PNI为预后营养指数。
Table 2. Treatment before and after regorafenib in the two groups
表2. 两组接受瑞戈非尼前后的治疗
治疗 |
共计 (n = 202) |
升高组 (n = 103) |
降低组 (n = 99) |
P |
手术1 (%) |
|
|
|
0.618 |
否 |
36 (17.82) |
17 (16.50) |
19 (19.19) |
|
是 |
166 (82.18) |
86 (83.50) |
80 (80.81) |
|
TACE1 (%) |
|
|
|
0.940 |
否 |
31 (15.35) |
16 (15.53) |
15 (15.15) |
|
是 |
171 (84.65) |
87 (84.47) |
84 (84.85) |
|
免疫1 (%) |
|
|
|
0.449 |
否 |
85 (42.08) |
46 (44.66) |
39 (39.39) |
|
是 |
117 (57.92) |
57 (55.34) |
60 (60.61) |
|
放射1 (%) |
|
|
|
0.561 |
否 |
184 (91.09) |
95 (92.23) |
89 (89.90) |
|
是 |
18 (8.91) |
8 (7.77) |
10 (10.10) |
|
消融1 (%) |
|
|
|
0.426 |
否 |
132 (65.35) |
70 (67.96) |
62 (62.63) |
|
是 |
70 (34.65) |
33 (32.04) |
37 (37.37) |
|
TACE2 (%) |
|
|
|
0.433 |
否 |
79 (39.11) |
43 (41.75) |
36 (36.36) |
|
是 |
123 (60.89) |
60 (58.25) |
63 (63.64) |
|
免疫2 (%) |
|
|
|
0.961 |
否 |
37 (18.32) |
19 (18.45) |
18 (18.18) |
|
是 |
165 (81.68) |
84 (81.55) |
81 (81.82) |
|
放射2 (%) |
|
|
|
0.455 |
否 |
177 (87.62) |
92 (89.32) |
85 (85.86) |
|
是 |
25 (12.38) |
11 (10.68) |
14 (14.14) |
|
消融2 (%) |
|
|
|
0.610 |
否 |
175 (86.63) |
88 (85.44) |
87 (87.88) |
|
是 |
27 (13.37) |
15 (14.56) |
12 (12.12) |
|
注:1接受瑞戈非尼前的治疗;2接受瑞戈非尼后的治疗。
Figure 2. Prognostic analysis of the portal vein pressure reduction group and the elevation group
图2. 门静脉压力降低组和升高组的预后分析
3.2. 变量选择
首先,将研究队列按照3:1的比例随机分为训练队列和测试队列,比较两组没有明显的统计学差异(见附录表S1)。接下来,使用训练队列数据进行变量选择和模型开发,并以测试队列数据进行模型验证。将单因素分析中差异有统计学意义(P < 0.1)的指标纳入多因素Logistic分析(表3),最终确定年龄、血小板计数、GGT、纤维蛋白原、白蛋白、PT百分活度、预后营养指数水平7个指标为门静脉压力降低的风险预测因子。
Table 3. Results of univariate and multivariate analyses
表3. 单因素和多因素分析的结果
变量 |
单因素 |
多因素 |
β |
S.E |
Z |
P |
OR (95% CI) |
β |
S.E |
Z |
P |
OR (95% CI) |
年龄 |
−0.03 |
0.02 |
−1.87 |
0.062 |
0.97 (0.94~1.00) |
−0.05 |
0.02 |
−2.55 |
0.011 |
0.95 (0.91~0.99) |
性别 |
|
|
|
|
|
|
|
|
|
|
女 |
|
|
|
|
1.00 (Reference) |
|
|
|
|
|
男 |
−0.36 |
0.40 |
−0.91 |
0.365 |
0.70 (0.32~1.52) |
|
|
|
|
|
HBV |
|
|
|
|
|
|
|
|
|
|
无 |
|
|
|
|
1.00 (Reference) |
|
|
|
|
|
有 |
0.18 |
0.39 |
0.47 |
0.642 |
1.20 (0.56~2.59) |
|
|
|
|
|
AFP |
|
|
|
|
|
|
|
|
|
|
<200 |
|
|
|
|
1.00 (Reference) |
|
|
|
|
|
≥200 |
−0.20 |
0.35 |
−0.57 |
0.571 |
0.82 (0.41~1.64) |
|
|
|
|
|
肿瘤大小 |
|
|
|
|
|
|
|
|
|
|
<5 cm |
|
|
|
|
1.00 (Reference) |
|
|
|
|
|
≥5 cm |
−0.15 |
0.30 |
−0.50 |
0.620 |
0.86 (0.48~1.55) |
|
|
|
|
|
肿瘤数量 |
|
|
|
|
|
|
|
|
|
|
单发 |
|
|
|
|
1.00 (Reference) |
|
|
|
|
|
多发 |
0.15 |
0.36 |
0.41 |
0.680 |
1.16 (0.57~2.38) |
|
|
|
|
|
肝硬化 |
|
|
|
|
|
|
|
|
|
|
无 |
|
|
|
|
1.00 (Reference) |
|
|
|
|
|
有 |
0.11 |
0.33 |
0.34 |
0.730 |
1.12 (0.58~2.16) |
|
|
|
|
|
BCLC分期 |
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
1.00 (Reference) |
|
|
|
|
|
1 |
−0.30 |
0.55 |
−0.54 |
0.588 |
0.74 (0.26~2.17) |
|
|
|
|
|
2 |
−0.33 |
0.54 |
−0.62 |
0.538 |
0.72 (0.25~2.08) |
|
|
|
|
|
ALBI分级 |
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
1.00 (Reference) |
|
|
|
|
1.00 (Reference) |
2 |
−0.83 |
0.31 |
−2.65 |
0.008 |
0.44 (0.24~0.81) |
−0.21 |
0.59 |
−0.35 |
0.728 |
0.81 (0.26~2.59) |
3 |
−0.70 |
0.46 |
−1.53 |
0.126 |
0.50 (0.20~1.22) |
1.30 |
1.22 |
1.07 |
0.285 |
3.67 (0.34~39.72) |
WBC |
0.09 |
0.08 |
1.13 |
0.260 |
1.10 (0.93~1.28) |
|
|
|
|
|
N |
0.11 |
0.10 |
1.07 |
0.283 |
1.12 (0.91~1.37) |
|
|
|
|
|
L |
0.21 |
0.23 |
0.93 |
0.353 |
1.23 (0.79~1.93) |
|
|
|
|
|
PLT |
0.01 |
0.00 |
2.10 |
0.036 |
1.01 (1.01~1.01) |
0.01 |
0.00 |
3.32 |
<0.001 |
1.01 (1.01~1.02) |
Hb |
−0.01 |
0.01 |
−1.21 |
0.225 |
0.99 (0.97~1.01) |
|
|
|
|
|
GGT |
−0.01 |
0.00 |
−3.28 |
0.001 |
0.99 (0.98~0.99) |
−0.01 |
0.00 |
−2.77 |
0.006 |
0.99 (0.98~0.99) |
ALP |
−0.00 |
0.00 |
−0.09 |
0.927 |
1.00 (1.00~1.00) |
|
|
|
|
|
TBA |
0.00 |
0.01 |
0.05 |
0.960 |
1.00 (0.99~1.01) |
|
|
|
|
|
LDH |
−0.01 |
0.00 |
−2.67 |
0.008 |
0.99 (0.99~0.99) |
−0.00 |
0.00 |
−1.50 |
0.134 |
1.00 (0.99~1.00) |
ACHE |
0.01 |
0.00 |
2.64 |
0.008 |
1.01 (1.01~1.01) |
0.00 |
0.00 |
0.37 |
0.709 |
1.00 (1.00~1.00) |
ADA |
−0.05 |
0.02 |
−2.54 |
0.011 |
0.95 (0.91~0.99) |
0.01 |
0.03 |
0.24 |
0.813 |
1.01 (0.95~1.07) |
Fib |
−0.60 |
0.17 |
−3.46 |
<0.001 |
0.55 (0.39~0.77) |
−1.14 |
0.25 |
−4.62 |
<0.001 |
0.32 (0.20~0.52) |
TT |
−0.04 |
0.07 |
−0.50 |
0.617 |
0.96 (0.83~1.11) |
|
|
|
|
|
APTT |
0.02 |
0.03 |
0.62 |
0.535 |
1.02 (0.96~1.07) |
|
|
|
|
|
CA125 |
−0.00 |
0.00 |
−0.11 |
0.916 |
1.00 (0.99~1.00) |
|
|
|
|
|
CA19-9 |
−0.01 |
0.01 |
−1.18 |
0.239 |
0.99 (0.98~1.00) |
|
|
|
|
|
CEA |
0.02 |
0.04 |
0.51 |
0.610 |
1.02 (0.94~1.10) |
|
|
|
|
|
ALB |
0.06 |
0.03 |
2.18 |
0.029 |
1.06 (1.01~1.12) |
0.22 |
0.09 |
2.32 |
0.020 |
1.24 (1.03~1.49) |
PA |
0.00 |
0.00 |
1.90 |
0.058 |
1.00 (1.00~1.01) |
0.00 |
0.00 |
0.13 |
0.897 |
1.00 (0.99~1.01) |
ALT |
−0.00 |
0.00 |
−0.65 |
0.514 |
1.00 (0.99~1.01) |
|
|
|
|
|
AST |
−0.00 |
0.01 |
−0.45 |
0.656 |
1.00 (0.99~1.01) |
|
|
|
|
|
TB |
−0.02 |
0.01 |
−1.42 |
0.156 |
0.98 (0.96~1.01) |
|
|
|
|
|
Cr |
−0.01 |
0.01 |
−0.98 |
0.327 |
0.99 (0.97~1.01) |
|
|
|
|
|
PT |
0.03 |
0.01 |
3.62 |
<0.001 |
1.03 (1.02~1.05) |
0.04 |
0.01 |
3.53 |
<0.001 |
1.04 (1.02~1.07) |
NLR |
−0.09 |
0.08 |
−1.06 |
0.291 |
0.92 (0.78~1.08) |
|
|
|
|
|
PLR |
0.00 |
0.00 |
0.81 |
0.416 |
1.00 (1.00~1.01) |
|
|
|
|
|
PNI |
0.04 |
0.02 |
2.15 |
0.031 |
1.05 (1.01~1.09) |
−0.14 |
0.06 |
−2.21 |
0.027 |
0.87 (0.77~0.98) |
3.3. 诊断模型的开发和评估
利用上述筛选出的7个关键特征,基于6种不同的机器学习算法分别构建预测模型,包括DT、Logistic、Kknn、RF、SVM和Xgboost。结果表明,RF模型的AUC值均明显高于其他机器学习模型(图3(a))。对训练队列建立的6个模型的AUC值进一步检查表明,RF模型的AUC值为0.829,准确性为0.748,阳性预测值为0.768,灵敏度为0.761,特异性为0.725,F1评分为0.747 (表4)。对内部队列的验证结果同样表明,RF模型的AUC值为0.889,均提示RF模型拥有最佳的预测效能。为了进一步评估开发的6个机器学习模型的临床有效性,采用DCA曲线进行评估,结果显示,RF模型同样具有最高的临床效用(图3(b))。为了进一步检验RF模型的预测结果和观察结果之间的一致性,采用校准曲线进行评价。结果显示,RF模型的校准曲线的对角线虚线紧密对齐,表明该模型的预测结果和观察结果之间具有良好的一致性(图3(c))。
Table 4. Diagnostic performance of each model in the cohort
表4. 队列中每个模型的诊断性能
模型 |
曲线下面积(95% CI) |
准确性 |
阳性预测值 |
灵敏度 |
特异性 |
F1评分 |
训练集 |
|
|
|
|
|
|
随机森林 |
0.829 |
0.748 |
0.768 |
0.761 |
0.725 |
0.747 |
逻辑回归 |
0.789 |
0.702 |
0.737 |
0.714 |
0.712 |
0.707 |
决策树 |
0.719 |
0.642 |
0.704 |
0.589 |
0.695 |
0.621 |
K-近邻 |
0.740 |
0.694 |
0.745 |
0.701 |
0.681 |
0.697 |
极端梯度提升 |
0.652 |
0.602 |
0.606 |
0.639 |
0.552 |
0.612 |
向量机 |
0.736 |
0.688 |
0.724 |
0.682 |
0.708 |
0.686 |
测试集 |
|
|
|
|
|
|
随机森林 |
0.889 |
0.723 |
0.805 |
0.708 |
0.758 |
0.695 |
逻辑回归 |
0.858 |
0.743 |
0.812 |
0.792 |
0.792 |
0.728 |
决策树 |
0.548 |
0.587 |
0.522 |
0.583 |
0.525 |
0.532 |
K-近邻 |
0.864 |
0.707 |
0.727 |
0.775 |
0.725 |
0.678 |
极端梯度提升 |
0.786 |
0.747 |
0.763 |
0.767 |
0.750 |
0.716 |
向量机 |
0.858 |
0.703 |
0.797 |
0.767 |
0.741 |
0.698 |
![]()
Figure 3. Performance comparison of six models in the training cohort. (a) ROC curves of the six models in the training cohort; (b) DCA curves of the six models in the training cohort; (c) Calibration curve of the random forest model in the training cohort. Decision tree: Decision tree model; logistic: Logistic regression model; kknn: K-nearest neighbors model; Random forest: Random forest model; svm: Support vector machine model; xgb: Extreme gradient boosting model
图3. 训练队列六个模型的性能比较。(a) 6种模型训练队列的ROC曲线;(b) 6种模型训练队列的DCA曲线;(c) 随机森林模型训练队列的校准曲线。Decision tree:决策树模型;logistic:逻辑回归模型;kknn:K-近邻模型;Random forest:随机森林模型;svm:支持向量机模型;xgb:极端梯度提升模型
3.4. 模型解释
为了进一步加强对RF模型所选的7个关键特征变量(包括年龄、血小板计数、GGT、纤维蛋白原、白蛋白、PT百分活度、预后营养指数水平)的全面理解,我们采用了SHAP算法来强调它们在瑞戈非尼治疗前预测门静脉血流动力学的最佳RF模型中的重要性。图中的特征进行Shapley加法解释(SHAP)算法,按重要性排序,最上面的特征是对模型预测影响最大的重要特征,最下面的特征是影响最小的特征。图4描述了这7个风险因素的层次组织,强调了它们在模型中的重要性。x轴代表SHAP值,表示每个因素的重要性。我们对6种模型进行SHAP分析(见附录图S1),并最终绘制了六种模型特征重要性排序的桑基图(见附录图S2),最终特征重要性的排序与随机森林模型的SHAP排序相一致,这再次说明了随机森林模型的有效性。7种指标与门静脉血流动力学机制之间的紧密联系表明它们作为临床预测门静脉压力变化的可靠指标的价值。
PT为凝血酶原活动度;Fib为纤维蛋白原;GGT为γ-谷氨酰转肽酶;Age为年龄;PLT为血小板计数;ALB为白蛋白;PNI为预后营养指数
Figure 4. RF model based on the SHAP algorithm
图4. 基于SHAP算法的RF模型
4. 讨论
本研究基于治疗前的临床特征,使用6种机器学习算法——决策树(DT)、逻辑回归(Logistic)、k近邻(Kknn)、随机森林(RF)、支持向量机(SVM)和极端梯度提升(Xgboost)——开发并验证了临床预测模型,该模型旨在利用治疗前基线临床资料构建瑞戈非尼治疗后门静脉压力变化的预测模型。运用shapley值分析,建立了可解释的机器学习模型,直观地展示了每个变量的重要性,确保对所选变量的全面理解。引入了一种简单、准确的门静脉压力预测工具,我们挑选出年龄、血小板计数、GGT、纤维蛋白原、白蛋白、PT百分活度和预后营养指数水平共7个更具重要性的变量,都是与门静脉压力发展密切相关的独立危险因素,这些指标容易获取,且实用性高。结果表明,RF模型在具有卓越的预测能力。AUC值、DCA曲线和校准曲线均表明,由七个关键特征构建的随机森林模型具有最佳的预测性能,优于其他传统模型。目前有关肝恶性肿瘤晚期二线靶向药物瑞戈非尼临床治疗期间对患者门静脉血流动力学的影响尚无文献报道,本研究弥补了这一项空白。这项研究的结果和开发的临床预测模型将帮助临床医生为合并门脉高压的肝恶性肿瘤患者的系统性个体化诊疗策略的选择提供一定的理论依据。
最新的中国指南推荐阿替利珠单抗加贝伐珠单抗、信迪力单抗加贝伐珠单抗类似物、仑伐替尼、索拉非尼、多纳非尼和FOLFOX (亚叶酸、氟尿嘧啶和奥沙利铂)化疗作为一线治疗,没有优先治疗[9]。瑞戈非尼、阿帕替尼、卡瑞利珠单抗和替雷利珠单抗已被添加为索拉非尼治疗后进展患者的二线全身治疗。现实生活中采用的全身疗法非常复杂,具有各种组合方式和不同的顺序。在既往的研究中,通过对门静脉充血指数的比较,索拉非尼被证实可以改善门静脉高压患者的门静脉循环侧枝,从而降低门静脉压力[10],而仑伐替尼被证实可能是一种加重门静脉高压的药物[11]。本研究证实瑞戈非尼作为目前肝细胞癌系统性治疗的二线药物可能起到缓解门静脉高压的作用,有望指导临床医师选择个体化的肝细胞癌一线序贯二线治疗方案。
在我们中心进行的研究发现,较高水平的凝血酶原时间活动度(PT百分活度)、血小板和血清白蛋白水平是瑞戈非尼治疗后门静脉压力降低的保护因素,较高的年龄、GGT、纤维蛋白原和预后营养指数水平是瑞戈非尼治疗后门静脉压力升高的危险因素。肝脏纤维化进行性积累,可逐渐演变为肝硬化及其危及生命的并发症,如肝细胞癌、门静脉高压症、肝功能衰竭等。Boursier J等发现,年龄、GGT、血小板计数和PT百分活度可作为无创诊断晚期肝纤维化和肝硬化的重要因子[12],Reiniš J等纳入1232名慢性肝病患者,发现血小板计数、GGT、活化部分凝血活酶时间可无创评估肝硬化患者门静脉高压症的严重程度[13],Nery F对1243名伴有门静脉血栓形成的肝硬化患者进行一项纵向研究,发现肝病进展和凝血酶原时间、血清白蛋白水平独立相关[14]。这与我们的研究结果相一致。
然而,这项研究仍存在局限性。首先,作为一项回顾性研究,在患者选择方面存在固有的偏倚,由于瑞戈非尼药物适用的对象为一线靶向药物治疗失败后的晚期肝细胞癌患者,这些晚期患者的合并症和用药史往往非常复杂,对这些混杂因素难以充分控制。未来希望能够在多中心大样本的队列研究中验证本研究的结果。其次,由于超声数据是由不同超声医师采集的,存在受主观影响的可能性。但由于本研究纳入的超声数据为客观的定量数据,因此受主观影响小。第三,由于HCC一线序贯二线治疗方案复杂,不同中心的标准和方案也不相一致。未来计划进行多中心前瞻性研究,进一步探究瑞戈非尼对晚期肝细胞癌患者的门静脉血流动力学的影响。
5. 结论
本研究基于机器学习算法,结合年龄、血小板计数、GGT、纤维蛋白原、白蛋白、PT百分活度、预后营养指数水平等7个关键特征,构建了最佳的随机森林预测模型。多种评价方式均表明其在判断瑞戈非尼治疗后门静脉血流动力学变化方面表现出良好的预测能力。有助于在指导晚期肝细胞癌患者的个性化精准治疗方面发挥越来越重要的价值。
附 录
(a) 随机森林模型;(b) 逻辑回归模型;(c) 决策树模型;(d) k近邻模型;(e) 极端梯度提升模型;(f) 向量机模型。PT为凝血酶原活动度;Fib为纤维蛋白原;GGT为γ-谷氨酰转肽酶;Age为年龄;PLT为血小板计数;ALB为白蛋白;PNI为预后营养指数。
Figure S1. Feature importance analysis of six models
图S1. 六种模型特征重要性的分析
PT为凝血酶原活动度;Fib为纤维蛋白原;GGT为γ-谷氨酰转肽酶;Age为年龄;PLT为血小板计数;ALB为白蛋白;PNI为预后营养指数。
Figure S2. Sankey diagram of feature importance ranking for six models
图S2. 六种模型特征重要性排序的桑基图
Table S1. The baseline characteristics of training/test set
表S1. 训练集、测试集的基线资料
变量 |
共计 (n = 202) |
训练集 (n = 141) |
测试集 (n = 61) |
Statistic |
P value |
年龄 |
61.50 (54.00, 66.00) |
62.00 (54.00, 66.00) |
61.00 (55.00, 66.00) |
Z = −0.17 |
0.865 |
性别 |
|
|
|
χ2 = 0.00 |
0.980 |
女 |
30 (14.85) |
21 (14.89) |
9 (14.75) |
|
|
男 |
172 (85.15) |
120 (85.11) |
52 (85.25) |
|
|
HBV |
|
|
|
χ2 = 0.34 |
0.563 |
无 |
31 (15.35) |
23 (16.31) |
8 (13.11) |
|
|
有 |
171 (84.65) |
118 (83.69) |
53 (86.89) |
|
|
AFP |
|
|
|
χ2 = 0.64 |
0.424 |
<200 |
162 (80.20) |
111 (78.72) |
51 (83.61) |
|
|
≥200 |
40 (19.80) |
30 (21.28) |
10 (16.39) |
|
|
肿瘤大小 |
|
|
|
χ2 = 1.77 |
0.184 |
<5 cm |
66 (32.67) |
42 (29.79) |
24 (39.34) |
|
|
≥5 cm |
136 (67.33) |
99 (70.21) |
37 (60.66) |
|
|
肿瘤数量 |
|
|
|
χ2 = 0.11 |
0.743 |
单发 |
37 (18.32) |
25 (17.73) |
12 (19.67) |
|
|
多发 |
165 (81.68) |
116 (82.27) |
49 (80.33) |
|
|
肝硬化 |
|
|
|
χ2 = 0.43 |
0.512 |
无 |
47 (23.27) |
31 (21.99) |
16 (26.23) |
|
|
有 |
155 (76.73) |
110 (78.01) |
45 (73.77) |
|
|
BCLC分期 |
|
|
|
χ2 = 1.20 |
0.550 |
0 |
16 (7.92) |
13 (9.22) |
3 (4.92) |
|
|
1 |
90 (44.55) |
63 (44.68) |
27 (44.26) |
|
|
2 |
96 (47.52) |
65 (46.10) |
31 (50.82) |
|
|
ALBI分级 |
|
|
|
χ2 = 0.14 |
0.932 |
1 |
73 (36.14) |
52 (36.88) |
21 (34.43) |
|
|
2 |
102 (50.50) |
70 (49.65) |
32 (52.46) |
|
|
3 |
27 (13.37) |
19 (13.48) |
8 (13.11) |
|
|
WBC |
4.41 (3.56, 5.62) |
4.39 (3.51, 5.74) |
4.41 (3.67, 5.48) |
Z = −0.43 |
0.669 |
N |
2.78 (2.18, 3.77) |
2.72 (2.16, 3.81) |
2.95 (2.23, 3.66) |
Z = −0.72 |
0.469 |
L |
1.31 (1.01, 1.77) |
1.35 (0.97, 1.75) |
1.23 (1.10, 1.89) |
Z = −0.06 |
0.949 |
PLT |
118.00 (83.25, 159.75) |
119.00 (87.00, 162.00) |
118.00 (82.00, 158.00) |
Z = −0.37 |
0.711 |
Hb |
131.43 ± 16.91 |
131.64 ± 15.89 |
130.93 ± 19.20 |
t = 0.27 |
0.787 |
GGT |
44.50 (25.05, 73.75) |
44.00 (23.00, 72.00) |
47.00 (30.00, 75.20) |
Z = −0.98 |
0.327 |
ALP |
84.50 (63.00, 136.75) |
89.00 (72.00, 143.00) |
93.00 (55.00, 131.00) |
Z = −1.47 |
0.141 |
TBA |
8.82 (5.31, 17.82) |
8.52 (5.12, 17.40) |
12.60 (6.18, 20.40) |
Z = −1.41 |
0.158 |
LDH |
242.45 (201.62, 276.75) |
230.00 (199.00, 276.00) |
252.00 (217.00, 277.00) |
Z = −1.60 |
0.111 |
ACHE |
7076.00 (5534.75, 8747.75) |
7152.00 (5500.00, 8876.00) |
6876.00 (5578.00, 8094.00) |
Z = −0.49 |
0.624 |
ADA |
16.00 (11.00, 19.00) |
15.90 (11.00, 19.00) |
16.00 (12.00, 20.00) |
Z = −1.23 |
0.219 |
Fib |
2.68 (2.21, 3.29) |
2.61 (2.15, 3.23) |
2.85 (2.29, 3.75) |
Z = −1.48 |
0.138 |
TT |
18.29 ± 1.91 |
18.40 ± 1.75 |
18.02 ± 2.23 |
t = 1.29 |
0.197 |
APTT |
32.71 ± 5.15 |
32.87 ± 5.17 |
32.36 ± 5.12 |
t = 0.65 |
0.518 |
CA125 |
11.30 (8.30, 19.15) |
10.36 (7.95, 19.00) |
13.89 (9.07, 19.20) |
Z = −0.89 |
0.373 |
CA19-9 |
15.37 (8.07, 28.12) |
15.33 (8.07, 26.50) |
15.80 (9.77, 28.24) |
Z = −0.82 |
0.413 |
CEA |
2.51 (1.79, 4.09) |
2.51 (1.72, 4.00) |
2.56 (1.88, 4.27) |
Z = −0.83 |
0.407 |
ALB |
38.40 ± 5.60 |
38.50 ± 5.39 |
38.16 ± 6.09 |
t = 0.40 |
0.688 |
PA |
175.00 (145.07, 224.82) |
175.00 (145.30, 228.80) |
170.90 (144.00, 197.00) |
Z = −1.03 |
0.302 |
ALT |
27.50 (20.20, 48.25) |
26.00 (20.20, 38.90) |
33.00 (22.00, 50.00) |
Z = −1.23 |
0.219 |
AST |
35.65 (27.00, 51.15) |
34.00 (26.40, 49.00) |
40.10 (28.40, 60.00) |
Z = −1.55 |
0.120 |
TB |
18.54 (13.20, 26.57) |
18.55 (13.30, 26.57) |
17.78 (13.17, 27.70) |
Z = −0.26 |
0.797 |
Cr |
72.00 (59.70, 80.75) |
72.00 (60.00, 81.00) |
70.80 (59.60, 77.00) |
Z = −0.49 |
0.623 |
PT |
81.25 (68.78, 89.90) |
80.00 (68.40, 89.60) |
82.00 (73.00, 90.10) |
Z = −0.61 |
0.542 |
NLR |
2.18 (1.47, 2.95) |
2.18 (1.47, 2.94) |
2.14 (1.49, 3.09) |
Z = −0.18 |
0.857 |
PLR |
87.26 (59.58, 134.77) |
85.71 (60.67, 135.46) |
88.66 (51.97, 131.37) |
Z = −0.20 |
0.840 |
PNI |
45.53 ± 7.03 |
45.61 ± 6.88 |
45.34 ± 7.43 |
t = 0.25 |
0.804 |
注:HBV为乙型肝炎;AFP为甲胎蛋白;ALBI分级为白蛋白–胆红素评分;WBC为白细胞计数;N为中性粒细胞计数;L为淋巴细胞计数;PLT为血小板计数;Hb为血红蛋白计数;GGT为γ-谷氨酰转肽酶;ALP为碱性磷酸酶;TBA为总胆汁酸;LDH为碱性磷酸酶;ACHE为胆碱酯酶;ADA为腺苷脱氢酶;Fib为纤维蛋白原;TT为凝血酶时间;APTT为活化部分凝血活酶时间;CA125为糖类抗原125;CA19-9为糖类抗原19-9;CEA为癌胚抗原;ALB为白蛋白;PA为前白蛋白;ALT为谷丙转氨酶;AST为谷草转氨酶;TB为总胆红素;Cr为肌酐;PT为凝血酶原活动度;NLR为为中性粒细胞计数与淋巴细胞计数比值;PLR为血小板计数与淋巴细胞计数比值;PNI为预后营养指数。
NOTES
*通讯作者。