1. 引言
肝切除术目前仍然是治疗肝细胞癌(hepatocellular carcinoma, HCC)的主要手段[1]。经过严格筛选的肝细胞癌患者接受根治性肝切除术后可获得显著的生存效益。其中,右半肝切除术是常用的术式之一,但该手术需要平衡彻底切除肿瘤与保留足够的功能性肝体积之间的关系,在降低肿瘤复发风险的同时,避免肝切除术后肝功能衰竭(posthepatectomy liver failure, PHLF)。PHLF是肝切除术后最严重的并发症,也是患者围手术期死亡的主要原因[2] [3]。文献报道右半肝切除时PHLF发生率在12%~28% [4]-[6]。根据国际肝脏外科学研究组(ISGLS)分级标准,B/C级PHLF,即术后显著性肝功能衰竭[7]的患者术后死亡率可达21% [4]。因此,建立可靠的术前预测模型对筛选合适的手术患者及优化围手术期管理具有重要意义。
80%~90%的HCC患者伴有不同程度的肝纤维化[8],肝纤维化晚期通常导致门脉高压。近年来,研究发现门脉高压是肝切除术后显著性肝衰竭的重要预测因素[6] [9] [10]。目前国际指南推荐采用测定肝静脉压力梯度(HVPG)作为门脉高压评估的金标准[11] [12],但由于其有创性和操作复杂性,在临床实践中难以常规开展。相比之下,基于临床表现(如食管胃底静脉曲张、腹水、脾肿大和/或血小板减少等)的无创评估方法更具可行性,VAST评分便整合了这些相关指标,VAST评分 ≥ 2分表示存在门脉高压[13] [14]。本研究拟探讨VAST评分联合其他常规术前指标对HCC患者右半肝切除术后发生术后显著性肝衰竭的预测价值。
2. 资料与方法
2.1. 研究对象
回顾性分析2014年3月至2022年11月期间在本院行右半肝切除术的HCC患者的影像资料和临床资料。纳入标准:1) 18~75岁;2) 经病理证实为HCC;3) 首次行右半肝切除术;4) 术前一个月内行上腹部CT增强检查。排除标准:1) 合并其他恶性肿瘤;2) 术后资料记录不完整;3) 上腹部CT图像缺失或有伪影影响分析。最终纳入206例HCC患者。
2.2. 临床评分
VAST评分通过以下标准计算[13] [14]:术前上腹部CT图像上存在食管或胃静脉曲张、腹水、脾脏最长径 > 13 cm评为1分,外周血血小板计数低于150 × 109/L评为1分,否则,评为0分。VAST评分得分由以上四个指标的得分简单相加,因此,VAST评分范围为0至4分,评分 ≥ 2分表示存在门脉高压。两位放射科医生独立计算评分,一位有3年腹部影像经验,另一位有10年经验,且两人都对患者数据不知情。评分上的分歧通过讨论解决。病例示例见图1。
注:55岁,男性,上腹部CT横轴位显示食管下段壁增厚,管腔内出现高密度血管影(图(A)红色三角处),存在食管静脉曲张(评为1分),未见腹水(评为0分),未见脾肿大(评为0分),外周血血小板计数为205 × 109/L (评为0分),VAST评分 < 2分,这例患者在右半肝切除后未发生术后显著性肝功能衰竭。50岁,男性,上腹部CT横轴位脾最长径为13.2 cm (图(B)红色三角处),存在脾肿大(评为1分),未见腹水(评为0分),未见食管或胃底静脉曲张(评为0分),外周血血小板计数为121 × 109/L (评为1分),VAST评分 = 2分,这例患者在右半肝切除后发生了术后显著性肝功能衰竭。
Figure 1. Image of the upper abdomen in the portal venous phase of CT
图1. 上腹部CT门静脉期图像
每例患者计算白蛋白–胆红素(albumin-bilirubin score, ALBI)评分[15],公式为0.66 × log10(TBIL, μmol/L) − 0.085 × (ALB, g/L)。终末期肝病模型评分(model for end-stage liver disease, MELD)评分[16]公式为11.2 × ln(INR) + 9.57 × ln(Cr, mg/dL) + 3.78 × ln(TBIL, mg/dL) + 6.43 × (胆汁性、酒精性 = 0,其他 = 1)。天冬氨酸氨基转移酶–血小板比值指数(APRI) [17]公式为(AST水平/正常值上限AST)/血小板(× 109/L) × 100。纤维化-4指数[17]公式为[AST (U/L) × 年龄(岁)]/[血小板(× 109/L) × ALT0.5 (U/L)]。
2.3. 残肝体积测定
将包含动脉期、门静脉期和延迟期在内的上腹部薄层(5 mm) CT图像导入3D外科模拟手术系统(Myrian XP Liver 1.30.79.4; Intrasense, Montpellier, France)。使用门静脉相位图像进行分析。通过三维重建和模拟肝切除,测算出肝脏总体积、肿瘤体积、预切除正常肝体积及残肝体积(remnant liver volume, RLV)。残肝体积体重比(remnant liver volume to body weight rate, RLV-BWR)公式为模拟测量的RLV/体重。
2.4. 肝切除术后显著性肝衰竭定义
肝切除术后显著性肝衰竭定义为B级或C级PHLF [7],即在术后第5天或之后国际标准化比值 > 1.2和总胆红素 > 21 μmol/L,B级PHLF术后需要非常规护理,C级PHLF术后需要侵入性治疗[18]。
2.5. 统计分析
使用SPSS 26.0、R Studio 4.4.3对数据进行统计分析。P < 0.05表示具有统计学意义。
连续变量若数据呈正态分布,描述为均数 ± 标准差(
),组间差异采用独立样本t检验评估;否则,描述为中位数(P25, P75),组间差异采用Mann-Whitney U检验评估。分类变量描述为n (%),组间差异则采用卡方检验或Fisher精确检验评估。本研究通过计算Kappa值来量化不同观察者对VAST评分判定的一致性程度。使用单因素Logistic回归分析,初步筛选出与肝切除术后显著性肝衰竭相关的变量(P值 < 0.05),排除共线性后,将相关的变量纳入多因素Logistic回归以获得最终的独立预测因素。为评估ICG-R15数据缺失(4例,1.94%)的影响,本研究采用多重插补法作为主要分析方法,并辅以原始数据分析和均值插补法进行验证。比较对三种方法所得的Logistic回归结果,证实研究结果的稳健性。基于独立预测因素构建列线图模型。采用Bootstrap等量有放回重复抽样1000次的方法对模型进行内部验证,评估列线图模型的稳定性。绘制受试者工作特征曲线(receiver operating characteristic curve, ROC曲线),计算其曲线下面积(area under the receiver operating characteristic curve, AUC),评估列线图模型的区分能力。绘制校准曲线、计算Brier分数,评估列线图模型预测概率与实际观察概率的一致性。绘制决策曲线,可视化不同高风险阈值概率下的净收益以评估列线图模型的临床决策效益。将列线图模型与常见的临床评分模型进行比较。
3. 结果
3.1. 患者的基线特征比较
在206例HCC患者中,男性170例(82.5%),女性36例(17.5%),平均年龄48岁。发生术后显著性肝衰竭34例(16.5%)。与非术后显著性肝衰竭组相比,术后显著性肝衰竭组RLV-BWR更低、凝血酶原时间更长、总胆红素水平更高、国际标准化比值更大、肌酐水平更高、MELD评分更高、VAST评分 ≥ 2分占比更高。其余临床资料基线特征在非术后显著性肝衰竭组和术后显著性肝衰竭组之间具有可比性,见表1。
Table 1. Comparison of baseline characteristics of HCC patients
表1. HCC患者临床资料基线特征的比较
变量 |
非术后显著性肝衰竭(n = 172) |
术后显著性肝衰竭(n = 34) |
P值 |
年龄(岁) |
47.38 ± 11.21 |
50.88 ± 11.71 |
0.115 |
性别 |
|
|
0.051 |
女性 |
34 (19.8%) |
2 (5.9%) |
|
男性 |
138 (80.2%) |
32 (94.1%) |
|
体重指数(kg/m2) |
21.69 (19.38, 24.02) |
20.54 (19.73, 23.82) |
0.504 |
RLV-BWR (%) |
0.90 (0.77, 1.07) |
0.76 (0.70, 0.85) |
0.001 |
乙型肝炎 |
150(87.2%) |
26(76.4%) |
0.105 |
凝血酶原时间(秒) |
12.50 (11.60, 13.20) |
12.85 (12.30, 13.58) |
0.028 |
白蛋白(g/L) |
36.23 ± 4.30 |
37.24 ± 4.87 |
0.268 |
总胆红素(μmol/L) |
13.45 (10.20, 17.10) |
14.80 (12.10, 21.85) |
0.015 |
ALT (U/L) |
39.50 (28.00, 63.25) |
40.00 (26.50, 63.75) |
0.795 |
AST (U/L) |
59.50(40.00, 95.25) |
51.00 (38.25, 77.75) |
0.311 |
国际标准化比值 |
1.02 (0.95, 1.09) |
1.07 (1.00, 1.14) |
0.021 |
肌酐(μmol/L) |
72.44 ± 13.87 |
78.74 ± 14.60 |
0.025 |
血小板(×109/L) |
235.60 (175.75, 310.00) |
213.00 (162.50, 255.50) |
0.060 |
术前存在肝硬化 |
101 (58.7%) |
25 (73.5%) |
0.105 |
Child-Pugh分级 |
|
|
>0.999 |
A |
156 (90.7%) |
31 (91.2%) |
|
B |
16 (9.3%) |
3 (8.8%) |
|
ICG-R15 |
5.0 0(3.00, 7.00) |
5.00 (3.00, 6.75) |
0.789 |
ALBI评分 |
−2.34 ± 0.40 |
−2.38 ± 0.47 |
0.675 |
MELD评分 |
5.17 ± 1.23 |
6.14 ± 1.24 |
<0.001 |
VAST评分 ≥ 2分 |
9 (5.2%) |
7 (20.6%) |
0.007 |
注:分类变量表示为n (%),连续变量表示为均值 ± 标准差(
)或中位数(P25, P75),RLV-BWR为残肝体积体重比;AST为天冬氨酸氨基转移酶;ALT为丙氨酸氨基转移酶;ICG-R15为吲哚菁绿15分钟滞留率;ALBI评分为白蛋白–胆红素评分;MELD评分为终末期肝病模型评分。
3.2. VAST评分及其相关指标的观察者间一致性分析
VAST评分及其三个相关影像特征(食管胃底静脉曲张、腹水、脾肿大)的两名观察者间一致性程度很高。食管胃底静脉曲张、腹水、脾肿大、VAST评分(≥2分)的Kappa值分别为0.823 (95%置信区间为0.655~0.992)、0.950 (95%置信区间为0.901~0.998)、0.808 (95%置信区间为0.626~0.991)、0.878 (95%置信区间为0.761~0.996) (P值均 < 0.001)。
3.3. 二元Logistic回归分析确定肝切除术后显著性肝衰竭的独立预测因素
对变量进行单因素Logistic回归分析,结果显示,RLV-BWR、凝血酶原时间、肌酐、血小板计数、MELD评分、ICG-R15、VAST评分 ≥ 2分与肝切除术后显著性肝衰竭显著相关(P值均 < 0.05),见表2。对以上相关变量进行多重共线性检测,结果显示变量的方差膨胀因子均 < 5,变量间不存在多重共线性问题,见表3。将以上相关变量纳入多因素Logistic回归分析,结果显示,RLV-BWR、MELD评分、VAST评分 ≥ 2分是肝切除术后显著性肝衰竭的独立预测因素(P值均 < 0.05),见表4。
Table 2. Univariate Logistic regression analysis of significant liver failure after right hemihepatectomy
表2. 右半肝切除术后显著性肝功能衰竭发生的单因素Logistic回归分析
变量 |
OR (95%CI) |
P值 |
年龄(岁) |
1.028 (0.995, 1.063) |
0.101 |
性别 |
3.942 (0.900, 17.266) |
0.069 |
体重指数(kg/m2) |
0.967 (0.864, 1.081) |
0.554 |
RLV-BWR (%) |
0.059 (0.008, 0.450) |
0.006 |
乙型肝炎 |
0.477 (0.192, 1.184) |
0.111 |
凝血酶原时间(秒) |
1.395 (1.052, 1.851) |
0.021 |
白蛋白(g/L) |
1.055 (0.968, 1.149) |
0.223 |
ALT (U/L) |
0.995 (0.984, 1.006) |
0.395 |
AST (U/L) |
0.993 (0.985, 1.002) |
0.123 |
肌酐(μmol/L) |
1.032 (1.005, 1.060) |
0.019 |
血小板(×109/L) |
0.995 (0.991, 1.000) |
0.044 |
术前肝硬化 |
1.953 (0.860, 4.434) |
0.110 |
Child-Pugh分级 |
0.944 (0.259, 3.434) |
0.930 |
ICG-R15 |
1.115 (1.012, 1.228) |
0.028 |
ALBI评分 |
0.800 (0.320, 2.001) |
0.633 |
MELD评分 |
1.881 (1.356, 2.609) |
<0.001 |
VAST评分 ≥ 2分 |
4.695 (1.613, 13.667) |
0.005 |
注:RLV-BWR为残肝体积体重比;AST为天冬氨酸氨基转移酶;ALT为丙氨酸氨基转移酶;ICG-R15为吲哚菁绿15分钟滞留率;ALBI评分为白蛋白–胆红素评分;MELD评分为终末期肝病模型评分。
Table 3. Multicollinearity diagnostics among variables
表3. 变量之间的多重共线性诊断
变量 |
方差膨胀因子 |
容忍度 |
RLV-BWR |
1.063 |
0.940 |
凝血酶原时间 |
1.606 |
0.623 |
肌酐 |
2.867 |
0.349 |
血小板计数 |
1.204 |
0.830 |
MELD评分 |
3.494 |
0.286 |
VAST评分 ≥ 2分 |
1.189 |
0.841 |
注:RLV-BWR为残肝体积体重比;MELD评分为终末期肝病模型评分。
Table 4. Multivariate Logistic regression analysis of significant liver failure after right hemihepatectomy
表4. 右半肝切除术后显著性肝功能衰竭发生的多因素Logistic回归分析
变量 |
OR (95%CI) |
P值 |
RLV-BWR |
0.034 (0.003, 0.340) |
0.004 |
VAST评分 ≥ 2分 |
4.480 (1.293, 15.523) |
0.018 |
MELD评分 |
1.775 (1.263, 2.496) |
0.001 |
注:OR为比值比;95%CI为95%置信区间;RLV-BWR为残肝体积体重比;MELD评分为终末期肝病模型评分。
3.4. 敏感性分析
三种不同缺失数据处理方法(原始数据分析、多重插补和均值插补)的单因素Logistic回归分析均显示,ICG-R15与肝切除术后显著性肝衰竭存在显著相关性(P值均 < 0.05)。然而,多因素Logistic回归分析结果一致表明,ICG-R15并非术后显著性肝衰竭的独立预测因素(P值均 < 0.05)。这一结果证实了ICG-R15作为非独立预测因素的结论不受缺失数据处理方法的影响,见表5。
Table 5. Sensitivity analysis of the association between ICG-R15 and significant posthepatectomy liver failure
表5. ICG-R15与肝切除术后显著性肝衰竭相关性的敏感性分析
|
单因素Logistic回归分析 |
多因素Logistic回归分析 |
处理方法 |
回归系数 |
OR (95%CI) |
P值 |
回归系数 |
OR (95%CI) |
P值 |
原始数据 |
0.108 |
1.114 (1.011, 1.227) |
0.029 |
0.065 |
1.067 (0.952, 1.195) |
0.263 |
均值插补 |
0.108 |
1.115 (1.011, 1.228) |
0.029 |
0.065 |
1.067 (0.952, 1.196) |
0.266 |
多重插补 |
0.109 |
1.115 (1.012, 1.228) |
0.028 |
0.065 |
1.067 (0.952, 1.195) |
0.265 |
注:所有多因素Logistic回归分析均纳入了变量RLV-BWR、凝血酶原时间、肌酐、血小板计数、MELD评分、ICG-R15、VAST评分 ≥ 2分。
3.5. 构建列线图模型并评估其性能
基于以上三个独立预测因素构建列线图模型,见图2。ROC曲线显示,列线图模型的AUC为0.772,95%CI为0.709~0.828。以最大约登指数处取最佳临界点,该临界点的敏感度为61.8%,特异度为83.7%,见图3(A)。校准曲线显示,列线图模型的Brier分数为0.114,模型的校准曲线与完美曲线贴合良好,表示列线图模型的预测结果与实际观测结果具有良好的一致性,见图3(B)。决策曲线显示,列线图模型在0.08~0.64的风险阈值区间均可获得正向净收益,表明列线图模型具有良好的临床决策效益,见图3(D)。
注:Points:分数刻度线;Total Points:总分数;Risk:肝切除术后显著性肝功能衰竭风险预测值;RLV-BWR:残肝体积体重比;MELD score:终末期肝病模型评分。
Figure 2. Nomogram prediction model for significant liver failure after right hemihepatectomy for hepatocellular carcinoma
图2. 肝细胞癌右半肝切除术后显著性肝功能衰竭的列线图预测模型
注:(A) 列线图模型的ROC曲线;(B) 列线图模型的校准曲线;(C) 列线图模型与ALBI评分模型、ICG-R15模型、MELD评分模型的ROC曲线比较;(D) 列线图模型与ALBI评分模型、ICG-R15模型、MELD评分模型的决策曲线比较。
Figure 3. Performance evaluation of the nomogram model
图3. 列线图模型的性能评估
3.6. 验证列线图模型性能
图4通过Bootstrap重抽样方法对列线图模型的性能指标进行了评估,结果显示列线图模型在多个关键指标上表现稳健,具有较高的可靠性和稳定性。AUC值集中在0.7到0.8之间,围绕原始列线图模型的AUC分布,显示了良好的区分能力,见图4(A)。准确率和精确率的平均值分别为0.855和0.674,分布亦较集中,说明模型表现稳定,能够可靠地进行分类,见图4(B)、图4(D)。尽管召回率和F1分数的平均值相对较低,分别为0.194和0.291,见图4(C)、图4(E),但这些指标的分布情况仍显示了模型在处理不平衡数据时具有一定的潜力。
注:该图展示了利用Bootstrap重抽样方法对列线图模型进行内部验证的结果。图(A)~(E)依次包括了五个性能指标的分布直方图:AUC (曲线下面积)、Accuracy (准确率)、Recall (召回率)、Precision (精确率)和F1 score (F1分数)。图(A)的红色参考线为原始列线图模型的AUC值,其他指标均为1000次Bootstrap重采样的均值,以分别评估原始性能与重采样稳定性。
Figure 4. Distribution of performance indicators of the nomogram model verified by Bootstrap resampling
图4. Bootstrap重抽样验证列线图模型性能指标分布
3.7. 列线图模型与常见临床评分模型的性能比较
将列线图模型的ROC曲线与ALBI评分、ICG-R15、MELD评分的ROC曲线进行比较,结果显示,列线图模型的AUC (0.772, 95%CI: 0.709~0.828)显著高于ALBI评分(0.510, 95%CI: 0.439~0.580)、ICG-R15 (0.668, 95%CI: 0.600~0.732)、MELD评分(0.536, 95%CI: 0.466~0.606),见图3(C)。决策曲线显示,列线图模型在0.08~0.64的风险阈值区间获得的净收益均高于ALBI评分、ICG-R15、MELD评分。
4. 讨论
本研究构建的列线图模型包含三个独立预测因素:VAST评分 ≥ 2分、RLV-BWR以及MELD评分。列线图表现出良好的预测性能,AUC值为0.772。此列线图可能有助于临床医生和患者权衡右半肝切除术的风险与收益。
部分HCC患者合并肝纤维化病变,其特征性的假小叶形成导致肝内微血管结构紊乱,肝窦毛细血管化伴随胶原沉积,显著增加肝内血管阻力,进而引发门静脉系统压力异常升高,最终形成门脉高压[19] [20]。门脉高压的准确评估对HCC手术患者的临床决策至关重要。现有研究证实,门脉高压不仅是肝切除术后显著性肝衰竭的独立危险因素[6] [8]-[10] [21],更是影响患者长期预后的关键预测指标。其潜在机制可能包括肝内血管阻力增加导致的门静脉系统血液动力学改变[22]、纤维化微环境影响肝细胞再生,以及肠道屏障功能异常引发的炎症反应[23] [24]。肝静脉压力梯度(HVPG)测量被视为门脉高压诊断的金标准,但其侵入性的操作特点(需要经颈静脉插管)和技术要求限制了在临床实践中的常规应用。这一技术局限性推动了基于影像学的门脉高压无创评估新技术的研发[25]。本研究的列线图模型证实了VAST评分 ≥ 2分可通过反映门脉高压作为HCC患者肝切除术后显著肝功能衰竭的独立预测因素。与VAST评分 < 2分的患者相比,VAST评分 ≥ 2分的患者术后发生显著性肝衰竭的风险增加4倍以上。这一发现与既往研究中确定的VAST评分2分临界值一致[13] [14],进一步支持了该评分在不同人群中的适用性。该评分无需依赖侵入性的内镜评估,为临床决策提供了更便捷的工具。
为确保肝恶性肿瘤切除术的安全性并预防术后显著性肝衰竭,术前必须对残肝体积进行全面评估。这一评估在拟行右半肝切除术的HCC患者中尤为重要,因其残肝体积相对较小,更易出现功能性肝组织不足的情况。RLV-BWR是常用的残肝体积指标之一,有研究表明,RLV-BWR可预测HCC右肝切除术后显著性肝衰竭,且预测的敏感度和特异度较高[26]。与既往文献相似,本研究结果显示RLV-BWR是HCC右半肝切除术后显著性肝衰竭的独立预测因素,且随着RLV-BWR的降低,术后发生显著性肝衰竭的风险逐渐升高。
MELD评分系统最初是为预测经颈静脉肝内门体分流术(TIPS)后患者的生存预后而开发的评估工具,现在也作为评估不同程度终末期肝病生存率的预测指标[16]。目前多项研究认为MELD评分与HCC肝切除术后显著性肝衰竭显著相关[21] [27]-[29]。与先前的报道一致,本研究结果显示MELD评分可作为HCC肝切除术后显著性肝衰竭的预测指标,MELD评分与术后发生显著性肝衰竭风险呈正相关。相比之下,Logistic回归未能完全显示出术后显著性肝衰竭与ALBI评分或ICG-R15之间的关联,这与ALBI评分或ICG-R15比MELD评分更好地预测术后显著性肝衰竭的研究结果相矛盾。这可能是因为本机构在术前常规计算ALBI评分和ICGR-15,以筛选出肝功能较好且适合行右半肝切除术的HCC患者,从而导致样本选择存在偏差。
尽管列线图模型被证明具有良好的预测性能,但仍存在一些局限性:1) 回顾性研究,存在研究对象的选择偏倚;2) 单中心研究,尽管内部验证支持研究结果,但缺乏其他中心的数据验证;3) 本研究中,85.4% (176/206)的HCC患者同时感染了慢性乙型肝炎,这是门脉高压的已知致病因素,未来需进一步验证结果是否适用于由其他病因(如酒精性肝病、丙型肝炎病毒感染等)引起的门脉高压症患者。
尽管存在这些限制,基于VAST评分 ≥ 2分、RLV-BWR以及MELD评分构建的列线图在预测HCC患者右半肝切除术后显著性肝衰竭方面仍表现出良好的性能,且性能优于传统单一的ALBI评分、ICG-R15、MELD评分模型。
基金项目
本研究是广西重点研发计划项目(桂科AB24010038)。
NOTES
*通讯作者。