肺炎克雷伯肝脓肿侵袭综合征的危险因素及预测模型构建
Risk Factors and Predictive Model Construction of Klebsiella pneumoniae Liver Abscess Invasion Syndrome
DOI: 10.12677/acm.2025.1541328, PDF, HTML, XML,   
作者: 吕小菲, 马承泰*:青岛大学附属医院急诊科,山东 青岛;毛冰格:黑龙江省森工总医院重症医学科,黑龙江 哈尔滨
关键词: 肝脓肿肺炎克雷伯杆菌侵袭综合征预测模型列线图Liver Abscess Klebsiella pneumoniae Invasion Syndrome Prediction Model Nomogram
摘要: 目的:回顾性分析肺炎克雷伯菌肝脓肿综合征患者发生侵袭综合征的危险因素,构建和验证列线图预测模型,并进行相关验证。方法:检索收集青岛大学附属医院2017.12~2023.12期间第一诊断为肝脓肿且引流液培养为单一肺炎克雷伯杆菌的389例患者的病例资料,应用多因素logistic回归筛选肝外侵袭的独立预测因素构建列线图,绘制受试者工作特征(ROC)曲线对模型的预测效能进行评价,校准曲线对模型的校准度进行评价,临床决策曲线(DCA)评价模型的临床效益,Bootstrap法进行内部验证评估模型的稳定性和泛化能力。结果:本项研究总共纳入389例患者作为研究对象,根据肝外表现分为未侵袭组和侵袭组两组,其中未侵袭组332例,侵袭组57例,两组在年龄、性别之间均没有统计学差异。最终筛选出sofa评分(OR = 1.306, 95% CI: 1.136~1.507, P < 0.001)、中性粒细胞百分率(OR = 1.089, 95% CI: 1.029~1.152, P = 0.004)、空腹血糖(OR = 1.194, 95% CI: 1.086~1.311, P < 0.001)、白蛋白(OR = 0.901, 95% CI: 0.840~0.967, P = 0.004)为肝外侵袭的独立预测因素。纳入以上危险因素制作列线图(nomogram)并进行模型验证,ROC曲线示AUC = 0.840 (95% CI: 0.784~0.897),Hosmer-Lemeshow检验P = 0.66 > 0.05,校准曲线图示校准曲线与理想曲线贴合良好,临床决策曲线(DCA)图显示当阈值概率在0.01~0.99时模型均能产生更好的临床效益。结论:sofa评分、中性粒细胞百分率、空腹血糖、白蛋白是肺炎克雷伯菌肝脓肿患者发生侵袭综合征的独立危险因素,根据此指标可构建有效的肺炎克雷伯肝脓肿侵袭综合征的预测模型,具有一定的临床应用价值。
Abstract: Objective: To retrospectively analyze the risk factors of invasive syndrome in patients with Klebsiella pneumoniae liver abscess syndrome, construct and verify the nomogram prediction model, and carry out relevant verification. Method: The case data of 389 patients who were first diagnosed with liver abscess and whose drainage fluid was cultured as a single KP in the Affiliated Hospital of Qingdao University from 2017.12 to 2023.12 were collected. Multivariate logistic regression was used to screen the independent predictors of extrahepatic invasion to construct a nomogram. The receiver operating characteristic (ROC) curve was drawn to evaluate the predictive efficacy of the model, the calibration curve was used to evaluate the calibration of the model, the clinical decision curve (DCA) was used to evaluate the clinical benefits of the model, and the Bootstrap method was used to evaluate the stability and generalization ability of the model. Results: A total of 389 patients were included in this study. According to extrahepatic manifestations, they were divided into non-invasive group and invasive group, including 332 cases in non-invasive group and 57 cases in invasive group. There was no significant difference in age and sex between the two groups. Finally, sofa score (OR = 1.306, 95% CI: 1.136~1.507, P < 0.001), neutrophil percentage (OR = 1.089, 95% CI: 1.029~1.152, P = 0.004), fasting blood glucose (OR = 1.194, 95% CI: 1.086~1.311, P < 0.001), albumin (OR = 0.901, 95% CI: 0.840~0.967, P = 0.004) were independent predictors of extrahepatic invasion. The ROC curve showed AUC = 0.840 (95% CI: 0.784~0.897), Hosmer-Lemeshow test P = 0.66 > 0.05, the calibration curve diagram shows that the calibration curve fits well with the ideal curve, the visual calibration curve diagram shows that the predicted risk fits well with the actual risk represented by the standard line. The clinical decision curve (DCA) diagram shows that the model can produce better clinical benefits when the threshold probability is 0.01~0.99. Conclusion: Sofa score, neutrophil percentage, fasting blood glucose and albumin are independent risk factors for invasive syndrome in patients with Klebsiella pneumoniae liver abscess. According to this index, an effective predictive model for invasive syndrome of Klebsiella pneumoniae liver abscess can be constructed, which has certain clinical application value.
文章引用:吕小菲, 马承泰, 毛冰格. 肺炎克雷伯肝脓肿侵袭综合征的危险因素及预测模型构建[J]. 临床医学进展, 2025, 15(4): 3548-3562. https://doi.org/10.12677/acm.2025.1541328

1. 引言

细菌性肝脓肿(Pyogenic Liver Abscess, BLA)是化脓性细菌侵入肝脏引起局限性化脓性炎症[1],其患病率在亚洲地区较欧美地区多见,在亚洲地区中以肺炎克雷伯杆菌(Klebsiella pneumoniae, KP)多见[2] [3],在我国致病菌中KP约占54.1% [4],由KP引起的肝脓肿可引起眼内炎、中枢神经系统感染、肺脓肿等其他肝外感染,称为肺炎克雷伯杆菌肝脓肿侵袭综合症(Invasive Klebsiella pneumoniae Liver Abscess Syndrome, IKPLAS) [5],发生率为10%~45%,由于该疾病早期临床表现无特异性,早期漏诊率高,进展快,预后差[6],应尽早引起临床医生的重视。

目前,关于IKPLAS的研究主要集中在个案分析、分子诊断以及回顾性分析临床特点等方面。在临床实践中,该疾病的诊断主要依赖于在出现显著肝外表现时进行影像学检查,或通过拉丝试验[7]和分子诊断技术检测特定毒力相关基因(如rmpA等)的存在,从而确定高毒力病理类型[8],间接提示高毒力肺炎克雷伯杆菌(Hypervirulent Klebsiella pneumoniae, hvKP)的肝外侵袭高风险。然而,上述方法操作繁琐、检验时间长、受检测条件等影响大,在辨别高风险患者时具有明显的滞后性。在此背景下,构建早期诊断肝脓肿侵袭综合征的临床预测模型显得尤为重要。通过整合患者的临床特征、实验室指标、影像学表现等多维度信息,运用统计学方法建立精准的预测模型,能够在疾病早期识别出具有高侵袭风险的患者。本研究旨在通过回顾性分析,对临床上常见的变量进行深入探讨,探索KPLA侵袭综合征的危险因素,并构建预测模型,为临床早期识别高风险患者提供科学依据。

2. 研究对象与方法

2.1. 研究对象及分组

回顾性收集青岛大学附属医院市南、崂山、西海岸院区的2017.12~2023.12期间第一诊断为肝脓肿且引流液培养结果为单一KP的389例患者的病例资料。纳入与排除标准:1) 细菌性肝脓肿诊断[9]:① 临床表现:出现发热、腹痛、呕吐等消化系统症状;② 实验室相关指标提示存在感染依据;③ 影像学检查发现肝脏具有肝脓肿影像学特点;④ 无典型影像学或病原学证据时,但经抗生素治疗后脓腔缩小或完全吸收,症状缓解。2) 侵袭综合征诊断标准[5]:排除恶性肿瘤转移,KPLA伴肝外并发症,如中枢神经系统受累、坏死性筋膜炎或眼内炎等。排除标准:1) 小于18岁;2) 治疗周期未结束自动离院或入院后死亡;3) 资料缺失过多;4) 合并血液病、慢性肾功能不全、肝炎、肝硬化;5) 病原学为KP但处于恶性肿瘤治疗中。依据以上标准将研究对象分为非侵袭组和侵袭组。

全部病例资料由青岛大学附属医院HIS病历系统查询、整理、收集,资料真实、有效,数据收集及分析过程均不涉及患者个人身份等私密信息,无需签署知情同意,且已经通过青岛大学附属医院伦理委员会审批通过,伦理审批号:QYFYWZLL29730。

2.2. 变量收集

1) 患者基本信息:性别、年龄、既往病史,既往病史:a) 心脑血管疾病病史:既往有脑梗死、脑出血、高血压、冠心病等;b) 肝胆病史:合并胆囊结石、胆囊炎、胆系感染、肝胆术后等。c) 糖尿病:符合I或II型糖尿病诊断标准[10]。2) 实验室指标:白细胞、中性粒细胞百分比、单核细胞、淋巴细胞、中性粒细胞计数、C-反应蛋白、降钙素原、凝血酶原时间、部分凝血活酶时间、国际标准化比值、纤维蛋白原、D-二具体、糖化血红蛋白、空腹血糖、总胆红素、直接胆红素、间接胆红素、白蛋白、球蛋白、白蛋白/球蛋白、前白蛋白、血钙、血磷、血镁、总胆红素、直接胆红素、间接胆红素、谷丙转氨酶、谷草转氨酶、乳酸脱氢酶、胆碱酯酶、碱性磷酸酶、尿素、肌酐、补体C1q、尿酸、SOFA评分(序贯器官衰竭评分)、NLR (中性粒细胞计数/淋巴细胞计数)、SII (血小板计数 × 中性粒细胞计数/淋巴细胞计数)、PNI (白蛋白 + 5 × 淋巴细胞)、CAR (C反应蛋白/白蛋白)、血培养是否KP阳性。3) 影像学检查:脓肿数量、最大直径、脓肿位置。其中,常规血化验、影像学检查入院后首次采集,病原学培养结果为入院后至少1次阳性结果。

2.3. 统计学方法

采用R Studio 4.3.2软件进行统计分析。1) 数据清洗:对数据进行识别,删除缺失大于30%的糖化血红蛋白、血培养结果,小于30%的连续变量进行多重插补,对量纲不同的连续变量使用进行标准化处理,消除不同量纲对数据分析的影响,确保各变量在统计分析中具有可比性。2) 两组数据基线资料分析:对于正态分布的定量资料,以均数 ± 标准差表示,两组间比较采用t检验,非正态分布的连续变量用四分位数表示,两组间比较采用MannWhitney U检验;对于计数资料,则以频数或例(%)表示,组间比较采用χ2检验。3) 数据不平衡处理:本研究中,非侵袭组与侵袭组的样本量比例约为6:1,数据集存在显著不平衡,易导致模型过拟合,选择采用人工少数类过采样法(SMOTE)进行过采样处理。SMOTE算法通过线性插值生成合成相似临近样本,以扩充少数类,可以减少直接复制带来的偏倚,最终将两组样本比例控制在3:1。4) 使用单因素logistic回归分析初步筛选可能的相关因素,将筛选出的变量纳入Lasso回归分析,通过多因素logistic回归分析构建模型,计算方差膨胀因子(Variance Inflation Factor, VIF)以进一步排除变量共线性的可能性,最终,将筛选出的变量用于构建列线图。5) 模型评估:绘制受试者工作特征(Receiver Operating Characteristic, ROC)曲线,以评价模型的预测效能;使用Hosmer-Lemeshow检验及校准曲线评估模型的校准度;通过临床决策曲线(Decision Curve Analysis, DCA)评价模型的临床效益;采用Bootstrap法进行内部验证,以评估模型的稳定性和泛化能力。

3. 结果

3.1. 两组患者的一般情况对比

本项研究经过筛选总共纳入389例患者作为研究对象,根据是否发生肝外侵袭性感染分为侵袭组和未侵袭组两组,其中侵袭组57例,未侵袭组332例。在侵袭组中,男性患者34例,女性患者23例,年龄中位数及四分位数为58.00 (53.00, 66.50);在未侵袭组中,男性患者210例,女性患者122例,年龄中位数及四分位数为60.00 (52.00, 68.00)岁;两组患者在年龄和性别上均无显著性差异(P > 0.05)。侵袭组患者合并糖尿病43例(75.44%),未侵袭组合并糖尿病174 (52.41%),差异有统计学意义(P < 0.05),两组患者在合并心脑血管疾病及肝胆疾病上差异无统计学意义(P > 0.05)。经统计学分析,侵袭组在淋巴细胞计数、血小板、纤维蛋白原、血磷、白蛋白、球蛋白、前白蛋白、胆碱酯酶、PNI这些指标中显著低于非侵袭组;而在中性粒细胞计数、中性粒细胞百分率、C反应蛋白、降钙素原、凝血酶原时间、国际标准化比值、D-二聚体、空腹血糖、总胆红素、直接胆红素、谷丙转氨酶、谷草转氨酶、乳酸脱氢酶、尿素、SOFA评分、NLR、SII、CAR这些指标中,侵袭组显著高于非侵袭组,皆有统计学意义(P < 0.05),余白细胞计数、中性粒细胞计数、单核细胞计数、血红蛋白、部分凝血活酶时间、血镁、血钙、白/球比、间接胆红素、碱性磷酸酶、肌酐、补体C1q、尿酸、脓肿数量、脓肿最大直径、脓肿位置在两组之间无统计学差异(P > 0.05)。见“表1”。

Table 1. Comparison of two groups of basic data

1. 两组患者的基线资料对比

指标

总人群(n = 389)

侵袭组(n = 332)

侵袭组(n = 57)

P

年龄

59.00 (53.00, 67.0)

60.00 (52.00, 68.00)

58.00 (53.00, 66.50)

0.508

性别

0.710

男性

244 (62.72)

210 (63.25)

34 (59.65)

女性

145 (37.28)

122 (36.75)

23 (40.35)

糖尿病

0.001

172 (44.22)

158 (47.59)

14 (24.56)

217 (55.78)

174 (52.41)

43 (75.44)

心脑

0.563

252 (64.78)

217 (65.36)

35 (61.40)

137 (35.22)

115 (34.64)

22 (38.60)

胆道疾病

0.574

311 (79.95)

267 (80.42)

44 (77.19)

78 (20.05)

65 (19.58)

13 (22.81)

白细胞计数

11.21 (8.48, 14.52)

11.21 (8.46, 14.27)

11.43 (8.75, 15.41)

0.344

中性粒细胞计数

9.21 (6.53, 12.26)

9.13 (6.37, 12.10)

9.86 (7.47, 13.28)

0.075

单核细胞计数

0.78 (0.51, 1.05)

0.79 (0.52, 1.08)

0.72 (0.45, 0.97)

0.148

淋巴细胞计数

1.03 (0.61, 1.50)

1.12 (0.66, 1.52)

0.60 (0.42, 0.92)

<0.001

血红蛋白

124.00 (112.00, 134.00)

124.00 (112.25, 134.00)

123.00 (102.00, 136.50)

0.453

中性粒细胞百分率

83.00 (76.65, 87.90)

82.10 (75.60, 86.68)

87.90 (83.65, 91.80)

<0.001

血小板

191.00 (130.50, 283.00)

200.50 (140.00, 293.75)

142.00 (43.50, 225.50)

<0.001

C反应蛋白

136.34 (90.80, 186.21)

129.82 (85.82, 176.72)

186.69 (133.00, 235.93)

<0.001

降钙素原

2.75 (0.77, 13.70)

2.27 (0.63, 9.48)

17.28 (4.16, 60.00)

<0.001

凝血酶原时间

13.60 (12.55, 14.70)

13.50 (12.50, 14.50)

14.50 (12.95, 15.40)

0.004

国际标准化比值

1.15 (1.06, 1.27)

1.15 (1.06, 1.25)

1.21 (1.09, 1.37)

0.008

部分凝血活酶时间

32.40 (28.75, 37.35)

32.45 (28.80, 37.38)

32.10 (28.45, 38.15)

0.869

纤维蛋白原

5.66 ± 1.33

5.74 ± 1.30

5.17 ± 1.41

0.003

D二聚体

1430.00 (800.00, 2665.00)

1330.00 (762.50, 2545.00)

1880.00 (1105.00, 5175.00)

0.001

空腹血糖

6.69 (5.34, 9.93)

6.43 (5.27, 9.40)

9.80 (6.94, 13.11)

<0.001

0.90 (0.83, 0.98)

0.90 (0.84, 0.98)

0.90 (0.80, 0.99)

0.521

2.00 (1.88, 2.12)

2.00 (1.88, 2.13)

1.95 (1.82, 2.10)

0.103

0.85 (0.69, 0.98)

0.85 (0.71, 1.00)

0.75 (0.54, 0.88)

0.002

白蛋白

28.85 ± 5.42

29.50 ± 5.15

25.02 ± 5.41

<0.001

球蛋白

28.50 ± 5.48

29.05 ± 5.33

25.31 ± 5.28

<0.001

白球比

1.02 (0.89, 1.15)

1.02 (0.90, 1.15)

0.98 (0.83, 1.11)

0.155

前白蛋白

79.00 (49.60, 114.15)

80.25 (50.55, 117.42)

61.90 (45.55, 91.65)

0.011

总胆红素

15.20 (11.05, 22.4)

14.85 (11.10, 21.20)

19.37 (10.71, 30.5)

0.013

直接胆红素

7.06 (4.77, 10.91)

6.90 (4.56, 10.27)

8.45 (5.17, 16.80)

0.005

间接胆红素

7.85 (5.70, 11.31)

7.83 (5.89, 11.03)

8.90 (5.35, 15.30)

0.384

谷丙转氨酶

58.00 (33.10, 102.50)

57.00 (33.00, 96.60)

74.40 (34.50, 151.00)

0.046

谷草转氨酶

35.20 (23.00, 57.70)

34.70 (22.62, 55.00)

45.00 (23.50, 139.50)

0.009

乳酸脱氢酶

232.00 (184.00, 297.50)

227.50 (183.00, 290.90)

275.00 (196.00, 407.50)

0.002

胆碱酯酶

4803.00 (3892.00, 5984.00)

4908.00 (4027.25, 6037.50)

4191.00 (3154.00, 5363.50)

<0.001

碱性磷酸酶

124.00 (90.05, 174.35)

123.50 (90.85, 170.50)

138.00 (87.50, 204.50)

0.314

尿素

4.72 (3.66, 6.45)

4.54 (3.63, 6.13)

6.41 (4.08, 10.16)

<0.001

肌酐

75.00 (63.80, 89.00)

75.00 (63.80, 89.00)

75.00 (63.00, 91.00)

0.538

补体C1q

162.00 (136.65, 190.30)

163.20 (139.00, 190.15)

148.00 (125.00, 192.50)

0.058

尿酸

185.00 (145.30, 247.50)

184.55 (146.25, 242.00)

187.00 (126.50, 305.05)

0.677

sofa评分

0.00 (0.00, 1.00)

0.00 (0.00, 1.00)

2.00 (0.00, 4.00)

<0.001

NLR

9.13 (5.68, 14.96)

8.39 (5.45, 13.33)

15.58 (10.19, 23.61)

<0.001

SII

30.63 (7.17, 180.08)

21.90 (6.79, 119.51)

305.69 (50.86, 1324.25)

<0.001

PNI

34.55 (30.27, 38.82)

35.00 (30.91, 38.97)

30.45 (26.94, 36.05)

<0.001

CAR

4.60 (3.06, 6.95)

4.31 (2.93, 6.36)

7.83 (4.40, 9.49)

<0.001

脓肿数量

0.217

单发

301 (77.38)

261 (78.61)

40 (70.18)

多发

88 (22.62)

71 (21.39)

17 (29.82)

最大直径

6.60 (5.00, 8.40)

6.60 (5.10, 8.47)

6.00 (4.65, 7.75)

0.073

位置

0.246

左叶

70 (17.99)

64 (19.28)

6 (10.53)

右叶

265 (68.12)

224 (67.47)

41 (71.93)

左叶 + 右叶

46 (11.83)

36 (10.84)

10 (17.54)

方叶

7 (1.80)

7 (2.11)

0 (0.00)

尾状叶

1 (0.26)

1 (0.30)

0 (0.00)

3.2. 肺炎克雷伯菌肝脓肿患者侵袭综合征危险因素的筛选

在完成数据不平衡处理后的数据集中,首先采用单因素logistic回归分析,初步筛选出与侵袭性感染可能相关的危险因素,共筛选出25个变量,包括:糖尿病、淋巴细胞计数、中性粒细胞百分率、血小板、C反应蛋白、降钙素原、凝血酶原时间、国际标准化比值、纤维蛋白原、空腹血糖、血磷、白蛋白、球蛋白、前白蛋白、总胆红素、直接胆红素、间接胆红素、胆碱酯酶、肌酐、尿酸、sofa评分、NLR、SII、CAR、PNI,将以上变量纳入后续分析。见“表2”。

Table 2. Univariate logistic regression analysis

2. 单因素Logistic回归

指标

回归系数

标准误

Z

OR (95% CI)

P

年龄

−0.007

0.012

−0.601

0.993 (0.970, 1.017)

0.548

性别

0.152

0.293

0.520

1.164 (0.656, 2.067)

0.603

糖尿病

1.026

0.327

3.139

2.790 (1.470, 5.296)

0.002

心脑

0.171

0.296

0.577

1.186 (0.664, 2.119)

0.564

胆道疾病

0.194

0.345

0.562

1.214 (0.617, 2.387)

0.574

白细胞计数

0.042

0.026

1.621

1.043 (0.991, 1.097)

0.105

中性粒细胞计数

0.034

0.021

1.628

1.035 (0.993, 1.078)

0.104

单核细胞计数

−0.618

0.347

−1.779

0.539 (0.273, 1.064)

0.075

淋巴细胞计数

−1.21

0.303

−3.992

0.298 (0.165, 0.540)

<0.001

血红蛋白

−0.005

0.007

−0.706

0.995 (0.981, 1.009)

0.480

中性粒细胞百分率

0.125

0.025

5.115

1.133 (1.079, 1.190)

<0.001

血小板

−0.006

0.002

−4.040

0.994 (0.990, 0.998)

<0.001

C反应蛋白

0.009

0.002

4.199

1.009 (1.005, 1.013)

<0.001

降钙素原

0.019

0.004

4.788

1.019 (1.011, 1.027)

<0.001

凝血酶原时间

0.158

0.067

2.339

1.171 (1.027, 1.336)

0.019

国际标准化比值

1.794

0.764

2.347

6.013 (1.345, 26.882)

0.019

部分凝血活酶时间

0.008

0.022

0.384

1.008 (0.965, 1.052)

0.701

纤维蛋白原

−0.349

0.117

−2.973

0.705 (0.561, 0.887)

0.003

D-二聚体

0

0

1.724

1.000 (1.000, 1.000)

0.085

空腹血糖

0.211

0.042

5.049

1.235 (1.137, 1.341)

<0.001

−0.619

1.179

−0.525

0.538 (0.053, 5.429)

0.599

−1.193

0.675

−1.769

0.303 (0.081, 1.139)

0.077

−1.546

0.586

−2.637

0.213 (0.068, 0.672)

0.008

白蛋白

−0.188

0.033

−5.630

0.829 (0.777, 0.884)

<0.001

球蛋白

−0.147

0.032

−4.622

0.863 (0.811, 0.919)

<0.001

白球比

−0.542

0.638

−0.850

0.582 (0.167, 2.031)

0.395

前白蛋白

−0.008

0.003

−2.499

0.992 (0.986, 0.998)

0.012

总胆红素

0.015

0.004

3.553

1.015 (1.007, 1.023)

<0.001

直接胆红素

0.021

0.006

3.508

1.021 (1.009, 1.033)

<0.001

间接胆红素

0.032

0.014

2.373

1.033 (1.005, 1.061)

0.018

谷丙转氨酶

0

0

0.593

1.000 (1.000, 1.000)

0.553

谷草转氨酶

0

0

−0.117

1.000 (1.000, 1.000)

0.907

乳酸脱氢酶

0

0

0.738

1.000 (1.000, 1.000)

0.460

胆碱酯酶

0

0

−3.482

1.000 (1.000, 1.000)

<0.001

碱性磷酸酶

0.003

0.001

1.953

1.003 (1.001, 1.005)

0.051

尿素

0.006

0.007

0.857

1.006 (0.992, 1.020)

0.391

肌酐

0.008

0.003

2.299

1.008 (1.002, 1.014)

0.022

补体C1q

−0.006

0.004

−1.541

0.994 (0.986, 1.002)

0.123

尿酸

0.002

0.001

2.002

1.002 (1.000, 1.004)

0.045

sofa评分

0.415

0.067

6.167

1.514 (1.328, 1.727)

<0.001

NLR

0.041

0.01

4.113

1.042 (1.022, 1.062)

<0.001

SII

0

0

2.930

1.000 (1.000, 1.000)

0.003

PNI

−0.096

0.025

−3.839

0.908 (0.865, 0.954)

<0.001

CAR

0.293

0.05

5.906

1.340 (1.215, 1.478)

<0.001

脓肿数量

0.446

0.319

1.399

1.562 (0.836, 2.919)

0.162

最大直径

−0.117

0.061

−1.933

0.890 (0.789, 1.003)

0.053

位置

0.253

0.221

1.147

1.288 (0.835, 1.986)

0.251

由于在变量较多同时样本量相对较少的数据训练过程中很容易出现共线性和过拟合的问题,会导致模型复杂度较大,之后进一步处理数据选用Lasso回归。Lasso回归是一种基于L1正则化的线性回归方法,通过惩罚项(λ值)压缩回归系数,将无关变量的系数收缩至零,从共线性变量中筛选出与结果相关度最强的变量,降低模型复杂度。与传统回归相比,Lasso尤其适用于高维数据(如本研究候选预测因子较多时),能有效解决多重共线性问题并提升模型泛化能力,选择最小λ值(λ = 0.030)的1个标准误为最优值,得到中性粒细胞百分率、空腹血糖、sofa评分、白蛋白、纤维蛋白原为纳入模型中的特征。

将以上筛选出来的指标进行多因素logistic回归分析,最终得到sofa评分(OR = 1.306, 95% CI: 1.136~1.507, P < 0.001)、中性粒细胞百分率(OR = 1.089, 95% CI: 1.029~1.152, P = 0.004)、空腹血糖(OR = 1.194, 95% CI: 1.086~1.311, P < 0.001)、白蛋白(OR = 0.901, 95% CI: 0.840~0.967, P = 0.004)与肝外侵袭独立相关。见“表3”。通过VIF值对以上4个变量进行检验,VIF值 > 10视为存在严重共线性,5~10视为存在中度共线性,表中各指标VIF值均接近1,表明这些变量几乎不存在共线性问题,数据相互独立。见“表4”。

Table 3. Multivariate logistic regression analysis

3. 多因素logistic回归分析

指标

回归系数

标准误

Z

OR (95% CI)

P

常数项

−8.086

2.892

−2.796

-

0.005

sofa评分

0.267

0.071

3.762

1.306 (1.136, 1.501)

<0.001

空腹血糖

0.177

0.048

3.643

1.194 (1.086, 1.311)

<0.001

中性粒细胞百率

0.085

0.029

2.908

1.089 (1.029, 1.152)

0.004

白蛋白

−0.104

0.036

−2.856

0.901 (0.840, 0.967)

0.004

Table 4. Variance inflation factor table

4. VIF表

sofa评分

空腹血糖

中性粒细胞百分率

白蛋白

1.074578

1.006591

1.069692

1.068725

3.3. 列线图构建

根据多因素Logistic回归筛选出4个独立预测因素构建列线图模型。见“图1”。每个指标有其对应的分值范围,通过将每个变量的取值转换为相应的得分,总分值通过图表线性映射转化为肝外侵袭的预测概率;图中所示,当各因素所对应的分值相加总和为185分时,所对应的肝外侵袭的风险概率为50%。

Figure 1. Column line graph prediction model

1. 列线图预测模型

3.4. 模型验证

通过计算ROC曲线下面积(Area Under Curve, AUC)来对该模型区分度进行评价,AUC的取值范围为0.5至1,其中0.5表示模型无判别能力,1表示模型判别能力完美,图中单一指标的AUC值皆大于0.5,联合检测的AUC = 0.840 (95% CI: 0.784~0.897),提示模型区分能力相对较高。见“图2”。结合ROC曲线对筛选出的因素进行截断值分析,最终得到SOFA评分 > 1.5、中性粒细胞百分比 > 82.95%、空腹血糖 > 9.11 mmol/L、白蛋白 < 24.61 g/L是肝脓肿发生侵袭综合征的独立危险因素。见“表5”。对模型进行Hosmer-Lemeshow检验,P = 0.66 > 0.05,同时绘制模型的可视化校准曲线图,可以看出预测风险与标准线表示的实际风险贴合良好,两者皆提示模型均具有良好的校准能力。见“图3”。绘制预测模型的决策曲线(DCA),评估模型的临床效益,区别于传统的灵敏度、特异度等单一评估标准,临床决策曲线可以综合考虑不同阈值下的获益,横坐标指阈值概率,即认为该疾病发生概率达到该值时,采取相应干预措施(如进一步治疗和检查)所带来的收益大于风险,纵坐标指净收益,指在不同阈值概率下采取干预措施所获得的收益,考虑了真阳性带来的益处减去假阳性带来的损害,如果模型的决策曲线在整个或大部分阈值概率范围内均高于两条参考线,表明模型在广泛的临床情境下可能具有实际应用价值,DCA图显示当阈值概率在0.01~0.99时模型均能产生的一定的临床效益。见“图4”。采用原始数据进行bootstrap法进行内部验证,通过1000次从原始小样本数据集中有放回的重复抽样,生成多个新的数据子集,并在每个子数据集上重新训练模型和计算ROC曲线,进而评估模型的稳定性和性能,通过ROC曲线可以更直观地评估模型在不同子集上的表现,减少因样本量少带来的偏差,图中灰色区域为多次bootstrap抽样得到的ROC曲线,曲线相对较集中,表明模型性能较为稳定。见“图5”。

Figure 2. Receiver operating characteristic curve

2. ROC曲线

Table 5. Effectiveness evaluation table of different variables

5. 不同变量的效能评估表

指标

AUC (95% CI)

P值

阈值

特异度

灵敏度

联合检测

0.840 (0.784, 0.897)

<0.001

0.17

82.23%

73.68%

sofa评分

0.741 (0.668, 0.814)

<0.001

1.50

83.13%

57.89%

中性粒细胞率

0.733 (0.671, 0.795)

<0.001

82.95

55.12%

84.21%

空腹血糖

0.719 (0.651, 0.788)

<0.001

9.11

71.69%

64.91%

白蛋白

0.724 (0.648, 0.799)

<0.001

24.61

84.34%

50.88%

Figure 3. Calibration curve

3. 校准曲线

Figure 4. Decision curve analysis curve

4. DCA曲线

Figure 5. Bootstrap internal validation receiver operating characteristic curve

5. Bootstrap内部验证ROC曲线

4. 讨论

SOFA评分通过量化呼吸、凝血、肝脏、循环、神经及肾功能的损害程度,反映了病原体与宿主相互作用的动态进程。脓毒症导致宿主对感染的反应失调引起危及生命的器官功能障碍。SOFA总分达到或超过2分时,提示可能存在脓毒症[11]。研究表明,SOFA评分对脓毒症患者的死亡率具有良好的预后预测准确性[12] [13]。目前已有研究表明肝脓肿患者合并脓毒症更容易发生侵袭性感染[14]-[16]。本研究中,SOFA评分 > 1.5即为肝脓肿发生侵袭综合征的独立预测因子之一,提示我们在临床工作中应密切关注SOFA评分较高的肝脓肿患者,他们可能面临更高的侵袭性感染风险,及时识别并采取有效干预措施,或许能降低并发症发生率,改善患者预后。

中性粒细胞是血液中主要的吞噬细胞,其功能状态可能与患者的免疫应答能力相关。有小鼠实验研究表明携带吞噬肺炎克雷伯菌的中性粒细胞可能通过血流将细菌转运到远处部位,后被免疫系统裂解释放出游离的细菌,导致侵袭性感染可能,但进一步机制尚未阐述[17]。有研究表明NLR (中性粒细胞计数/淋巴细胞计数)可作为预测脓毒症休克[18]和早期评估IKPLAS发生风险的标志物[19],该指标是联合反应炎症与免疫状态的新兴指标,本研究在初始时也纳入该指标,单因素logistic提示有明显相关性,但在后续共线性变量筛选过程中被剔除。中性粒细胞百分比作为传统炎症指标,其特异性可能低于IL-6等新型标志物,鉴于住院患者IL-6检查率偏低,由于临床上非危重患者未做该检验,本研究未将其纳入考量,后续研究可对不同炎症标志物进行对比分析。

糖尿病被证明是肺炎克雷伯菌感染的独立危险因素,血糖控制不佳的肺炎克雷伯肝脓肿患者有更高的转移性感染的发生率[20]-[23]。高血糖会显著改变机体的内环境,为细菌的滋生和繁殖提供有利条件,同时增加细菌的耐药性[24],从而使细菌能够迅速生长和扩散,导致感染难以控制;此外,高血糖还会导致机体免疫功能紊乱,降低白细胞的抑菌作用,并破坏血管内膜功能,使得细菌更易沿血流向外播散。糖化血红蛋白是反应血糖长期控制状态的指标,相较于临时的空腹血糖更能反应机体长期内部状态,但临床上将该指标作为入院后常规检查的情况较少,导致缺失数据过多,没有纳入分析,后续有待在感染患者中加强对该指标的完善。该结果提示对于糖尿病合并肺炎克雷伯菌感染的患者,除了积极的抗感染及局部引流治疗外,还应严格控制血糖水平,以改善机体的内环境,提高机体的免疫力,从而有助于控制感染并减少转移性感染的发生。

本研究提示白蛋白 < 24.61 g/L是肝脓肿发生侵袭综合征的独立预测因子,低白蛋白血症常与严重感染及脓毒症相关,有研究表明白蛋白是肝脓肿伴糖尿病患者发生脓毒血症的预测因子[25]。血清白蛋白是肝脏合成的重要蛋白之一,在运输多种免疫相关物质中扮演重要角色。其含量降低会扰乱免疫细胞的正常代谢和功能,削弱机体对细菌等病原体的防御能力,进而导致脓肿难以局限和吸收,更易扩散至周围组织和器官,这可能是潜在的影响机制。

目前,针对糖尿病患者的肺炎克雷伯肝脓肿侵袭综合征的预测模型为数不多,且均为单中心小样本研究。其中一项研究筛选出空腹血糖、血红蛋白、血尿素氮、脓肿大小和SOFA评分作为危险因素构建模型[26];另一项研究则筛选出血红蛋白、血小板、D-二聚体和SOFA评分作为危险因素[27]。研究结果差异可能与不同研究中心、纳入研究对象范围不同、样本量差异以及统计方法学中参数设置的不同等因素有关。然而,两项研究结果中均包含SOFA评分,这提示感染程度的加重更可能预示侵袭性感染的发生。

与既往关于糖尿病合并肺炎克雷伯肝脓肿侵袭综合征预测模型的研究相比,本研究纳入的变量更为丰富,涵盖了更多可能影响疾病发生发展的因素,样本量也相对较大,一定程度上可提高研究结果的可靠性与稳定性。此外,本研究聚焦于非糖尿病和糖尿病的总人群,更贴近临床实际,能够为不同患者群体提供更广泛适用的疾病危险因素信息和预测模型,对早期识别肺炎克雷伯肝脓肿侵袭综合征具有重要的临床指导意义。

本研究也存在一定的局限性:1) 样本量方面:本研究样本量较少,未侵袭组332例、侵袭组57例,由于肺炎克雷伯肝脓肿侵袭性感染患病率低,实际中难以获取大量样本,虽然满足传统的10EPV原则(每个变量至少10个事件),但仍限制了模型泛化能力和结果准确性。处理:① 采用SMOTE改善数据不均衡;② Lasso回归可以针对较多的变量简化模型同时减少共线性和过拟合,提高模型在小样本数据上的泛化能力;③ 采用Bootstrap等重抽样技术进行内部验证,在有限样本下评估模型稳定性。2) 数据收集可能存在选择偏倚,样本来自特定地区或医院,不能完全代表总体;研究仅关注部分临床指标,可能遗漏其他潜在危险因素。

5. 结论及未来展望

本研究通过单中心回顾性分析,最终得出SOFA评分 > 1.5分、中性粒细胞百分比 > 82.95%、空腹血糖 > 9.11 mmol/L、白蛋白 < 24.61 g/L是肝脓肿发生侵袭综合征的独立危险因素,结合以上指标绘制了列线图并通过ROC曲线、校准曲线、临床决策曲线、bootstrap内部验证均提示模型预测性能良好,对临床上早期识别高风险人群有一定指导意义。但也存在局限性,后续可多中心合作扩大样本量,纳入不同地区患者,减少选择偏倚;同时,综合更多生物学指标,完善危险因素分析,优化预测模型。

NOTES

*通讯作者。

参考文献

[1] Lardière-Deguelte, S., Ragot, E., Amroun, K., Piardi, T., Dokmak, S., Bruno, O., et al. (2015) Hepatic Abscess: Diagnosis and Management. Journal of Visceral Surgery, 152, 231-243.
https://doi.org/10.1016/j.jviscsurg.2015.01.013
[2] Mukthinuthalapati, V.V.P.K., Attar, B.M., Parra-Rodriguez, L., Cabrera, N.L., Araujo, T. and Gandhi, S. (2019) Risk Factors, Management, and Outcomes of Pyogenic Liver Abscess in a US Safety Net Hospital. Digestive Diseases and Sciences, 65, 1529-1538.
https://doi.org/10.1007/s10620-019-05851-9
[3] Zhang, S., Zhang, X., Wu, Q., et al. (2019) Clinical, Microbiological, and Molecular Epidemiological Characteristics of Klebsiella pneumoniae-Induced Pyogenic Liver Abscess in Southeastern China. Antimicrobial Resistance & Infection Control, 29, Article No. 166.
https://doi.org/10.1186/s13756-019-0615-2
[4] Luo, M., Yang, X.-X., Tan, B., Zhou, X.-P., Xia, H.-M., Xue, J., et al. (2016) Distribution of Common Pathogens in Patients with Pyogenic Liver Abscess in China: A Meta-Analysis. European Journal of Clinical Microbiology & Infectious Diseases, 35, 1557-1565.
https://doi.org/10.1007/s10096-016-2712-y
[5] Siu, L.K., Yeh, K., Lin, J., Fung, C. and Chang, F. (2012) Klebsiella pneumoniae Liver Abscess: A New Invasive Syndrome. The Lancet Infectious Diseases, 12, 881-887.
https://doi.org/10.1016/s1473-3099(12)70205-0
[6] 张自然, 孟凡征, 尹大龙, 等. 肺炎克雷伯菌性肝脓肿伴内源性眼内炎的诊断及治疗[J]. 中华肝脏外科手术学电子杂志, 2017, 6(6): 433-436.
[7] Lin, Y., Lu, M., Tang, H., Liu, H., Chen, C., Liu, K., et al. (2011) Assessment of Hypermucoviscosity as a Virulence Factor for Experimental Klebsiella pneumoniae Infections: Comparative Virulence Analysis with Hypermucoviscosity-Negative Strain. BMC Microbiology, 11, Article No. 50.
https://doi.org/10.1186/1471-2180-11-50
[8] Baron, S.A., Pascale, L., Million, M., Briantais, A., Durand, J., Hadjadj, L., et al. (2020) Whole Genome Sequencing to Decipher the Virulence Phenotype of Hypervirulent Klebsiella pneumoniae Responsible for Liver Abscess, Marseille, France. European Journal of Clinical Microbiology & Infectious Diseases, 40, 1073-1077.
https://doi.org/10.1007/s10096-020-04080-7
[9] 中华医学会急诊医学分会. 细菌性肝脓肿诊治急诊专家共识[J]. 中华急诊医学杂志, 2022, 31(3): 273-280.
[10] 中华医学会糖尿病学分会. 中国2型糖尿病防治指南(2013年版) [J]. 中华糖尿病杂志, 2014, 6(7): 447-498.
[11] Singer, M., Deutschman, C.S., Seymour, C.W., Shankar-Hari, M., Annane, D., Bauer, M., et al. (2016) The Third International Consensus Definitions for Sepsis and Septic Shock (Sepsis-3). JAMA, 315, 801-810.
https://doi.org/10.1001/jama.2016.0287
[12] Moreno, R., Vincent, J.-L., Matos, R., Mendonça, A., Cantraine, F., Thijs, L., et al. (1999) The Use of Maximum SOFA Score to Quantify Organ Dysfunction/Failure in Intensive Care. Results of a Prospective, Multicentre Study. Intensive Care Medicine, 25, 686-696.
https://doi.org/10.1007/s001340050931
[13] Ferreira, F.L. (2001) Serial Evaluation of the SOFA Score to Predict Outcome in Critically Ill Patients. JAMA, 286, 1754-1758.
https://doi.org/10.1001/jama.286.14.1754
[14] 刘江福, 何秀华, 陈泰裕, 等. 肺炎克雷伯菌肝脓肿致脓毒症的临床特征及危险因素分析[J]. 中国卫生标准管理, 2022, 13(17): 134-138.
[15] Li, S., Yu, S., Peng, M., et al. (2021) Clinical Features and Development of Sepsis in Klebsiella pneumoniae Infected Liver Abscess Patients: A Retrospective Analysis of 135 Cases. BMC Infectious Diseases, 21, Article No. 597.
https://doi.org/10.1186/s12879-021-06325-y
[16] 张碧莹, 路明, 林菲, 等. 细菌性肝脓肿并发脓毒症的临床特征[J]. 中国临床药理学杂志, 2023, 39(3): 307-311.
[17] Lin, J., Chang, F., Fung, C., Yeh, K., Chen, C., Tsai, Y., et al. (2010) Do Neutrophils Play a Role in Establishing Liver Abscesses and Distant Metastases Caused by Klebsiella pneumoniae? PLOS ONE, 5, e15005.
https://doi.org/10.1371/journal.pone.0015005
[18] Park, K.S., Lee, S.H., Yun, S.J., Ryu, S. and Kim, K. (2018) Neutrophil-to-Lymphocyte Ratio as a Feasible Prognostic Marker for Pyogenic Liver Abscess in the Emergency Department. European Journal of Trauma and Emergency Surgery, 45, 343-351.
https://doi.org/10.1007/s00068-018-0925-8
[19] 蒲琴琴. 中性粒细胞/淋巴细胞比值与侵袭性肺炎克雷伯菌肝脓肿综合征的相关性分析[D]: [硕士学位论文]. 南京: 南京医科大学, 2023.
[20] Li, W., Chen, H., Wu, S. and Peng, J. (2018) A Comparison of Pyogenic Liver Abscess in Patients with or without Diabetes: A Retrospective Study of 246 Cases. BMC Gastroenterology, 18, Article No. 144.
https://doi.org/10.1186/s12876-018-0875-y
[21] Lin, Y., Wang, F., Wu, P. and Fung, C. (2013) Klebsiella pneumoniae Liver Abscess in Diabetic Patients: Association of Glycemic Control with the Clinical Characteristics. BMC Infectious Diseases, 13, Article No. 56.
https://doi.org/10.1186/1471-2334-13-56
[22] Sheu, S., Kung, Y., Wu, T., Chang, F. and Horng, Y. (2011) Risk Factors for Endogenous Endophthalmitis Secondary to Klebsiella pneumoniae Liver Abscess. Retina, 31, 2026-2031.
https://doi.org/10.1097/iae.0b013e31820d3f9e
[23] Wang, H., Tsai, S., Yu, C., Hsu, H., Liu, C., Lin, J., et al. (2014) The Association of Haemoglobin A1C Levels with the Clinical and CT Characteristics of Klebsiella pneumoniae Liver Abscesses in Patients with Diabetes Mellitus. European Radiology, 24, 980-989.
https://doi.org/10.1007/s00330-014-3113-1
[24] Allison, K.R., Brynildsen, M.P. and Collins, J.J. (2011) Metabolite-Enabled Eradication of Bacterial Persisters by Aminoglycosides. Nature, 473, 216-220.
https://doi.org/10.1038/nature10069
[25] 丁蕊, 谢雯, 刘丽改, 等. 肺炎克雷伯菌肝脓肿的临床特征及预后影响因素分析[J]. 临床肝胆病杂志, 2022, 38(7): 1584-1589.
[26] Feng, C.Y., Zhang, L.W., Liu, T., et al. (2024) Establishment and Verification of Invasion Syndrome Prediction Model in Patients with Diabetes Complicated with Klebsiella pneumoniae Liver Abscess. National Medical Journal of China, 104, 956-962.
https://doi.org/10.3760/cma.j.cn112137-20231019-00813
[27] Feng, C., Di, J., Jiang, S., Li, X. and Hua, F. (2023) Machine Learning Models for Prediction of Invasion Klebsiella pneumoniae Liver Abscess Syndrome in Diabetes Mellitus: A Singled Centered Retrospective Study. BMC Infectious Diseases, 23, Article No. 284.
https://doi.org/10.1186/s12879-023-08235-7