摘要: 目的:回顾性分析肺炎克雷伯菌肝脓肿综合征患者发生侵袭综合征的危险因素,构建和验证列线图预测模型,并进行相关验证。方法:检索收集青岛大学附属医院2017.12~2023.12期间第一诊断为肝脓肿且引流液培养为单一肺炎克雷伯杆菌的389例患者的病例资料,应用多因素logistic回归筛选肝外侵袭的独立预测因素构建列线图,绘制受试者工作特征(ROC)曲线对模型的预测效能进行评价,校准曲线对模型的校准度进行评价,临床决策曲线(DCA)评价模型的临床效益,Bootstrap法进行内部验证评估模型的稳定性和泛化能力。结果:本项研究总共纳入389例患者作为研究对象,根据肝外表现分为未侵袭组和侵袭组两组,其中未侵袭组332例,侵袭组57例,两组在年龄、性别之间均没有统计学差异。最终筛选出sofa评分(OR = 1.306, 95% CI: 1.136~1.507, P < 0.001)、中性粒细胞百分率(OR = 1.089, 95% CI: 1.029~1.152, P = 0.004)、空腹血糖(OR = 1.194, 95% CI: 1.086~1.311, P < 0.001)、白蛋白(OR = 0.901, 95% CI: 0.840~0.967, P = 0.004)为肝外侵袭的独立预测因素。纳入以上危险因素制作列线图(nomogram)并进行模型验证,ROC曲线示AUC = 0.840 (95% CI: 0.784~0.897),Hosmer-Lemeshow检验P = 0.66 > 0.05,校准曲线图示校准曲线与理想曲线贴合良好,临床决策曲线(DCA)图显示当阈值概率在0.01~0.99时模型均能产生更好的临床效益。结论:sofa评分、中性粒细胞百分率、空腹血糖、白蛋白是肺炎克雷伯菌肝脓肿患者发生侵袭综合征的独立危险因素,根据此指标可构建有效的肺炎克雷伯肝脓肿侵袭综合征的预测模型,具有一定的临床应用价值。
Abstract: Objective: To retrospectively analyze the risk factors of invasive syndrome in patients with Klebsiella pneumoniae liver abscess syndrome, construct and verify the nomogram prediction model, and carry out relevant verification. Method: The case data of 389 patients who were first diagnosed with liver abscess and whose drainage fluid was cultured as a single KP in the Affiliated Hospital of Qingdao University from 2017.12 to 2023.12 were collected. Multivariate logistic regression was used to screen the independent predictors of extrahepatic invasion to construct a nomogram. The receiver operating characteristic (ROC) curve was drawn to evaluate the predictive efficacy of the model, the calibration curve was used to evaluate the calibration of the model, the clinical decision curve (DCA) was used to evaluate the clinical benefits of the model, and the Bootstrap method was used to evaluate the stability and generalization ability of the model. Results: A total of 389 patients were included in this study. According to extrahepatic manifestations, they were divided into non-invasive group and invasive group, including 332 cases in non-invasive group and 57 cases in invasive group. There was no significant difference in age and sex between the two groups. Finally, sofa score (OR = 1.306, 95% CI: 1.136~1.507, P < 0.001), neutrophil percentage (OR = 1.089, 95% CI: 1.029~1.152, P = 0.004), fasting blood glucose (OR = 1.194, 95% CI: 1.086~1.311, P < 0.001), albumin (OR = 0.901, 95% CI: 0.840~0.967, P = 0.004) were independent predictors of extrahepatic invasion. The ROC curve showed AUC = 0.840 (95% CI: 0.784~0.897), Hosmer-Lemeshow test P = 0.66 > 0.05, the calibration curve diagram shows that the calibration curve fits well with the ideal curve, the visual calibration curve diagram shows that the predicted risk fits well with the actual risk represented by the standard line. The clinical decision curve (DCA) diagram shows that the model can produce better clinical benefits when the threshold probability is 0.01~0.99. Conclusion: Sofa score, neutrophil percentage, fasting blood glucose and albumin are independent risk factors for invasive syndrome in patients with Klebsiella pneumoniae liver abscess. According to this index, an effective predictive model for invasive syndrome of Klebsiella pneumoniae liver abscess can be constructed, which has certain clinical application value.
1. 引言
细菌性肝脓肿(Pyogenic Liver Abscess, BLA)是化脓性细菌侵入肝脏引起局限性化脓性炎症[1],其患病率在亚洲地区较欧美地区多见,在亚洲地区中以肺炎克雷伯杆菌(Klebsiella pneumoniae, KP)多见[2] [3],在我国致病菌中KP约占54.1% [4],由KP引起的肝脓肿可引起眼内炎、中枢神经系统感染、肺脓肿等其他肝外感染,称为肺炎克雷伯杆菌肝脓肿侵袭综合症(Invasive Klebsiella pneumoniae Liver Abscess Syndrome, IKPLAS) [5],发生率为10%~45%,由于该疾病早期临床表现无特异性,早期漏诊率高,进展快,预后差[6],应尽早引起临床医生的重视。
目前,关于IKPLAS的研究主要集中在个案分析、分子诊断以及回顾性分析临床特点等方面。在临床实践中,该疾病的诊断主要依赖于在出现显著肝外表现时进行影像学检查,或通过拉丝试验[7]和分子诊断技术检测特定毒力相关基因(如rmpA等)的存在,从而确定高毒力病理类型[8],间接提示高毒力肺炎克雷伯杆菌(Hypervirulent Klebsiella pneumoniae, hvKP)的肝外侵袭高风险。然而,上述方法操作繁琐、检验时间长、受检测条件等影响大,在辨别高风险患者时具有明显的滞后性。在此背景下,构建早期诊断肝脓肿侵袭综合征的临床预测模型显得尤为重要。通过整合患者的临床特征、实验室指标、影像学表现等多维度信息,运用统计学方法建立精准的预测模型,能够在疾病早期识别出具有高侵袭风险的患者。本研究旨在通过回顾性分析,对临床上常见的变量进行深入探讨,探索KPLA侵袭综合征的危险因素,并构建预测模型,为临床早期识别高风险患者提供科学依据。
2. 研究对象与方法
2.1. 研究对象及分组
回顾性收集青岛大学附属医院市南、崂山、西海岸院区的2017.12~2023.12期间第一诊断为肝脓肿且引流液培养结果为单一KP的389例患者的病例资料。纳入与排除标准:1) 细菌性肝脓肿诊断[9]:① 临床表现:出现发热、腹痛、呕吐等消化系统症状;② 实验室相关指标提示存在感染依据;③ 影像学检查发现肝脏具有肝脓肿影像学特点;④ 无典型影像学或病原学证据时,但经抗生素治疗后脓腔缩小或完全吸收,症状缓解。2) 侵袭综合征诊断标准[5]:排除恶性肿瘤转移,KPLA伴肝外并发症,如中枢神经系统受累、坏死性筋膜炎或眼内炎等。排除标准:1) 小于18岁;2) 治疗周期未结束自动离院或入院后死亡;3) 资料缺失过多;4) 合并血液病、慢性肾功能不全、肝炎、肝硬化;5) 病原学为KP但处于恶性肿瘤治疗中。依据以上标准将研究对象分为非侵袭组和侵袭组。
全部病例资料由青岛大学附属医院HIS病历系统查询、整理、收集,资料真实、有效,数据收集及分析过程均不涉及患者个人身份等私密信息,无需签署知情同意,且已经通过青岛大学附属医院伦理委员会审批通过,伦理审批号:QYFYWZLL29730。
2.2. 变量收集
1) 患者基本信息:性别、年龄、既往病史,既往病史:a) 心脑血管疾病病史:既往有脑梗死、脑出血、高血压、冠心病等;b) 肝胆病史:合并胆囊结石、胆囊炎、胆系感染、肝胆术后等。c) 糖尿病:符合I或II型糖尿病诊断标准[10]。2) 实验室指标:白细胞、中性粒细胞百分比、单核细胞、淋巴细胞、中性粒细胞计数、C-反应蛋白、降钙素原、凝血酶原时间、部分凝血活酶时间、国际标准化比值、纤维蛋白原、D-二具体、糖化血红蛋白、空腹血糖、总胆红素、直接胆红素、间接胆红素、白蛋白、球蛋白、白蛋白/球蛋白、前白蛋白、血钙、血磷、血镁、总胆红素、直接胆红素、间接胆红素、谷丙转氨酶、谷草转氨酶、乳酸脱氢酶、胆碱酯酶、碱性磷酸酶、尿素、肌酐、补体C1q、尿酸、SOFA评分(序贯器官衰竭评分)、NLR (中性粒细胞计数/淋巴细胞计数)、SII (血小板计数 × 中性粒细胞计数/淋巴细胞计数)、PNI (白蛋白 + 5 × 淋巴细胞)、CAR (C反应蛋白/白蛋白)、血培养是否KP阳性。3) 影像学检查:脓肿数量、最大直径、脓肿位置。其中,常规血化验、影像学检查入院后首次采集,病原学培养结果为入院后至少1次阳性结果。
2.3. 统计学方法
采用R Studio 4.3.2软件进行统计分析。1) 数据清洗:对数据进行识别,删除缺失大于30%的糖化血红蛋白、血培养结果,小于30%的连续变量进行多重插补,对量纲不同的连续变量使用进行标准化处理,消除不同量纲对数据分析的影响,确保各变量在统计分析中具有可比性。2) 两组数据基线资料分析:对于正态分布的定量资料,以均数 ± 标准差表示,两组间比较采用t检验,非正态分布的连续变量用四分位数表示,两组间比较采用MannWhitney U检验;对于计数资料,则以频数或例(%)表示,组间比较采用χ2检验。3) 数据不平衡处理:本研究中,非侵袭组与侵袭组的样本量比例约为6:1,数据集存在显著不平衡,易导致模型过拟合,选择采用人工少数类过采样法(SMOTE)进行过采样处理。SMOTE算法通过线性插值生成合成相似临近样本,以扩充少数类,可以减少直接复制带来的偏倚,最终将两组样本比例控制在3:1。4) 使用单因素logistic回归分析初步筛选可能的相关因素,将筛选出的变量纳入Lasso回归分析,通过多因素logistic回归分析构建模型,计算方差膨胀因子(Variance Inflation Factor, VIF)以进一步排除变量共线性的可能性,最终,将筛选出的变量用于构建列线图。5) 模型评估:绘制受试者工作特征(Receiver Operating Characteristic, ROC)曲线,以评价模型的预测效能;使用Hosmer-Lemeshow检验及校准曲线评估模型的校准度;通过临床决策曲线(Decision Curve Analysis, DCA)评价模型的临床效益;采用Bootstrap法进行内部验证,以评估模型的稳定性和泛化能力。
3. 结果
3.1. 两组患者的一般情况对比
本项研究经过筛选总共纳入389例患者作为研究对象,根据是否发生肝外侵袭性感染分为侵袭组和未侵袭组两组,其中侵袭组57例,未侵袭组332例。在侵袭组中,男性患者34例,女性患者23例,年龄中位数及四分位数为58.00 (53.00, 66.50);在未侵袭组中,男性患者210例,女性患者122例,年龄中位数及四分位数为60.00 (52.00, 68.00)岁;两组患者在年龄和性别上均无显著性差异(P > 0.05)。侵袭组患者合并糖尿病43例(75.44%),未侵袭组合并糖尿病174 (52.41%),差异有统计学意义(P < 0.05),两组患者在合并心脑血管疾病及肝胆疾病上差异无统计学意义(P > 0.05)。经统计学分析,侵袭组在淋巴细胞计数、血小板、纤维蛋白原、血磷、白蛋白、球蛋白、前白蛋白、胆碱酯酶、PNI这些指标中显著低于非侵袭组;而在中性粒细胞计数、中性粒细胞百分率、C反应蛋白、降钙素原、凝血酶原时间、国际标准化比值、D-二聚体、空腹血糖、总胆红素、直接胆红素、谷丙转氨酶、谷草转氨酶、乳酸脱氢酶、尿素、SOFA评分、NLR、SII、CAR这些指标中,侵袭组显著高于非侵袭组,皆有统计学意义(P < 0.05),余白细胞计数、中性粒细胞计数、单核细胞计数、血红蛋白、部分凝血活酶时间、血镁、血钙、白/球比、间接胆红素、碱性磷酸酶、肌酐、补体C1q、尿酸、脓肿数量、脓肿最大直径、脓肿位置在两组之间无统计学差异(P > 0.05)。见“表1”。
Table 1. Comparison of two groups of basic data
表1. 两组患者的基线资料对比
指标 |
总人群(n = 389) |
未侵袭组(n = 332) |
侵袭组(n = 57) |
P |
年龄 |
59.00 (53.00, 67.0) |
60.00 (52.00, 68.00) |
58.00 (53.00, 66.50) |
0.508 |
性别 |
|
|
|
0.710 |
男性 |
244 (62.72) |
210 (63.25) |
34 (59.65) |
|
女性 |
145 (37.28) |
122 (36.75) |
23 (40.35) |
|
糖尿病 |
|
|
|
0.001 |
无 |
172 (44.22) |
158 (47.59) |
14 (24.56) |
|
有 |
217 (55.78) |
174 (52.41) |
43 (75.44) |
|
心脑 |
|
|
|
0.563 |
无 |
252 (64.78) |
217 (65.36) |
35 (61.40) |
|
有 |
137 (35.22) |
115 (34.64) |
22 (38.60) |
|
胆道疾病 |
|
|
|
0.574 |
无 |
311 (79.95) |
267 (80.42) |
44 (77.19) |
|
有 |
78 (20.05) |
65 (19.58) |
13 (22.81) |
|
白细胞计数 |
11.21 (8.48, 14.52) |
11.21 (8.46, 14.27) |
11.43 (8.75, 15.41) |
0.344 |
中性粒细胞计数 |
9.21 (6.53, 12.26) |
9.13 (6.37, 12.10) |
9.86 (7.47, 13.28) |
0.075 |
单核细胞计数 |
0.78 (0.51, 1.05) |
0.79 (0.52, 1.08) |
0.72 (0.45, 0.97) |
0.148 |
淋巴细胞计数 |
1.03 (0.61, 1.50) |
1.12 (0.66, 1.52) |
0.60 (0.42, 0.92) |
<0.001 |
血红蛋白 |
124.00 (112.00, 134.00) |
124.00 (112.25, 134.00) |
123.00 (102.00, 136.50) |
0.453 |
中性粒细胞百分率 |
83.00 (76.65, 87.90) |
82.10 (75.60, 86.68) |
87.90 (83.65, 91.80) |
<0.001 |
血小板 |
191.00 (130.50, 283.00) |
200.50 (140.00, 293.75) |
142.00 (43.50, 225.50) |
<0.001 |
C反应蛋白 |
136.34 (90.80, 186.21) |
129.82 (85.82, 176.72) |
186.69 (133.00, 235.93) |
<0.001 |
降钙素原 |
2.75 (0.77, 13.70) |
2.27 (0.63, 9.48) |
17.28 (4.16, 60.00) |
<0.001 |
凝血酶原时间 |
13.60 (12.55, 14.70) |
13.50 (12.50, 14.50) |
14.50 (12.95, 15.40) |
0.004 |
国际标准化比值 |
1.15 (1.06, 1.27) |
1.15 (1.06, 1.25) |
1.21 (1.09, 1.37) |
0.008 |
部分凝血活酶时间 |
32.40 (28.75, 37.35) |
32.45 (28.80, 37.38) |
32.10 (28.45, 38.15) |
0.869 |
纤维蛋白原 |
5.66 ± 1.33 |
5.74 ± 1.30 |
5.17 ± 1.41 |
0.003 |
D二聚体 |
1430.00 (800.00, 2665.00) |
1330.00 (762.50, 2545.00) |
1880.00 (1105.00, 5175.00) |
0.001 |
空腹血糖 |
6.69 (5.34, 9.93) |
6.43 (5.27, 9.40) |
9.80 (6.94, 13.11) |
<0.001 |
镁 |
0.90 (0.83, 0.98) |
0.90 (0.84, 0.98) |
0.90 (0.80, 0.99) |
0.521 |
钙 |
2.00 (1.88, 2.12) |
2.00 (1.88, 2.13) |
1.95 (1.82, 2.10) |
0.103 |
磷 |
0.85 (0.69, 0.98) |
0.85 (0.71, 1.00) |
0.75 (0.54, 0.88) |
0.002 |
白蛋白 |
28.85 ± 5.42 |
29.50 ± 5.15 |
25.02 ± 5.41 |
<0.001 |
球蛋白 |
28.50 ± 5.48 |
29.05 ± 5.33 |
25.31 ± 5.28 |
<0.001 |
白球比 |
1.02 (0.89, 1.15) |
1.02 (0.90, 1.15) |
0.98 (0.83, 1.11) |
0.155 |
前白蛋白 |
79.00 (49.60, 114.15) |
80.25 (50.55, 117.42) |
61.90 (45.55, 91.65) |
0.011 |
总胆红素 |
15.20 (11.05, 22.4) |
14.85 (11.10, 21.20) |
19.37 (10.71, 30.5) |
0.013 |
直接胆红素 |
7.06 (4.77, 10.91) |
6.90 (4.56, 10.27) |
8.45 (5.17, 16.80) |
0.005 |
间接胆红素 |
7.85 (5.70, 11.31) |
7.83 (5.89, 11.03) |
8.90 (5.35, 15.30) |
0.384 |
谷丙转氨酶 |
58.00 (33.10, 102.50) |
57.00 (33.00, 96.60) |
74.40 (34.50, 151.00) |
0.046 |
谷草转氨酶 |
35.20 (23.00, 57.70) |
34.70 (22.62, 55.00) |
45.00 (23.50, 139.50) |
0.009 |
乳酸脱氢酶 |
232.00 (184.00, 297.50) |
227.50 (183.00, 290.90) |
275.00 (196.00, 407.50) |
0.002 |
胆碱酯酶 |
4803.00 (3892.00, 5984.00) |
4908.00 (4027.25, 6037.50) |
4191.00 (3154.00, 5363.50) |
<0.001 |
碱性磷酸酶 |
124.00 (90.05, 174.35) |
123.50 (90.85, 170.50) |
138.00 (87.50, 204.50) |
0.314 |
尿素 |
4.72 (3.66, 6.45) |
4.54 (3.63, 6.13) |
6.41 (4.08, 10.16) |
<0.001 |
肌酐 |
75.00 (63.80, 89.00) |
75.00 (63.80, 89.00) |
75.00 (63.00, 91.00) |
0.538 |
补体C1q |
162.00 (136.65, 190.30) |
163.20 (139.00, 190.15) |
148.00 (125.00, 192.50) |
0.058 |
尿酸 |
185.00 (145.30, 247.50) |
184.55 (146.25, 242.00) |
187.00 (126.50, 305.05) |
0.677 |
sofa评分 |
0.00 (0.00, 1.00) |
0.00 (0.00, 1.00) |
2.00 (0.00, 4.00) |
<0.001 |
NLR |
9.13 (5.68, 14.96) |
8.39 (5.45, 13.33) |
15.58 (10.19, 23.61) |
<0.001 |
SII |
30.63 (7.17, 180.08) |
21.90 (6.79, 119.51) |
305.69 (50.86, 1324.25) |
<0.001 |
PNI |
34.55 (30.27, 38.82) |
35.00 (30.91, 38.97) |
30.45 (26.94, 36.05) |
<0.001 |
CAR |
4.60 (3.06, 6.95) |
4.31 (2.93, 6.36) |
7.83 (4.40, 9.49) |
<0.001 |
脓肿数量 |
|
|
|
0.217 |
单发 |
301 (77.38) |
261 (78.61) |
40 (70.18) |
|
多发 |
88 (22.62) |
71 (21.39) |
17 (29.82) |
|
最大直径 |
6.60 (5.00, 8.40) |
6.60 (5.10, 8.47) |
6.00 (4.65, 7.75) |
0.073 |
位置 |
|
|
|
0.246 |
左叶 |
70 (17.99) |
64 (19.28) |
6 (10.53) |
|
右叶 |
265 (68.12) |
224 (67.47) |
41 (71.93) |
|
左叶 + 右叶 |
46 (11.83) |
36 (10.84) |
10 (17.54) |
|
方叶 |
7 (1.80) |
7 (2.11) |
0 (0.00) |
|
尾状叶 |
1 (0.26) |
1 (0.30) |
0 (0.00) |
|
3.2. 肺炎克雷伯菌肝脓肿患者侵袭综合征危险因素的筛选
在完成数据不平衡处理后的数据集中,首先采用单因素logistic回归分析,初步筛选出与侵袭性感染可能相关的危险因素,共筛选出25个变量,包括:糖尿病、淋巴细胞计数、中性粒细胞百分率、血小板、C反应蛋白、降钙素原、凝血酶原时间、国际标准化比值、纤维蛋白原、空腹血糖、血磷、白蛋白、球蛋白、前白蛋白、总胆红素、直接胆红素、间接胆红素、胆碱酯酶、肌酐、尿酸、sofa评分、NLR、SII、CAR、PNI,将以上变量纳入后续分析。见“表2”。
Table 2. Univariate logistic regression analysis
表2. 单因素Logistic回归
指标 |
回归系数 |
标准误 |
Z |
OR (95% CI) |
P |
年龄 |
−0.007 |
0.012 |
−0.601 |
0.993 (0.970, 1.017) |
0.548 |
性别 |
0.152 |
0.293 |
0.520 |
1.164 (0.656, 2.067) |
0.603 |
糖尿病 |
1.026 |
0.327 |
3.139 |
2.790 (1.470, 5.296) |
0.002 |
心脑 |
0.171 |
0.296 |
0.577 |
1.186 (0.664, 2.119) |
0.564 |
胆道疾病 |
0.194 |
0.345 |
0.562 |
1.214 (0.617, 2.387) |
0.574 |
白细胞计数 |
0.042 |
0.026 |
1.621 |
1.043 (0.991, 1.097) |
0.105 |
中性粒细胞计数 |
0.034 |
0.021 |
1.628 |
1.035 (0.993, 1.078) |
0.104 |
单核细胞计数 |
−0.618 |
0.347 |
−1.779 |
0.539 (0.273, 1.064) |
0.075 |
淋巴细胞计数 |
−1.21 |
0.303 |
−3.992 |
0.298 (0.165, 0.540) |
<0.001 |
血红蛋白 |
−0.005 |
0.007 |
−0.706 |
0.995 (0.981, 1.009) |
0.480 |
中性粒细胞百分率 |
0.125 |
0.025 |
5.115 |
1.133 (1.079, 1.190) |
<0.001 |
血小板 |
−0.006 |
0.002 |
−4.040 |
0.994 (0.990, 0.998) |
<0.001 |
C反应蛋白 |
0.009 |
0.002 |
4.199 |
1.009 (1.005, 1.013) |
<0.001 |
降钙素原 |
0.019 |
0.004 |
4.788 |
1.019 (1.011, 1.027) |
<0.001 |
凝血酶原时间 |
0.158 |
0.067 |
2.339 |
1.171 (1.027, 1.336) |
0.019 |
国际标准化比值 |
1.794 |
0.764 |
2.347 |
6.013 (1.345, 26.882) |
0.019 |
部分凝血活酶时间 |
0.008 |
0.022 |
0.384 |
1.008 (0.965, 1.052) |
0.701 |
纤维蛋白原 |
−0.349 |
0.117 |
−2.973 |
0.705 (0.561, 0.887) |
0.003 |
D-二聚体 |
0 |
0 |
1.724 |
1.000 (1.000, 1.000) |
0.085 |
空腹血糖 |
0.211 |
0.042 |
5.049 |
1.235 (1.137, 1.341) |
<0.001 |
镁 |
−0.619 |
1.179 |
−0.525 |
0.538 (0.053, 5.429) |
0.599 |
钙 |
−1.193 |
0.675 |
−1.769 |
0.303 (0.081, 1.139) |
0.077 |
磷 |
−1.546 |
0.586 |
−2.637 |
0.213 (0.068, 0.672) |
0.008 |
白蛋白 |
−0.188 |
0.033 |
−5.630 |
0.829 (0.777, 0.884) |
<0.001 |
球蛋白 |
−0.147 |
0.032 |
−4.622 |
0.863 (0.811, 0.919) |
<0.001 |
白球比 |
−0.542 |
0.638 |
−0.850 |
0.582 (0.167, 2.031) |
0.395 |
前白蛋白 |
−0.008 |
0.003 |
−2.499 |
0.992 (0.986, 0.998) |
0.012 |
总胆红素 |
0.015 |
0.004 |
3.553 |
1.015 (1.007, 1.023) |
<0.001 |
直接胆红素 |
0.021 |
0.006 |
3.508 |
1.021 (1.009, 1.033) |
<0.001 |
间接胆红素 |
0.032 |
0.014 |
2.373 |
1.033 (1.005, 1.061) |
0.018 |
谷丙转氨酶 |
0 |
0 |
0.593 |
1.000 (1.000, 1.000) |
0.553 |
谷草转氨酶 |
0 |
0 |
−0.117 |
1.000 (1.000, 1.000) |
0.907 |
乳酸脱氢酶 |
0 |
0 |
0.738 |
1.000 (1.000, 1.000) |
0.460 |
胆碱酯酶 |
0 |
0 |
−3.482 |
1.000 (1.000, 1.000) |
<0.001 |
碱性磷酸酶 |
0.003 |
0.001 |
1.953 |
1.003 (1.001, 1.005) |
0.051 |
尿素 |
0.006 |
0.007 |
0.857 |
1.006 (0.992, 1.020) |
0.391 |
肌酐 |
0.008 |
0.003 |
2.299 |
1.008 (1.002, 1.014) |
0.022 |
补体C1q |
−0.006 |
0.004 |
−1.541 |
0.994 (0.986, 1.002) |
0.123 |
尿酸 |
0.002 |
0.001 |
2.002 |
1.002 (1.000, 1.004) |
0.045 |
sofa评分 |
0.415 |
0.067 |
6.167 |
1.514 (1.328, 1.727) |
<0.001 |
NLR |
0.041 |
0.01 |
4.113 |
1.042 (1.022, 1.062) |
<0.001 |
SII |
0 |
0 |
2.930 |
1.000 (1.000, 1.000) |
0.003 |
PNI |
−0.096 |
0.025 |
−3.839 |
0.908 (0.865, 0.954) |
<0.001 |
CAR |
0.293 |
0.05 |
5.906 |
1.340 (1.215, 1.478) |
<0.001 |
脓肿数量 |
0.446 |
0.319 |
1.399 |
1.562 (0.836, 2.919) |
0.162 |
最大直径 |
−0.117 |
0.061 |
−1.933 |
0.890 (0.789, 1.003) |
0.053 |
位置 |
0.253 |
0.221 |
1.147 |
1.288 (0.835, 1.986) |
0.251 |
由于在变量较多同时样本量相对较少的数据训练过程中很容易出现共线性和过拟合的问题,会导致模型复杂度较大,之后进一步处理数据选用Lasso回归。Lasso回归是一种基于L1正则化的线性回归方法,通过惩罚项(λ值)压缩回归系数,将无关变量的系数收缩至零,从共线性变量中筛选出与结果相关度最强的变量,降低模型复杂度。与传统回归相比,Lasso尤其适用于高维数据(如本研究候选预测因子较多时),能有效解决多重共线性问题并提升模型泛化能力,选择最小λ值(λ = 0.030)的1个标准误为最优值,得到中性粒细胞百分率、空腹血糖、sofa评分、白蛋白、纤维蛋白原为纳入模型中的特征。
将以上筛选出来的指标进行多因素logistic回归分析,最终得到sofa评分(OR = 1.306, 95% CI: 1.136~1.507, P < 0.001)、中性粒细胞百分率(OR = 1.089, 95% CI: 1.029~1.152, P = 0.004)、空腹血糖(OR = 1.194, 95% CI: 1.086~1.311, P < 0.001)、白蛋白(OR = 0.901, 95% CI: 0.840~0.967, P = 0.004)与肝外侵袭独立相关。见“表3”。通过VIF值对以上4个变量进行检验,VIF值 > 10视为存在严重共线性,5~10视为存在中度共线性,表中各指标VIF值均接近1,表明这些变量几乎不存在共线性问题,数据相互独立。见“表4”。
Table 3. Multivariate logistic regression analysis
表3. 多因素logistic回归分析
指标 |
回归系数 |
标准误 |
Z |
OR (95% CI) |
P |
常数项 |
−8.086 |
2.892 |
−2.796 |
- |
0.005 |
sofa评分 |
0.267 |
0.071 |
3.762 |
1.306 (1.136, 1.501) |
<0.001 |
空腹血糖 |
0.177 |
0.048 |
3.643 |
1.194 (1.086, 1.311) |
<0.001 |
中性粒细胞百率 |
0.085 |
0.029 |
2.908 |
1.089 (1.029, 1.152) |
0.004 |
白蛋白 |
−0.104 |
0.036 |
−2.856 |
0.901 (0.840, 0.967) |
0.004 |
Table 4. Variance inflation factor table
表4. VIF表
sofa评分 |
空腹血糖 |
中性粒细胞百分率 |
白蛋白 |
1.074578 |
1.006591 |
1.069692 |
1.068725 |
3.3. 列线图构建
根据多因素Logistic回归筛选出4个独立预测因素构建列线图模型。见“图1”。每个指标有其对应的分值范围,通过将每个变量的取值转换为相应的得分,总分值通过图表线性映射转化为肝外侵袭的预测概率;图中所示,当各因素所对应的分值相加总和为185分时,所对应的肝外侵袭的风险概率为50%。
Figure 1. Column line graph prediction model
图1. 列线图预测模型
3.4. 模型验证
通过计算ROC曲线下面积(Area Under Curve, AUC)来对该模型区分度进行评价,AUC的取值范围为0.5至1,其中0.5表示模型无判别能力,1表示模型判别能力完美,图中单一指标的AUC值皆大于0.5,联合检测的AUC = 0.840 (95% CI: 0.784~0.897),提示模型区分能力相对较高。见“图2”。结合ROC曲线对筛选出的因素进行截断值分析,最终得到SOFA评分 > 1.5、中性粒细胞百分比 > 82.95%、空腹血糖 > 9.11 mmol/L、白蛋白 < 24.61 g/L是肝脓肿发生侵袭综合征的独立危险因素。见“表5”。对模型进行Hosmer-Lemeshow检验,P = 0.66 > 0.05,同时绘制模型的可视化校准曲线图,可以看出预测风险与标准线表示的实际风险贴合良好,两者皆提示模型均具有良好的校准能力。见“图3”。绘制预测模型的决策曲线(DCA),评估模型的临床效益,区别于传统的灵敏度、特异度等单一评估标准,临床决策曲线可以综合考虑不同阈值下的获益,横坐标指阈值概率,即认为该疾病发生概率达到该值时,采取相应干预措施(如进一步治疗和检查)所带来的收益大于风险,纵坐标指净收益,指在不同阈值概率下采取干预措施所获得的收益,考虑了真阳性带来的益处减去假阳性带来的损害,如果模型的决策曲线在整个或大部分阈值概率范围内均高于两条参考线,表明模型在广泛的临床情境下可能具有实际应用价值,DCA图显示当阈值概率在0.01~0.99时模型均能产生的一定的临床效益。见“图4”。采用原始数据进行bootstrap法进行内部验证,通过1000次从原始小样本数据集中有放回的重复抽样,生成多个新的数据子集,并在每个子数据集上重新训练模型和计算ROC曲线,进而评估模型的稳定性和性能,通过ROC曲线可以更直观地评估模型在不同子集上的表现,减少因样本量少带来的偏差,图中灰色区域为多次bootstrap抽样得到的ROC曲线,曲线相对较集中,表明模型性能较为稳定。见“图5”。
Figure 2. Receiver operating characteristic curve
图2. ROC曲线
Table 5. Effectiveness evaluation table of different variables
表5. 不同变量的效能评估表
指标 |
AUC (95% CI) |
P值 |
阈值 |
特异度 |
灵敏度 |
联合检测 |
0.840 (0.784, 0.897) |
<0.001 |
0.17 |
82.23% |
73.68% |
sofa评分 |
0.741 (0.668, 0.814) |
<0.001 |
1.50 |
83.13% |
57.89% |
中性粒细胞率 |
0.733 (0.671, 0.795) |
<0.001 |
82.95 |
55.12% |
84.21% |
空腹血糖 |
0.719 (0.651, 0.788) |
<0.001 |
9.11 |
71.69% |
64.91% |
白蛋白 |
0.724 (0.648, 0.799) |
<0.001 |
24.61 |
84.34% |
50.88% |
Figure 3. Calibration curve
图3. 校准曲线
Figure 4. Decision curve analysis curve
图4. DCA曲线
Figure 5. Bootstrap internal validation receiver operating characteristic curve
图5. Bootstrap内部验证ROC曲线
4. 讨论
SOFA评分通过量化呼吸、凝血、肝脏、循环、神经及肾功能的损害程度,反映了病原体与宿主相互作用的动态进程。脓毒症导致宿主对感染的反应失调引起危及生命的器官功能障碍。SOFA总分达到或超过2分时,提示可能存在脓毒症[11]。研究表明,SOFA评分对脓毒症患者的死亡率具有良好的预后预测准确性[12] [13]。目前已有研究表明肝脓肿患者合并脓毒症更容易发生侵袭性感染[14]-[16]。本研究中,SOFA评分 > 1.5即为肝脓肿发生侵袭综合征的独立预测因子之一,提示我们在临床工作中应密切关注SOFA评分较高的肝脓肿患者,他们可能面临更高的侵袭性感染风险,及时识别并采取有效干预措施,或许能降低并发症发生率,改善患者预后。
中性粒细胞是血液中主要的吞噬细胞,其功能状态可能与患者的免疫应答能力相关。有小鼠实验研究表明携带吞噬肺炎克雷伯菌的中性粒细胞可能通过血流将细菌转运到远处部位,后被免疫系统裂解释放出游离的细菌,导致侵袭性感染可能,但进一步机制尚未阐述[17]。有研究表明NLR (中性粒细胞计数/淋巴细胞计数)可作为预测脓毒症休克[18]和早期评估IKPLAS发生风险的标志物[19],该指标是联合反应炎症与免疫状态的新兴指标,本研究在初始时也纳入该指标,单因素logistic提示有明显相关性,但在后续共线性变量筛选过程中被剔除。中性粒细胞百分比作为传统炎症指标,其特异性可能低于IL-6等新型标志物,鉴于住院患者IL-6检查率偏低,由于临床上非危重患者未做该检验,本研究未将其纳入考量,后续研究可对不同炎症标志物进行对比分析。
糖尿病被证明是肺炎克雷伯菌感染的独立危险因素,血糖控制不佳的肺炎克雷伯肝脓肿患者有更高的转移性感染的发生率[20]-[23]。高血糖会显著改变机体的内环境,为细菌的滋生和繁殖提供有利条件,同时增加细菌的耐药性[24],从而使细菌能够迅速生长和扩散,导致感染难以控制;此外,高血糖还会导致机体免疫功能紊乱,降低白细胞的抑菌作用,并破坏血管内膜功能,使得细菌更易沿血流向外播散。糖化血红蛋白是反应血糖长期控制状态的指标,相较于临时的空腹血糖更能反应机体长期内部状态,但临床上将该指标作为入院后常规检查的情况较少,导致缺失数据过多,没有纳入分析,后续有待在感染患者中加强对该指标的完善。该结果提示对于糖尿病合并肺炎克雷伯菌感染的患者,除了积极的抗感染及局部引流治疗外,还应严格控制血糖水平,以改善机体的内环境,提高机体的免疫力,从而有助于控制感染并减少转移性感染的发生。
本研究提示白蛋白 < 24.61 g/L是肝脓肿发生侵袭综合征的独立预测因子,低白蛋白血症常与严重感染及脓毒症相关,有研究表明白蛋白是肝脓肿伴糖尿病患者发生脓毒血症的预测因子[25]。血清白蛋白是肝脏合成的重要蛋白之一,在运输多种免疫相关物质中扮演重要角色。其含量降低会扰乱免疫细胞的正常代谢和功能,削弱机体对细菌等病原体的防御能力,进而导致脓肿难以局限和吸收,更易扩散至周围组织和器官,这可能是潜在的影响机制。
目前,针对糖尿病患者的肺炎克雷伯肝脓肿侵袭综合征的预测模型为数不多,且均为单中心小样本研究。其中一项研究筛选出空腹血糖、血红蛋白、血尿素氮、脓肿大小和SOFA评分作为危险因素构建模型[26];另一项研究则筛选出血红蛋白、血小板、D-二聚体和SOFA评分作为危险因素[27]。研究结果差异可能与不同研究中心、纳入研究对象范围不同、样本量差异以及统计方法学中参数设置的不同等因素有关。然而,两项研究结果中均包含SOFA评分,这提示感染程度的加重更可能预示侵袭性感染的发生。
与既往关于糖尿病合并肺炎克雷伯肝脓肿侵袭综合征预测模型的研究相比,本研究纳入的变量更为丰富,涵盖了更多可能影响疾病发生发展的因素,样本量也相对较大,一定程度上可提高研究结果的可靠性与稳定性。此外,本研究聚焦于非糖尿病和糖尿病的总人群,更贴近临床实际,能够为不同患者群体提供更广泛适用的疾病危险因素信息和预测模型,对早期识别肺炎克雷伯肝脓肿侵袭综合征具有重要的临床指导意义。
本研究也存在一定的局限性:1) 样本量方面:本研究样本量较少,未侵袭组332例、侵袭组57例,由于肺炎克雷伯肝脓肿侵袭性感染患病率低,实际中难以获取大量样本,虽然满足传统的10EPV原则(每个变量至少10个事件),但仍限制了模型泛化能力和结果准确性。处理:① 采用SMOTE改善数据不均衡;② Lasso回归可以针对较多的变量简化模型同时减少共线性和过拟合,提高模型在小样本数据上的泛化能力;③ 采用Bootstrap等重抽样技术进行内部验证,在有限样本下评估模型稳定性。2) 数据收集可能存在选择偏倚,样本来自特定地区或医院,不能完全代表总体;研究仅关注部分临床指标,可能遗漏其他潜在危险因素。
5. 结论及未来展望
本研究通过单中心回顾性分析,最终得出SOFA评分 > 1.5分、中性粒细胞百分比 > 82.95%、空腹血糖 > 9.11 mmol/L、白蛋白 < 24.61 g/L是肝脓肿发生侵袭综合征的独立危险因素,结合以上指标绘制了列线图并通过ROC曲线、校准曲线、临床决策曲线、bootstrap内部验证均提示模型预测性能良好,对临床上早期识别高风险人群有一定指导意义。但也存在局限性,后续可多中心合作扩大样本量,纳入不同地区患者,减少选择偏倚;同时,综合更多生物学指标,完善危险因素分析,优化预测模型。
NOTES
*通讯作者。