基于机器学习构建腹膜炎患者发生脓毒血症的预测模型
Construction of a Predictive Model for Sepsis in Peritonitis Patients Based on Machine Learning
DOI: 10.12677/acm.2025.152528, PDF, HTML, XML,   
作者: 何 锟, 金能烈, 聂 飚*:暨南大学附属第一医院消化内科,广东 广州
关键词: 腹膜炎脓毒血症机器学习预测模型Peritonitis Sepsis Machine Learning Predictive Model
摘要: 腹膜炎是全球重症监护病房患者败血症的第二大死亡原因,脓毒血症的早期预测对于及时干预并最终改善预后至关重要。本研究基于新型的机器学习算法,建立并验证腹膜炎患者发展为脓毒血症的预测模型,研究结果提示机器学习模型可以成为预测腹膜炎患者预测脓毒血症的可靠工具,并且,随机森林算法模型具有最佳的预测性能,这种机器学习方法可用于帮助临床医生对于高风险因素的认识并早期干预以降低死亡率。
Abstract: Peritonitis is the second leading cause of sepsis-related mortality in intensive care unit (ICU) patients worldwide. Early prediction of sepsis is critical for timely intervention and ultimately improving prognosis. This study established and validated a predictive model for the development of sepsis in peritonitis patients using novel machine learning algorithms. The findings suggest that machine learning models can be a reliable tool for predicting sepsis in peritonitis patients. Among them, the random forest algorithm model showed the best predictive performance. This machine learning approach can help clinicians recognize high-risk factors and intervene early to reduce mortality.
文章引用:何锟, 金能烈, 聂飚. 基于机器学习构建腹膜炎患者发生脓毒血症的预测模型[J]. 临床医学进展, 2025, 15(2): 1707-1717. https://doi.org/10.12677/acm.2025.152528

1. 引言

脓毒血症是重症监护室腹膜炎患者中常见且复杂的临床并发症[1],其发生往往引发一系列严重后果,不仅延长患者的住院时间,还显著增加发病率和医疗经济负担。腹膜炎是继复杂性肺炎之后进入重症监护室的第二大原因,占所有患者的5.8%~10%,几乎占感染患者的20% [2]。当怀疑患者患有重度脓毒症时,腹膜炎患者的重要器官支持治疗显得尤为关键,从手术前开始,并在术后根据需要持续进行。支持治疗包括疼痛管理、镇静、通气优化、血流动力学和液体监测、肾功能改善、营养和抗凝[3]-[6]。据报道,一些生物标志物如乳酸、C反应蛋白、降钙素原、单核细胞趋化蛋白-1、降钙素原[7]-[10]可能有助于在器官功能障碍进一步发展之前,识别出正在发展为严重脓毒症的患者。然而,由于检测技术要求高且成本较高,这些生物标志物在临床环境中难以普及。一些评分系统,包括简化急性生理学评分和序贯器官衰竭评估等也已用于脓毒血症的预测,但由于特异性和敏感性较差,其表现并不理想。此外,一些基于传统统计方法的多变量预测模型,如逻辑回归和多元风险模型,已被开发用于预测患者脓毒症的发展。因此,探索更有效和准确的预测工具在脓毒症患者的管理中极为重要。

近年来,由于统计理论和计算机技术的发展,机器学习已经引起了临床医生的关注并获得了他们的认可。新型机器学习技术已广泛用于各种疾病的预测模型,与传统逻辑或多元回归分析相比,表现出更好的性能[11]。在近两年的研究中我们可以发现在机器算法用于脓毒血症患者的应用已经有相当多的学者做出了大量努力。Wen-Yuan Zhang等人通过机器学习,分析及验证儿童脓毒症的诊断性生物标志物和免疫细胞浸润特征[11];Nianzong Hou使用XGboost的机器学习方法,预测脓毒症患者的30天死亡率,并确定该模型的性能优于传统预测模型[12];Jingyuan Ning等人利用三种机器学习算法共同鉴定了脓毒症患者的LILRA5标记基因[13]

对于腹膜炎患者,及时、有效的外科处理是至关重要的。没有有效的外科处理,病死率接近100%,这惊人的数据提示我们对于腹膜炎提早识别高危因素并进行有效的干预是非常重要的[14]。在这项研究中,我们旨在开发和验证多个机器学习的模型来预测腹膜炎患者的脓毒血症,并找到预测性能最好的模型。

2. 研究方法

方法数据来源使用结构化查询语言,从名为重症监护医学信息集市III (MIMIC-III)数据库的单中心公开数据库中提取脓毒症患者的数据。MIMIC-III数据库是一个综合的、去识别的、全面的临床数据集,包含2001年6月1日至2012年10月31日期间在马萨诸塞州波士顿Beth Israel Deaconess医疗中心ICU住院的所有患者。MIMIC-III包括有关入院和出院患者的详细信息,如人口统计学特征、监测生命体征、实验室和微生物检查、影像学检查、观察和记录摄入量和排出量、药物治疗、住院时间、生存数据以及出院或死亡记录。为了申请访问该数据库,我们通过了人类研究参与者保护考试,并获得了相应的证书(No. 54890596),从MIMIC-III数据库中提取了2056名因腹膜炎诊断而入住ICU的患者。这些患者患有各种类型的腹膜炎,包括原发性腹膜炎与继发性腹膜炎。排除标准包括年龄小于18岁的患者、入ICU后24小时内死亡的患者、入住ICU超过一次的患者以及缺失数据超过20%的患者。最终,共有1055名腹膜炎患者被纳入研究,从MIMIC-III数据库中检索入院后最初24小时内的患者数据。本研究使用了以下信息:(1) 人口统计学特征,包括性别、年龄和种族;(2) 合并症,包括充血性心力衰竭、高血压、慢性肺病、糖尿病和肝病;(3) 生命体征,包括心率、体温、血氧饱和度;(4) 实验室指标,包括总胆红素、阴离子间隙、白蛋白、氯、钾、钠、乳酸、部分凝血活酶时间(PTT)、凝血酶原时间(PT)、国际标准化比值(INR)、肌酐、血尿素氮(BUN)和葡萄糖;(5) 治疗和临床管理,包括机械通气和血管加压药的使用,由于这是一项基于假设的流行病学研究,因此未尝试估计研究的样本量。相反,MIMIC-III数据库中的所有合格患者均入组,以实现最大的统计功效。为了最大限度地减少缺失数据导致的偏倚,在最终队列中排除缺失值超过20%的变量,并使用多重插补(MI)方法重复其他变量。MI是处理缺失值的一种优秀且广泛使用的方法[15]。MI可以用多个合理的可能值插补每个缺失值。该过程考虑了缺失值背后的不确定性,并可以产生多个数据集,从中可以估计感兴趣的参数。例如,如果您对多变量模型中协变量的系数感兴趣,则将从每个数据集估计系数,从而产生多个系数。考虑到缺失值估计的不确定性,将这些系数组合起来,给予一个有效的系数估计。MI估计的系数方差比单一插补估计的系数方差更不可能被低估[16]

数据分析

统计分析将连续变量归结为均值及标准差,并使用Wilcoxon秩和检验进行比较。类别变量用数字和百分比表示,并用卡方检验或Fisher精确概率法进行比较,特征选择是模型构建的重要步骤。Boruta算法通过比较每个特征的Z值和“阴影特征”的Z值来识别最重要的特征。通过复制所有真实特征并对其进行顺序洗牌,在每次迭代中从随机森林模型中获得每个属性的Z值,并通过对真实特征的随机洗牌来生成阴影的Z值。在多次独立试验中,如果一个真实特征的Z值大于阴影特征的最大Z值,则该特征被认为是“重要的”[17]。在特征选择后,采用逻辑回归、k近邻、支持向量机、决策树、随机森林、极梯度增强和人工神经网络等7种最大似然算法进行建模。对训练集和验证集进行了十次交叉验证,以防止过度拟合,并用于建立预测模型。因此,整个数据集被随机分为10个折叠。其中7个用作模型开发的训练集,其余1个用作模型验证的验证集。因为10个折叠中的每一个都被用作验证集,所以上述过程重复10次。最后,在验证集上对各模型的性能进行了验证和比较。在我们的例子中,(ROC)曲线的曲线下面积(AUC)最高及相关模型评价指标综合评估的模型被选为每种算法的最优模型。预测模型的性能是在辨别、校准和临床实用性方面进行的。通过ROC曲线的AUC、敏感度、特异度、回忆度、准确度和F1评分来定量评估辨别能力,采用决策曲线分析(DCA)对其临床应用进行研究。采用R版本4.0.5进行统计分析和建模,双侧P值和0.05被认为具有统计学意义。

3. 结果

MIMIC-III数据库中提取了2656名入住ICU且诊断为肝硬化的患者。纳入的患者患有各种类型的腹膜炎,排除标准包括年龄小于18岁的患者、入住ICU后24小时内死亡的患者、入住ICU一次以上的患者以及缺失数据大于20%的患者,共有1055名患者纳入我们的分析,其中,492 (46.6%)名患者入住ICU后出现了脓毒血症。

脓毒血症组与非脓毒血症组之间的特征差异如表1所示。体重越重的患者更容易发生脓毒血症。患有脓毒血症患者的患者冠心病、急性肾损伤、凝血功能障碍的发生率更高,机械通气的使用率更高;阴离子间隙,碳酸氢盐,尿素氮,钙,肌酐,红细胞压积,白细胞,MCHC,MCV,呼吸频率更高、有创呼吸机使用更多。收缩压,舒张压,平均动脉压,体温,SpO2均低于非脓毒血症的腹膜炎患者(P < 0.05)。

Table 1. The baseline characteristics of peritonitis patients

1. 腹膜炎患者的基线特征

Characteristics

Total (n = 1055)

sepsis-NO (n = 563)

sepsis-YES (n = 492)

p value

ethnicity = WHITE (%)

721 (68.3)

379 (67.3)

342 (69.5)

0.485

gender = M (%)

589 (55.8)

300 (53.3)

289 (58.7)

0.086

weight (mean (SD))

82.15 (22.34)

80.39 (21.20)

84.16 (23.44)

0.006

diabetes = YES (%)

251 (23.8)

133 (23.6)

118 (24.0)

0.948

Coronary artery disease = YES (%)

67 (6.4)

27 (4.8)

40 (8.1)

0.037

AKI = YES (%)

611 (57.9)

263 (46.7)

348 (70.7)

<0.001

splenomegaly = YES (%)

2 (0.2)

2 (0.4)

0 (0.0)

0.539

Hypertension = YES (%)

207 (19.6)

113 (20.1)

94 (19.1)

0.752

ckd = YES (%)

217 (20.6)

118 (21.0)

99 (20.1)

0.795

copd = YES (%)

46 (4.4)

22 (3.9)

24 (4.9)

0.536

pleural effusion = YES (%)

166 (15.7)

81 (14.4)

85 (17.3)

0.23

ascites = YES (%)

491 (46.5)

257 (45.6)

234 (47.6)

0.576

dysfunction of blood coagulation = YES (%)

317 (30.0)

140 (24.9)

177 (36.0)

<0.001

heart failure = YES (%)

173 (16.4)

84 (14.9)

89 (18.1)

0.192

portal hypertension = YES (%)

267 (25.3)

149 (26.5)

118 (24.0)

0.393

Liver cirrhosis = YES (%)

424 (40.2)

226 (40.1)

198 (40.2)

1

gallstones = YES (%)

4 (0.4)

3 (0.5)

1 (0.2)

0.714

Ventilator = YES (%)

158 (15.0)

56 (9.9)

102 (20.7)

<0.001

hemodialysis = YES (%)

24 (2.3)

12 (2.1)

12 (2.4)

0.899

aniongap (mean (SD))

17.06 (5.17)

16.23 (4.74)

18.00 (5.48)

<0.001

bicarbonate (mean (SD))

20.77 (5.14)

21.85 (4.74)

19.53 (5.30)

<0.001

bun (mean (SD))

35.74 (28.06)

32.40 (27.22)

39.57 (28.53)

<0.001

calcium (mean (SD))

8.16 (1.00)

8.24 (0.92)

8.07 (1.08)

0.006

chloride (mean (SD))

101.35 (7.70)

101.08 (7.47)

101.67 (7.95)

0.218

creatinine (mean (SD))

1.95 (1.98)

1.79 (1.98)

2.12 (1.97)

0.008

glucose (mean (SD))

144.35 (84.10)

139.72 (61.76)

149.64 (103.75)

0.056

sodium (mean (SD))

135.83 (6.29)

135.79 (6.17)

135.87 (6.42)

0.838

potassium (mean (SD))

4.32 (0.92)

4.30 (0.82)

4.34 (1.03)

0.397

inr (mean (SD))

1.86 (0.94)

1.79 (0.89)

1.95 (1.00)

0.006

pt (mean (SD))

20.19 (10.44)

19.30 (9.00)

21.22 (11.81)

0.003

ptt (mean (SD))

41.84 (21.80)

40.04 (19.01)

43.90 (24.46)

0.004

hematocrit (mean (SD))

31.30 (7.45)

30.78 (7.31)

31.90 (7.56)

0.015

hemoglobin (mean (SD))

10.25 (2.50)

10.13 (2.47)

10.38 (2.52)

0.112

platelets (mean (SD))

216.58 (147.56)

214.53 (151.48)

218.92 (143.06)

0.63

wbc (mean (SD))

13.17 (9.03)

12.48 (7.61)

13.95 (10.37)

0.008

mch (mean (SD))

30.71 (3.32)

30.68 (3.26)

30.74 (3.38)

0.799

mchc (mean (SD))

32.73 (1.72)

32.91 (1.68)

32.53 (1.74)

<0.001

mcv (mean (SD))

93.85 (8.81)

93.26 (8.51)

94.52 (9.11)

0.021

rbc (mean (SD))

3.38 (0.89)

3.34 (0.90)

3.41 (0.89)

0.192

rdw (mean (SD))

16.52 (2.87)

16.44 (2.95)

16.61 (2.79)

0.346

alt (mean (SD))

97.27 (359.29)

98.31 (409.77)

96.09 (291.40)

0.921

alp (mean (SD))

141.03 (144.64)

141.16 (147.28)

140.88 (141.71)

0.975

ast (mean (SD))

187.32 (765.25)

191.58 (894.65)

182.43 (583.86)

0.847

bilirubin_total (mean (SD))

4.69 (8.14)

4.84 (8.67)

4.51 (7.50)

0.504

first_time_heart_rate (mean (SD))

98.63 (21.25)

97.12 (21.29)

100.37 (21.08)

0.013

first_time_sbp (mean (SD))

118.46 (25.34)

123.50 (24.94)

112.70 (24.58)

<0.001

first_time_dbp (mean (SD))

65.71 (18.43)

67.65 (18.63)

63.50 (17.95)

<0.001

first_time_mbp (mean (SD))

79.95 (19.07)

82.50 (18.95)

77.04 (18.80)

<0.001

first_time_sbp_ni (mean (SD))

116.17 (25.54)

121.25 (25.16)

110.36 (24.73)

<0.001

first_time_dbp_ni (mean (SD))

65.74 (19.29)

67.64 (19.30)

63.56 (19.06)

0.001

first_time_mbp_ni (mean (SD))

77.92 (19.45)

80.46 (19.37)

75.01 (19.15)

<0.001

first_time_resp_rate (mean (SD))

20.51 (6.52)

19.71 (6.05)

21.42 (6.91)

<0.001

first_time_temperature (mean (SD))

36.69 (0.88)

36.76 (0.82)

36.61 (0.95)

0.005

first_time_spo2 (mean (SD))

96.48 (4.81)

96.83 (3.75)

96.08 (5.78)

0.011

first_time_glucose (mean (SD))

1088.15 (30783.16)

1915.37 (42139.10)

141.56 (65.66)

0.351

Dobutamine = YES (%)

19 (1.8)

4 (0.7)

15 (3.0)

0.009

dopamine = YES (%)

27 (2.6)

10 (1.8)

17 (3.5)

0.127

Adrenaline = YES (%)

46 (4.4)

8 (1.4)

38 (7.7)

<0.001

Norepinephrine = YES (%)

454 (43.0)

121 (21.5)

333 (67.7)

<0.001

isoproterenol = YES (%)

274 (26.0)

104 (18.5)

170 (34.6)

<0.001

antidiuretic hormone = YES (%)

220 (20.9)

41 (7.3)

179 (36.4)

<0.001

oxygen = YES (%)

880 (83.4)

469 (83.3)

411 (83.5)

0.985

dialysis = YES (%)

24 (2.3)

12 (2.1)

12 (2.4)

0.899

Invasive ventilator = YES (%)

158 (15.0)

56 (9.9)

102 (20.7)

<0.001

3.1. 特征选择

基于Boruta算法的特征筛选结果如图1所示。按照Z值的顺序,与脓毒血症最密切的变量分别为体重、急性肾损伤、机械通气、阴离子间隙、碳酸氢盐、尿素氮、肌酐、红细胞压积、白细胞、总胆红素、肾上腺素、异丙肾上腺素、血管加压素、机械通气等20个指标。

横轴是每个变量的名称,纵轴是每个变量的Z值。箱线图显示模型计算过程中每个变量的Z值。蓝色框代表前20个重要变量,红色框代表暂定属性,绿色框代表不重要变量。

Figure 1. Feature selection plot based on Boruta algorithm

1. 基于Boruta算法的特征选择图

3.2. 模型性能比较

我们生成了7个机器学习模型来预测腹膜炎患者入住ICU后脓毒血症的发生。图2显示了7个模型在ROC曲线方面的区分性能。7个模型中,极梯度增强模型(AUC = 0.796)对腹膜炎患者发生脓毒血症的预测效果最好,其次是最忌森林(AUC = 0.794),决策树模型(AUC = 0.722),逻辑回归(AUC = 0.719),支持向量机(AUC = 0.718),人工神经网络(AUC = 0.691),K-近邻(AUC = 0.634)。以逻辑回归模型(AUC = 0.719)作为参考时,极梯度增强模型,随机森林模型和决策树模型对腹膜炎患者发生脓毒血症的预测能力优于逻辑回归模型。然而,决策树(AUC = 0.718),人工神经网络模型(AUC = 0.691),K-近邻(AUC = 0.634)模型的区分度不如逻辑回归模型(图2)。表2列出了7个模型的一组详细性能指标。RF模型的准确度(0.752),灵敏度(0.765),召回率(0.765),F1评分(0.742)第一,特异性(0.741),第二,根据DCA曲线(图3),随机森林模型表现出更大的净效益和阈值概率,表明随机森林模型是具有良好临床实用性的最佳模型。

Table 2. Model performance metrics

2. 模型性能指标

Accuracy

Sensitivity

Specificity

Recall

F1score

RF

0.752380952

0.765306122

0.741071429

0.765306122

0.742574257

XGB

0.752380952

0.704081633

0.794642857

0.704081633

0.726315789

SVM

0.719047619

0.704081633

0.732142857

0.704081633

0.700507614

NNET

0.680952381

0.632653061

0.723214286

0.632653061

0.64921466

KNN

0.638095238

0.571428571

0.696428571

0.571428571

0.595744681

LOGI

0.723809524

0.642857143

0.794642857

0.642857143

0.684782609

DCtree

0.685714286

0.653061224

0.714285714

0.653061224

0.659793814

RF:随机森林;XGB:极梯度增强;SVM:支持向量机;NNET:人工神经网络;KNN:k-近邻;LOGI:逻辑回归;DCtree:决策树。

Figure 2. Receiver operating characteristic curves of seven models

2. 七个模型的操作特征曲线

rand_forest:随机森林;boost_tree:极梯度增强;svm_rbf:支持向量机;mlp:人工神经网络;nearest_neighbor:k-近邻;logistic_reg:逻辑回归;decision_tree:决策树。

Figure 3. Calibration curves of seven models

3. 七个模型的校准曲线图

4. 讨论

在这项回顾性研究中,我们开发并验证了基于机器学习的模型,来预测腹膜炎患者发展为脓毒血症。我们的研究有几个新颖的贡献。首次,我们的研究纳入了七种常用的机器学习算法进行全面分析。尽管机器学习模型在区分度和校准度方面表现出良好的预测准确性,但这并不等同于其在临床实践中的有用性。当净收益的阈值概率不切实际时,即使性能良好的模型也可能具有有限的适用性[18]。因此,我们应用决策曲线分析(DCA)曲线来验证这些机器学习模型的临床适用性。另外,Boruta算法可以帮助我们充分理解自变量的重要性,从而更有效地进行特征选择。最后,我们使用SHAP特征重要性评估方法对开发的模型进行全局解释。

脓毒血症是一项公认的全球健康挑战[19],全球脓毒血症的发病率不断增加,脓毒症的死亡率高达40% [20]。腹膜炎是全球重症监护病房患者发生脓毒血症的第二大原因。脓毒血症的存在对腹膜炎患者的死亡率增加有着显著影响,在一项对1997年至2000年间华盛顿州81家医院紧急或紧急收治的患者进行的回顾性观察研究中,腹膜炎患者的总体死亡率为6%,但严重败血症患者的死亡率升至34% [21]。一旦患者符合脓毒性休克标准,心血管不稳定、脓毒症相关凝血病和器官衰竭恶化就会导致死亡率超过50%,在发展中国家甚至高达80% [22]。因此,早期识别脓毒血症并积极治疗,对提高腹膜炎患者生存率,改善脓毒血症患者预后及减少住院时间和医疗费用至关重要。虽然,许多研究人员试图寻找可靠的生物标志物来诊断和治疗脓毒症。CRP和降钙素原水平是最常用的诊断和预后标志物,但其能力有限[23]。尽管进行了大量研究,但没有任何一种生物标志物能够可靠地识别有发生严重脓毒症或脓毒性休克风险的患者[24] [25]。因此,开发和推广可靠的预测模型对于识别这些患者并为他们提供及时有效的干预措施以改善其预后显得尤为紧迫。

以往的研究表明,与ML模型相比,SOFA和SAPS II评分系统存在预测性能差、灵敏度和特异性低、波动范围宽、过程繁琐等缺点[11]。使用机器学习算法来预测疾病的发展已经成为一个新的研究领域。Suru Yue等人[26]使用机器学习算法来预测脓毒症患者住院期间AKI的发展,SOFA and SAPS II score的AUC分别为0.6457和0.7015,而XGBoost模型的AUC为0.821,XGBoost模型在区分度、校准和临床应用方面的预测性能均优于传统评分系统;Luming Zhang,等人[27]构建了一个基于机器学习(RSF算法)的预后模型来预测老年脓毒症患者30天的死亡风险,该模型(C指数0.73)与传统评分系统SOFA、SAPSII和APSIII进行了比较,优于传统的评分系统。机器学习算法已被用于替代传统评分系统来预测疾病的发生,但是这是首次将机器学习算法用于腹膜炎患者脓毒血症的预测。

Boruta算法已成为特征选择中广泛使用的方法,通过模拟随机性来确定哪些特征对于预测目标变量最重要[17]。可自动进行特征选择,无需手动调整参数或选择特定的特征子集。能够识别与目标变量完全相关的特征,这些特征可能对预测模型具有显著贡献。Boruta算法通过使用随机森林和自助重采样技术,它可以有效地处理大规模数据集,并保持泛化能力,避免过拟合问题。本研究中Boruta算法的特征选择结果表明,体重、急性肾损伤、机械通气、阴离子间隙、碳酸氢盐、尿素氮、肌酐、红细胞压积、白细胞、总胆红素、肾上腺素、异丙肾上腺素、血管加压素、机械通气等20个指标显着占据绿色区域,在特征选择中表现出较高的Z分数。这表明可能在本研究中发挥着至关重要的作用,显示出与研究目标的显着相关性,这些因素反映了全身炎症反应、器官功能衰竭和循环不稳定的严重程度,常见于脓毒症。例如,急性肾损伤、阴离子间隙升高以及电解质和代谢指标的变化表明代谢紊乱和脏器灌注不足,而机械通气和使用血管加压药物则提示呼吸或循环衰竭的严重程度。白细胞计数和总胆红素升高可能反映感染和肝功能障碍。综合这些临床标志物,可以预测腹膜炎患者发展脓毒血症的风险,帮助及时进行干预和治疗,由于这些指标可以在入院时轻松评估,因此可以作为腹膜炎患者发生脓毒血症的便捷预测指标。

在已经开发的七个机器学习模型中,随机森林模型在预测脓毒血症方面表现最好,AUC为0.794,准确度为0.752,敏感度为0.765,特异度为0.741,临床医生可以根据随机森林模型预测的风险评分决定是否加强监测、调整治疗方案或提前进行脓毒症预防治疗。对于模型预测高风险的患者,临床医生可以提前准备资源,如加强生命体征监控、对高危因素进行及时的纠正等。迄今为止,已经开发出基于机器学习来预测腹膜炎引起的脓毒症患者的术后死亡率[28]。该模型仅利用脓毒血症术后的临床数据来预测死亡率,无法帮助临床医生警惕腹膜炎患者脓毒血症的发生。在我们的研究中,通过复杂的随机森林模型,我们发现去甲肾上腺素,急性肾损伤,抗利尿激素和收缩压主要与腹膜炎患者发生脓毒血症相关。合并肾损伤会增加脓毒症的发生风险,急性肾损伤与脓毒血症有关,这与已有的研究一致[29]。去甲肾上腺素是脓毒性休克推荐使用的一线药物,可以降低死亡率和预防心血管损伤[30]。疾病的进展使组织和器官灌注减少,外周血管收缩来代偿,导致肾脏灌注不足,少尿无尿,低血压。

我们的研究中有一些局限性需要注意。第一,这是一项回顾性研究,存在一定的信息偏差和在其他人群中的适用性以控制的问题,从而限制了因果推论。第二,在我们研究中,使用MIMIC-III数据库作为一个包含大量重症监护病房(ICU)患者的高质量公共数据库,已经被广泛应用于多项研究,且其数据涉及到不同种族、性别和疾病类型,因此具有一定的代表性。在本研究中,我们利用MIMIC-III数据库的多样化数据来构建模型,并进行内部验证缺乏外部数据集的验证是一个重要的局限性。我们计划在未来的研究中,使用外部数据集对模型进行验证,从而进一步评估其在不同人群中的适用性和泛化能力。第三,样本选择可能会受到已知或未知因素的影响,导致样本在某些方面不具有代表性,这可能会影响研究的外部效度。然而,我们依然相信,所构建的模型有助于临床医生及时治疗发生脓毒血症高风险的腹膜炎患者。

5. 结论

总之,机器学习模型可以成为预测腹膜炎患者进展为脓毒症的可靠工具。在所有预测模型中,随机森林模型是最有效的模型,它可以帮助临床医生针对有脓毒血症风险的腹膜炎患者制定精准的管理方案并实施早期干预,以降低死亡率。

NOTES

*通讯作者。

参考文献

[1] Ross, J.T., Matthay, M.A. and Harris, H.W. (2018) Secondary Peritonitis: Principles of Diagnosis and Intervention. BMJ, 361, k1407.
https://doi.org/10.1136/bmj.k1407
[2] De Waele, J., Lipman, J., Sakr, Y., Marshall, J.C., Vanhems, P., Barrera Groba, C., et al. (2014) Abdominal Infections in the Intensive Care Unit: Characteristics, Treatment and Determinants of Outcome. BMC Infectious Diseases, 14, Article No. 420.
https://doi.org/10.1186/1471-2334-14-420
[3] Chow, A.W., Evans, G.A., Nathens, A.B., Ball, C.G., Hansen, G., Harding, G.K., et al. (2010) Canadian Practice Guidelines for Surgical Intra‐Abdominal Infections. Canadian Journal of Infectious Diseases and Medical Microbiology, 21, 11-37.
https://doi.org/10.1155/2010/580340
[4] Solomkin, J.S., Mazuski, J.E., Bradley, J.S., Rodvold, K.A., Goldstein, E.J.C., Baron, E.J., et al. (2010) Diagnosis and Management of Complicated Intra-Abdominal Infection in Adults and Children: Guidelines by the Surgical Infection Society and the Infectious Diseases Society of America. Clinical Infectious Diseases, 50, 133-164.
https://doi.org/10.1086/649554
[5] Dellinger, R.P., Levy, M.M., Rhodes, A., Annane, D., Gerlach, H., Opal, S.M., et al. (2013) Surviving Sepsis Campaign: International Guidelines for Management of Severe Sepsis and Septic Shock, 2012. Intensive Care Medicine, 39, 165-228.
https://doi.org/10.1007/s00134-012-2769-8
[6] Montravers, P., Dupont, H., Leone, M., Constantin, J., Mertes, P., Laterre, P., et al. (2015) Guidelines for Management of Intra-Abdominal Infections. Anaesthesia Critical Care & Pain Medicine, 34, 117-130.
https://doi.org/10.1016/j.accpm.2015.03.005
[7] Rivers, E., Nguyen, B., Havstad, S., Ressler, J., Muzzin, A., Knoblich, B., et al. (2001) Early Goal-Directed Therapy in the Treatment of Severe Sepsis and Septic Shock. New England Journal of Medicine, 345, 1368-1377.
https://doi.org/10.1056/nejmoa010307
[8] Karzai, W., Oberhoffer, M., Meier-Hellmann, A. and Reinhart, K. (1997) Procalcitonin—A New Indicator of the Systemic Response to Severe Infections. Infection, 25, 329-334.
https://doi.org/10.1007/bf01740811
[9] Bozza, F.A., Salluh, J.I., Japiassu, A.M., Soares, M., Assis, E.F., Gomes, R.N., et al. (2007) Cytokine Profiles as Markers of Disease Severity in Sepsis: A Multiplex Analysis. Critical Care, 11, R49.
https://doi.org/10.1186/cc5783
[10] O’Grady, N.P., Barie, P.S., Bartlett, J.G., Bleck, T., Carroll, K., Kalil, A.C., et al. (2008) Guidelines for Evaluation of New Fever in Critically Ill Adult Patients: 2008 Update from the American College of Critical Care Medicine and the Infectious Diseases Society of America. Critical Care Medicine, 36, 1330-1349.
https://doi.org/10.1097/ccm.0b013e318169eda9
[11] Hou, N., Li, M., He, L., Xie, B., Wang, L., Zhang, R., et al. (2020) Predicting 30-Days Mortality for MIMIC-III Patients with Sepsis-3: A Machine Learning Approach Using Xgboost. Journal of Translational Medicine, 18, Article No. 462.
https://doi.org/10.1186/s12967-020-02620-5
[12] Zhang, W., Chen, Z., An, X., Li, H., Zhang, H., Wu, S., et al. (2023) Analysis and Validation of Diagnostic Biomarkers and Immune Cell Infiltration Characteristics in Pediatric Sepsis by Integrating Bioinformatics and Machine Learning. World Journal of Pediatrics, 19, 1094-1103.
https://doi.org/10.1007/s12519-023-00717-7
[13] Ning, J., Fan, X., Sun, K., Wang, X., Li, H., Jia, K., et al. (2023) Single-Cell Sequence Analysis Combined with Multiple Machine Learning to Identify Markers in Sepsis Patients: Lilra5. Inflammation, 46, 1236-1254.
https://doi.org/10.1007/s10753-023-01803-8
[14] Montravers, P., Blot, S., Dimopoulos, G., Eckmann, C., Eggimann, P., Guirao, X., et al. (2016) Therapeutic Management of Peritonitis: A Comprehensive Guide for Intensivists. Intensive Care Medicine, 42, 1234-1247.
https://doi.org/10.1007/s00134-016-4307-6
[15] Blazek, K., van Zwieten, A., Saglimbene, V. and Teixeira-Pinto, A. (2021) A Practical Guide to Multiple Imputation of Missing Data in Nephrology. Kidney International, 99, 68-74.
https://doi.org/10.1016/j.kint.2020.07.035
[16] Dong, M. and Mitani, A. (2023) Multiple Imputation Methods for Missing Multilevel Ordinal Outcomes. BMC Medical Research Methodology, 23, Article No. 112.
https://doi.org/10.1186/s12874-023-01909-5
[17] Lei, J., Sun, T., Jiang, Y., Wu, P., Fu, J., Zhang, T., et al. (2021) Risk Identification of Bronchopulmonary Dysplasia in Premature Infants Based on Machine Learning. Frontiers in Pediatrics, 9, Article ID: 719352.
https://doi.org/10.3389/fped.2021.719352
[18] Yue, S., Li, S., Huang, X., Liu, J., Hou, X., Wang, Y., et al. (2022) Construction and Validation of a Risk Prediction Model for Acute Kidney Injury in Patients Suffering from Septic Shock. Disease Markers, 2022, Article ID: 9367873.
https://doi.org/10.1155/2022/9367873
[19] Fleischmann, C., Scherag, A., Adhikari, N.K.J., Hartog, C.S., Tsaganos, T., Schlattmann, P., et al. (2016) Assessment of Global Incidence and Mortality of Hospital-Treated Sepsis. Current Estimates and Limitations. American Journal of Respiratory and Critical Care Medicine, 193, 259-272.
https://doi.org/10.1164/rccm.201504-0781oc
[20] Pandey, S. (2024) Sepsis, Management & Advances in Metabolomics. Nanotheranostics, 8, 270-284.
https://doi.org/10.7150/ntno.94071
[21] Anaya, D.A. and Nathens, A.B. (2003) Risk Factors for Severe Sepsis in Secondary Peritonitis. Surgical Infections, 4, 355-362.
https://doi.org/10.1089/109629603322761418
[22] Jawad, I., Lukšić, I. and Rafnsson, S.B. (2012) Assessing Available Information on the Burden of Sepsis: Global Estimates of Incidence, Prevalence and Mortality. Journal of Global Health, 2, Article ID: 010404.
https://doi.org/10.7189/jogh.01.010404
[23] Pierrakos, C. and Vincent, J. (2010) Sepsis Biomarkers: A Review. Critical Care, 14, R15.
https://doi.org/10.1186/cc8872
[24] Kofoed, K., Andersen, O., Kronborg, G., Tvede, M., Petersen, J., Eugen-Olsen, J., et al. (2007) Use of Plasma C-Reactive Protein, Procalcitonin, Neutrophils, Macrophage Migration Inhibitory Factor, Soluble Urokinase-Type Plasminogen Activator Receptor, and Soluble Triggering Receptor Expressed on Myeloid Cells-1 in Combination to Diagnose Infections: A Prospective Study. Critical Care, 11, R38.
https://doi.org/10.1186/cc5723
[25] Shapiro, N.I., Trzeciak, S., Hollander, J.E., Birkhahn, R., Otero, R., Osborn, T.M., et al. (2009) A Prospective, Multicenter Derivation of a Biomarker Panel to Assess Risk of Organ Dysfunction, Shock, and Death in Emergency Department Patients with Suspected Sepsis. Critical Care Medicine, 37, 96-104.
https://doi.org/10.1097/ccm.0b013e318192fd9d
[26] Yue, S., Li, S., Huang, X., Liu, J., Hou, X., Zhao, Y., et al. (2022) Machine Learning for the Prediction of Acute Kidney Injury in Patients with Sepsis. Journal of Translational Medicine, 20, Article No. 215.
https://doi.org/10.1186/s12967-022-03364-0
[27] Zhang, L., Huang, T., Xu, F., Li, S., Zheng, S., Lyu, J., et al. (2022) Prediction of Prognosis in Elderly Patients with Sepsis Based on Machine Learning (Random Survival Forest). BMC Emergency Medicine, 22, Article No. 26.
https://doi.org/10.1186/s12873-022-00582-z
[28] Lim, S.H., Kim, M.J., Choi, W.H., Cheong, J.C., Kim, J.W., Lee, K.J., et al. (2023) Explainable Machine Learning Using Perioperative Serial Laboratory Results to Predict Postoperative Mortality in Patients with Peritonitis-Induced Sepsis. Annals of Surgical Treatment and Research, 105, 237-244.
https://doi.org/10.4174/astr.2023.105.4.237
[29] De La Rica, A.S., Gilsanz, F. and Maseda, E. (2016) Epidemiologic Trends of Sepsis in Western Countries. Annals of Translational Medicine, 4, 325-325.
https://doi.org/10.21037/atm.2016.08.59
[30] Zhou, F., Mao, Z., Zeng, X., Kang, H., Liu, H., Pan, L., et al. (2015) Vasopressors in Septic Shock: A Systematic Review and Network Meta-Analysis. Therapeutics and Clinical Risk Management, 11, 1047-1059.
https://doi.org/10.2147/tcrm.s80060