1. 引言
在ICU中,AKI的发病率和死亡率都处于较高水平[1]-[3]。这不仅严重影响患者的健康,还带来了沉重的经济负担,而目前医学界尚未找到有效的根治方法[4]。危重症AKI的死亡机制十分复杂,涉及多种因素相互交织。因此,构建一个包含多个相关风险因素的预测模型,或许能为解决这一难题提供更有效的途径。MIMIC IV数据库包含6万多名患者的临床数据,在医疗大数据中,机器学习方法可以更方便地处理自变量的多重共线性,可以提高预后预测模型的预测辨别力[5] [6]。在医学领域,机器学习技术如随机森林和梯度提升机已被广泛应用[7] [8]。本研究的最佳模型随机森林算法,通过SHAP方法,不仅提供了对整体功能的全局解释,还详细阐述了如何利用个性化输入数据对重症AKI患者进行特定预测的局部解释。最终模型在内部和外部验证中均展现出良好的性能,能够助力临床医生早期识别高危AKI患者并及时进行干预。
2. 资料与方法
2.1. 一般资料
MIMIC数据库对患者信息进行了脱敏处理。在获得人类研究参与者保护评估(证书编号55810423)的授权后,我们使用结构化查询语言(SQL)从该数据库中提取数据。主要研究终点为住院死亡率,数据被分为训练队列和验证队列,比例7:3。
急性肾损伤(AKI)的诊断标准依据改善全球肾脏病预后组织(KDIGO)的标准确定,包括:在48小时内血清肌酐增加0.3 mg/dl;血清肌酐较基线升高1.5倍,且该变化发生在前7天内;或者尿量 < 0.5 mL/kg/小时,持续6小时。我们利用Navicat Premium (版本16)中的SQL编程工具从MIMIC-IV数据库中提取临床数据,数据收集过程遵循了Deshmukh等[9]的既定程序。
该研究收集的变量特征包括年龄、性别、体重和身高。合并疾病包括高血压、糖尿病、充血性心力衰竭、冠心病、急性心肌梗死、脑血管疾病、慢性肺部疾病、慢性肝病、恶性肿瘤。我们收集诊断AKI24小时心率、收缩压、舒张压、呼吸频率、体温和SpO2、中心静脉压、白细胞、红细胞分布宽度、中性粒细胞计数、血清氯、血清钠、血清钾、乳酸脱氢酶、动脉血乳酸、PCO2、碳酸氢盐、阴离子间隙、血清纤维蛋白原、凝血酶原时间、活化部分凝血酶时间、D-二聚体、尿酸、肌酸激酶、肌酸激酶同工酶、BNP和血糖、尿比重、丙氨酸转氨酶、碱性磷酸酶、天冬氨酸转氨酶、总胆红素的最大值,患者住ICU期间最大的肌酐值及最大的AKI分期。选择红细胞、红细胞压积、血红蛋白、血小板、淋巴细胞计数、血清钙、PH、PO2、白蛋白在诊断AKI24小时内的最小值。治疗包括在ICU住院期间是否机械通气和使用血管升压药、CRRT治疗,是否使用肾毒性药(头孢类抗生素、甘露醇)。我们计算了顺序器官衰竭评估(SOFA)、APACHEII最大值,斯哥昏迷评分(GCS)的最小值。存活组和死亡组患者在性别、年龄和实验室检查等一般资料方面比较,差异无统计学意义(P > 0.05),具有可比性。
纳入标准:(1) 年龄 ≥ 18岁;(2) 符合肾脏疾病:改善全球结局(KDIGO) AKI诊断标准;(3) ICU住院时间超过6小时;(4) 对于多次住院的患者,仅包括首次住院的信息。
排除标准为:(1) 慢性肾脏病患者。(2) 数据严重缺失患者。
2.2. 方法
从MIMIC-IV数据库中筛选出28,484例首次入住ICU的患者数据,排除了6338例合并慢性肾脏病、27例住院实际时间少于6小时的患者,剔除了患者缺失值超过15%的患者,删除缺失高于20%的特征变量,最终得到3701例可用于分析的患者数据。
采用R语言中的“mice”软件包对剩余数据中的缺失值进行插补。基于收缩压和舒张压计算出平均动脉压、身高和体重计算出体重指数。利用方差膨胀因子(VIF)评估特征之间的共线性。存在高共线性的特征组合包括:身高、体重与体重指数;收缩压、舒张压与平均动脉压;红细胞与血红蛋白,并排除了身高、体重、收缩压、舒张压以及红细胞,其余50个特征用于构建预测模型。
2.3. 外部验证
MIMIC III患者的外部数据集进行外部验证。纳入和排除标准与MIMIC IV数据库提取数据相同。
2.4. 模型开发和比较
本研究从MIMIC IV数据库中获取数据,并将其分为两部分:70%的数据用于模型训练,30%的数据用于内部验证。此外,使用独立的外部数据集进行外部验证。研究中运用了10种机器学习模型来预测危重急性肾损伤患者的死亡风险,包括自适应增强、人工神经网络、决策树、额外树、梯度增强机、k近邻、逻辑回归、随机森林、支持向量机和极限梯度增强。
分类变量以频率(百分比)的形式呈现,符合正态分布的连续变量以均值 ± 标准差表示,不符合正态分布的连续变量则以中位数(四分位数范围)表示。为了评估模型的性能,采用受试者工作特征曲线下面积(AUC)、敏感性、特异性、阳性预测值(PPV)、阴性预测值(NPV)、准确性和F1评分衡量模型的可靠性和预测能力。
2.5. 特征选择和模型解释
在本研究中,我们通过多轮特征选择流程(包括低方差过滤、高相关性过滤、互信息筛选、SHAP值分析以及递归特征消除)来确定最佳的特征组合。基于Python 3.12版本,我们构建了10种不同的机器学习模型,并对其预测性能进行了评估。SHAP方法解释模型。
2.6. 统计学方法
数据分析采用Python 3.12和R 4.3.2。不服从正态分布的连续变量,采用中位数和四分位数间距来描述其分布特征,Mann-Whitney U检验或Kruskal-Wallis H检验进行不同组别间的比较;分类变量则以频数和百分比的形式呈现,统计分析采用卡方检验或费舍尔精确检验。模型的预测性能通过受试者工作特征曲线下面积(AUC)来评估。当双侧P值小于0.05时,认为结果具有统计学显著性。
3. 结果
3.1. 患者特征
在3701名患者中,中位年龄65岁,女性1532人(41.3%),417名为AKI 1期,1529名为AKI 2期,1755名为AKI 3期。合并高血压1065人(28.7%),合并糖尿病935人(25。2%),死亡999人(26.9%)。
3.2. 模型开发和性能比较
10个模型中,随机森林模型(AUC = 0.807)对死亡风险的预测效果最好,其次是额外树模型(AUC = 0.803)和梯度增强机模型(AUC = 0.8029)。表现最好的前5个模型的判别性能列于表1。
Table 1. Predictive performance of the top 5 machine learning models
表1. 前5个机器学习模型预测性能
机器学习模型 |
AUC |
Sensitivity |
Specificity |
PPV |
NPV |
accuracy |
F1 score |
RF |
0.807 |
0.376 |
0.942 |
0.703 |
0.807 |
0.703 |
0.490 |
ET |
0.803 |
0.339 |
0.786 |
0.699 |
0.858 |
0.699 |
0.457 |
GBM |
0.8029 |
0.403 |
0.929 |
0.672 |
0.929 |
0.672 |
0.504 |
XGboost |
0.771 |
0.380 |
1.000 |
0.592 |
1.000 |
0.592 |
0.531 |
Adaboost |
0.759 |
0.241 |
0.743 |
0.586 |
0.743 |
0.586 |
0.461 |
PPV:阳性预测值,NPV阴性预测值。PPV:positive predictive value;NPV:negative predictive value。
3.2. 最终模型的识别
最终模型根据10个机器学习模型的AUC和预测准确率确定。10种机器学习模型的ROC曲线见图1。
Figure 1. ROC curves of 10 machine learning models
图1. 10种机器学习模型ROC曲线
3.3. 最终模型的外部验证
Figure 2. ROC curve for external validation
图2. 外部验证ROC曲线
对于外部验证,最终模型的AUC为0.720,准确率为0.850,表明最终模型在内部验证和外部验证中都表现出了较好的性能。外部验证ROC曲线见图2。
3.4. 模型的解释
Figure 3. (A) SHAP summary bar chart of the best RF model; (B) SHAP summary lattice chart of the best RF model; (C) SHAP dependency graphThe dependency diagram shows how a single feature affects the output of the prediction model, with each point representing a single patient. A SHAP value for a specific feature greater than zero pushes the decision towards the death category
图3. (A) RF最佳模型SHAP汇总条形图;(B) RF最佳模型SHAP汇总点阵图;(C) SHAP依赖关系图依赖图显示单个特征如何影响预测模型的输出,每个点表示单个患者。超过零的特定特征的SHAP值将决策推向死亡类
本研究采用SHAP方法解释模型,其提供了模型层面的全局解释和个体层面的局部解释。如图3A所示的SHAP汇总图,通过平均SHAP值来衡量各个特征对模型的贡献程度。此外,SHAP依赖性图能够揭示单个特征如何影响模型的预测输出。例如,图3C展示了12个特征的真实值与对应的SHAP值之间的关系,其中大于零的SHAP值表示该特征对模型的预测产生了正向影响,即提示死亡风险较高。
局部解释专注于分析如何结合特定个体的输入数据来做出预测。以图4为例,根据预测模型,该患者的死亡概率为69%。这种局部解释能够帮助临床医生更好地理解模型是如何针对个体患者做出具体预测的。
Figure 4. Explaining the local model using SHAP method. On the left, the patient characteristic value is shown. The bar chart shows that the SHAP value is positive, indicating that the feature promotes the death of patients, and if it is negative, it reduces the risk of death
图4. 用SHAP方法解释局部模型。左侧为患者特征值,条形图SHAP值为正,说明该特征能促进患者死亡,如果为负,则降低死亡风险
4. 讨论
本研究利用MIMIC数据库,运用10种机器学习方法建立了危重AKI患者死亡风险的预测模型。机器学习方法凭借其处理大数据的能力,能够有效处理高维数据。MIMIC数据库数据量大、质量高,为预测模型的发展提供了有力支持。
在我们的数据中,所有特征缺失值均小于20%。R语言中“mice”包通过链式方程进行多重插补,生成多个完整数据集,减少偏差,是处理缺失数据的可靠工具。临床预测模型的多轮特征选择通过“粗筛→精筛→验证”分层优化,逐步剔除低方差、高相关冗余特征,并结合互信息和SHAP值捕捉非线性关联与模型贡献,最终通过递归消除验证稳定性。其优势在于提升模型性能(如AUC提高)、增强临床可解释性(保留关键指标)及高效降维(减少90%无关变量),同时平衡计算效率与复杂数据适应性,为临床决策提供精简可靠的预测工具。我们基于随机森林算法构建了一个包含12个特征的最终预测模型。这些特征在ICU入院期间能够轻松获取或评估。
在模型中,血清阴离子间隙是影响危重AKI患者死亡风险的最重要因素。已有研究[10]证实,高阴离子间隙(AG)与脓毒症[11]等疾病的严重程度或不良预后呈正相关。其升高常与乳酸酸中毒、酮症酸中毒或尿毒症相关。酸中毒通过激活肾小管凋亡通路,抑制肾小管再生能力,延缓肾功能恢复,还可抑制心肌收缩力、降低血管反应性,加重休克并增强促炎因子(如IL-6、TNF-α)释放,增加患者死亡风险。此外,年龄也是重症患者死亡率的重要影响因素,随着年龄的增长,重症患者的死亡率显著上升[12]。随着年龄增加,肾单位逐渐减少,肾动脉硬化导致肾脏血流调节能力减弱,且肾小管上皮细胞再生能力降低,AKI后肾功能恢复延迟,肾小球滤过率下降更易发生肾毒性药物相关AKI,且高龄患者固有免疫与适应性免疫减退,增加患者死亡风险。高钠血症被证明是ICU住院死亡的独立危险因素,而低钠血症可能导致神经系统症状、昏迷甚至死亡[13]。低尿量同样是AKI患者死亡的危险因素,它可能引发高钾血症、代谢性酸中毒和多器官功能衰竭等并发症。凝血酶原时间主要反映凝血因子的合成状态,是评估重症患者凝血功能的重要指标,间接影响患者的预后[14]。
高BMI (肥胖)患者脂肪细胞分泌促炎因子(如IL-6、瘦素),加剧全身炎症反应,游离脂肪酸(FFA)堆积导致肾小球系膜细胞凋亡,加重蛋白尿和肾纤维化,增加患者死亡风险。血清白蛋白水平是反映营养状态的重要指标。白蛋白可结合自由基(如活性氧ROS),抑制脂质过氧化,保护肾小管上皮细胞,并可结合内毒素及促炎因子(如IL-6、TNF-α),减轻全身炎症反应。低白蛋白减少对自由基的清除能力,导致线粒体功能障碍和肾小管上皮细胞凋亡。血清白蛋白每下降10 g/L,AKI患者死亡风险增加40%。为了阐释机器学习模型的“黑箱”问题,我们还采用了SHAP解释模型。
本研究构建的预测模型未区分病因。然而,不同病因对重症监护室急性肾损伤患者的预后可能存在影响。这一不足可能会限制模型在特定病因患者群体中的预测精准度,未来研究可考虑将病因纳入模型构建因素,以进一步优化模型性能。
然而,本研究也存在一些局限性。第一,模型中缺失了一些重要的特征,例如中心静脉压和心肌酶等。第二,我们在未考虑急性肾损伤病因的情况下建立了AKI死亡风险预测模型。第三,该模型基于美国人群的数据库构建和验证,其在全球人群中的适用性尚不明确,需要进一步评估其泛化能力。第四,ICU住院期间诊断AKI后的24小时数据可能存在选择偏倚。
综上,我们成功开发了一个具有临床应用潜力的预测模型。该模型最终纳入的12个特征在临床实践中易于获取。最终的随机森林模型在内部和外部验证中均表现出良好的预测能力。未来需要开展更多的随机对照研究,以确定基于该预测模型的及时治疗措施是否能够改善重症AKI患者的预后。
NOTES
*通讯作者。