基于倾向性得分匹配的特定ICU患者PTCA临床结果分析
Analysis of PTCA Clinical Results of Specific ICU Patients Based on Propensity Score Matching
DOI: 10.12677/ORF.2021.113034, PDF, HTML, XML, 下载: 390  浏览: 571  科研立项经费支持
作者: 舒国福, 戴家佳:贵州大学数学与统计学院,贵州 贵阳
关键词: PTCA特定ICU患者倾向性得分匹配生存状况PTCA Specific ICU Patients Propensity Score Matching Survival Status
摘要: 为探究对于做PTCA手术的特定(心肺功能等异常) ICU患者与非手术ICU患者生存状况的差异。从eICU数据库中收集ICU患者数据148,532例,其中,接受PTCA手术治疗的患者8862例(PTCA手术组),未接受PTCA手术治疗的患者139,670例(非手术组)。通过倾向性得分匹配(PSM)分析方法,运用1:1最近邻匹配来平衡组间各协变量之间的差异后,比较两组患者生存率的差异。通过倾向性得分匹配,两组共匹配出17,686例,PTCA手术组和非手术组各8843例。匹配前,除阿帕奇评分算法版本(Apache version)之外的组间各协变量之间的不均衡性明显(均有P < 0.001)。匹配后,PTCA手术组和非手术组的组间各协变量之间的分布特征接近(均有P > 0.001);PTCA手术组的ICU患者的生存率明显优于非手术组(P < 0.001)。最终结果显示,对于特定的ICU患者做PTCA手术可明显改善其生存状况,故推荐可耐手术的特定ICU患者积极尝试PTCA手术这种治疗方案。
Abstract: To explore the difference between the survival status of ICU patients and non-surgical ICU patients who undergo PTCA surgery (abnormal cardiopulmonary function, etc.). The data of 148,532 ICU patients were collected from the eICU database. Among them, 8862 patients received PTCA surgery (PTCA surgery group), and 139,670 patients did not receive PTCA surgery (non-surgical group). After propensity score matching (PSM) analysis method, 1:1 nearest neighbor matching was used to balance the differences between the covariates between the groups, the differences in survival rates between the two groups were compared. Through propensity score matching, a total of 17,686 cases were matched between the two groups, 8443 cases in each of the PTCA operation group and the non-operation group. Before matching, the imbalance between the covariates among the groups other than the Apache version was obvious (All P < 0.001). After matching, the distribution characteristics of the covariates between the PTCA surgery group and the non-surgery group are similar (All P > 0.001); the survival rate of ICU patients in the PTCA surgery group is significantly better than that of the non-surgery group (P < 0.001). The final results show that PTCA surgery for specific ICU patients can significantly improve their survival. Therefore, it is recommended that specific ICU patients who are resistant to surgery actively try PTCA surgery.
文章引用:舒国福, 戴家佳. 基于倾向性得分匹配的特定ICU患者PTCA临床结果分析[J]. 运筹与模糊学, 2021, 11(3): 289-299. https://doi.org/10.12677/ORF.2021.113034

1. 引言

当前,重症监护室(Intensive Care Unit, ICU)主要用于收治由于各种原因导致的呼吸衰竭、心脏衰竭、严重创伤等各种危重的生命体征不平稳的重症医学患者。PTCA [1] (Percutaneous transluminal coronary angioplasty),是经皮管状动脉腔内血管成形术的简称,也就是冠脉支架植入的手术。一般这种手术是针对急性心肌梗塞、慢性的堵塞或者心肌绞痛等心脏功能异常的人。由于进入重症监护室的患者的特殊性,部分患者需在进入急诊重症监护室二十四小时内做PTCA手术,但是患者在做了PTCA手术之后是否对其生存情况有显著的良性改善在医学上目前相关的研究还很少,需要进一步的、大样本量的去不断研究和证实。

eICU合作研究数据库(eICU-CRD)是由飞利浦集团和美国麻省理工学院(MIT)计算生物学实验(LCP)合作创建的大型公共数据库,收集了2014~2015年美国208家医院的ICU患者的大量高质量的临床信息,很好的解决了医务工作者缺少大数据进行临床研究的现状。其中涵盖了患者的生命体征、护理记录、疾病诊断、治疗信息等众多特征数据,为我们现在的临床研究和临床决策提供了大量的重要数据支撑。目前,倾向性得分匹配 [2] [3] [4] (Propensity Score Matching, PSM)是使用很广泛和最主流的一种用来平衡协变量之间的差异性的方法。和月月等 [5] 用倾向性得分匹配来研究生态扶贫政策对农户生计策略和收入的影响,取得较好的平衡协变量的效果。杨沛轩等 [6] 用倾向性得分匹配来讨论手术对广泛期小细胞肺癌患者生存的影响,并取得较好的研究结论。鲁伟群等 [7] 使用倾向性得分匹配讨论IVB期结直肠癌患者原发灶切除的临床意义,最终得到原发灶切除对治疗IVB期结直肠癌有巨大作用。由于eICU数据库中的数据存在不同程度的不均衡性 [8],为了平衡各协变量之间的差异性,本研究基于eICU数据库中的apache Patient Result表单数据,通过倾向性得分匹配分析方法匹配各组之间的差异性,比较重症医学患者在入ICU二十四小时内做PTCA手术是否能改善其生存状况,并采用Kaplan-Meier方法 [9] [10] [11] [12] 进行生存分析。

2. 数据来源及研究方法

2.1. 数据来源

我们对eICU数据库里面的数据进行筛选,选出Apache Patient Result表单数据,里面变量包括医师专长、患者是否有术前心肌梗塞、实际ICU住院时间、死亡情况等23个变量。同时,里面的少数变量数据存在缺失,并且他们都是严重缺失的情况,采用数据填补后进行分析已经没有太大意义,所以我们对这部分进行了删除处理,通过数据清洗最终保留16个协变量。纳入标准:一个患者多次入ICU我们纳入第一条记录。本研究我们共收集了符合要求的ICU患者数据148,532条(例)。在148,532条ICU患者数据中,入ICU二十四小时内接受PTCA手术治疗的患者共8862例(PTCA手术组),未接受PTCA手术治疗的患者139,670例(非手术组)。

2.2. 研究方法

2.2.1. 倾向性得分匹配

倾向性得分匹配,现在已被不少人验证它在对于观测数据(observational data)或者非实验数据 [13] (non-experimental data)进行干预效果的评估时作用巨大,是目前常被用在医学上评价某项干预(治疗)方案是否有效的一种较为新奇且有效的统计方法。首先,我们根据完整数据,将成员 k ( k = 1 , 2 , , N ) 的倾向值定义为:给定观测的协变量向量 x k 的情况下,成员k被分配到某一个特定干预组 ( W k = 1 ) 而不是非干预组 ( W k = 0 ) 的条件概率:

e ( x k ) = p r ( W k = 1 | X k = x k ) (1)

倾向值的最大的好处就在于它能对数据的维度进行简化,因为向量X一般情况下都会包含大量的协变量,即存在多维度的状况,而我们的倾向值方法就是把所有的这些维度简化成一个一维的值。这就意味着,我们可以使用倾向值来平衡样本数据里面的干预组与控制组之间的差异性。相关理论已经证明了拥有同样的倾向值的一名干预组和控制组的成员在我们观测到的协变量 上具有相同的分布,这就说明即使我们的干预组和控制组在各协变量上的取值有差异,那么这种差异也不是常规的非系统差异,而是随机差异。我们把具有相同倾向值或者倾向值的取值在我们给定偏差范围内的干预组与控制组成员匹配在一起进行分析的方法定义为倾向性得分匹配分析法。很多时候,我们直接用上面所提到的条件概率公式算倾向值是很复杂的。一般情况下,我们是用logistic回归对倾向值(即接受干预的条件概率)进行估计,表达式如下:

P ( W k | X k = x k ) = E ( W k ) = e X k β k 1 + e X k β k = 1 1 + e X k β k (2)

式中的 W k = 1 代表成员处于干预状态, W k = 0 代表成员处于控制状态, X k 表示条件变量的向量, β k 表示向量回归参数。

2.2.2. 生存分析

生存分析,是目前被广泛应用在删失数据处理上的一种分析方法。我们假设时间T代表生存时间, F ( t ) = P ( T t ) 代表T的分布函数, F ¯ ( t ) = 1 F ( t ) 定义为T的生存分布函数,用来表示个体生存时间大于t的概率。假设 T 1 , T 2 , , T n 为独立同分布且非负的代表寿命的随机变量, C 1 , C 2 , , C n 为独立同分布且非负的代表删失的随机变量。我们定义:

X k = min ( T k , C k ) , δ k = I [ T k C k ] , k = 1 , 2 , , n (3)

此外我们令 δ ( k ) 为对应 X ( k ) δ 值,并有 X ( k ) = X l 时, δ ( k ) = δ l 。记 ( t ) 为在时刻t还在活着的个体数,即为风险集。且做如下假设:

n k = ( X ( k ) ) 里面的个体数, d k = 在时刻 X ( k ) 的死亡数;

p k = P ( I k | I k ) = P ( T > τ k | T > τ k 1 ) q k = 1 p k

我们有 p k q k 的估计如下:

q ^ k = d k n k (4)

p ^ k = 1 q ^ k = { 1 1 n k , δ ( i ) = 1 1 , δ ( i ) = 0 (5)

最终,我们根据Kaplan-Meier方法对生存分布函数的估计如下:

F ¯ ^ n ( t ) = 1 F ^ n ( t ) = X ( k ) t p ^ k = X ( k ) t ( 1 1 n k ) δ ( k ) = X ( k ) t ( 1 1 n k + 1 ) δ ( k ) (6)

3. 结果分析

采用1:1最近邻匹配 [14] [15] (Nearest Neighbor Matching),匹配容差为0.2。两组的比较运用t检验,若呈现非高斯分布(Non-Gaussian distribution)则一般采用Wilcoxon秩和检验 [16]。匹配前,ICU患者的生存时间的中位数(即实际入ICU停留时间)大约为40小时(图1);其中的PTCA手术组中位生存期约为42小时,而非手术组的中位生存期约为25小时。Kaplan-Meier生存曲线分析显示两组之间的差异具有统计学意义,非手术组的ICU患者实际入ICU停留时间短于PTCA手术组的ICU患者(P < 0.001) (图2)。

Figure 1. Survival curves of patients in the intensive care unit before matching

图1. 匹配前ICU患者生存曲线

Figure 2. Survival curve of ICU patients in the PTCA operation group and the non-operation group before matching

图2. 匹配前PTCA手术组与非手术组ICU患者生存曲线

在进行进一步的分析之前,我们先比较两组基线特征,发现PTCA手术组和非手术组两组的专科医生(Physician Speciality)、医师干预类别(Physician Intervention Category)、急性生理学评分(Acute Physiology Score)、阿帕奇分数(Apache Score)、阿帕奇评分算法版本(Predicted ICU Mortality)、ICU预测停留时间(Predicted ICU Los)、ICU实际停留时间(Actual ICU Los)、医院预测死亡率(Predicted Hospital Mortality)、医院实际死亡情况(Actual Hospital Mortality)、住院预测时间(Predicted Hospital Los)、住院实际时间(Actual Hospital Los)、是否有术前性心肌梗塞(preopmi)、是否进行过术前心脏导管检查(preopcardiaccath)、未删减ICU实际停留时间(unabridged unit los)、为删减住院实际时间(unabridged hosp los)这些协变量均有统计学上的差异(均有P < 0.001);为了匹配两组基线在特征上的差异化,本研究运用倾向性得分匹配(PSM)的匹配方法来平衡两组基线特征偏移,在进行匹配的过程中我们按照1:1的比例匹配后总共筛选出17,686例患者,其中PTCA手术组和非手术组各8843例。我们在此匹配的基础上,比较匹配后的两组患者, χ 2 的检验表明两组的ICU患者在临床病理特征上的差异都明显减小(表1) (图3~4)。

Table 1. Distribution profiles of the clinicopathologic factors of patients in the PTCA operation group and the non-operation group before and after PSM matching (n%)

表1. PSM匹配前后PTCA手术组和非手术组ICU患者临床病理资料分布特征(n%)

Figure 3. Distribution characteristics of propensity score before and after PSM in ICU patients of PTCA operation group and non operation group

图3. PTCA手术组与非手术组两组的ICU患者PSM前后倾向性评分分布的特征

Figure 4. Distribution characteristics of ICU patients screened and removed by PSM

图4. 经过PSM筛选及去除的ICU患者的分布特征

在经过倾向性得分匹配平衡各协变量之间的差异后,原则上我们就可以对PTCA手术组ICU患者和非手术组ICU患者的生存状况之间是否有显著性差异直接检验了。常规的方法两组的比较运用t检验,但是这种方法在数据呈非高斯分布(即非正态分布)的情况下检验效果较差,且由检验结果(表2)我们可以看出匹配后我们的PTCA手术组和非手术组两组数据都是呈现的非高斯分布。故我们采用大样本性质较好且不要求检验数据呈高斯分布前提的Wilcoxon秩和检验来判断两组之间是否有显著性差异。显然,Wilcoxon秩和检验的结果(表3)告诉我们PTCA手术组ICU患者和非手术组ICU患者的生存状况之间是明显的差异,PTCA手术组ICU患者生存率高于非手术组,即非手术组预后的状况差于PTCA手术组;其次,我们很清晰的看到ICU患者的生存期中位数(实际入ICU停留时间)为19小时左右(图5);其中PTCA手术组的ICU患者生存期中位数为22小时左右,而非手术组的ICU患者生存期中位数为16小时左右(图6)。结合Kamplan-Meier生存曲线分析(图6)、加速失效模型 [17] [18] [19] (accelerated failure time, AFT) (表4)显示两组生存差异具有统计学意义,PTCA手术组实际入ICU停留时间长于非手术组。

Table 2. Normal test of PTCA operation group and non operation group after matching

表2. 匹配后PTCA手术组与非手术组各自的正态性检验

Table 3. Wilcoxon rank sum test of PTCA operation group and non operation group after matching

表3. 匹配后PTCA手术组与非手术组的Wilcoxon秩和检验

Figure 5. Survival curve of ICU patients after matching

图5. 匹配后ICU患者生存曲线

Figure 6. Survival curve of ICU patients in PTCA operation group and non operation group after matching

图6. 匹配后PTCA手术组与非手术组ICU患者生存曲线

Table 4. Survival time of AFT model

表4. 生存时长AFT模型

4. 结论

由于该eICU数据库中收集的患者信息基本上都是心肺功能等异常的ICU患者,通过PTCA手术到底能不能降低这类心肺功能等异常的ICU患者的实际死亡率,提高其生存率,目前这个问题可供参考的研究资料极少。通过本文的大样本研究和分析,我们通过PSM后,PTCA手术组和非手术组两组在各协变量上的差异性获得明显的改善。结果显示,对于这类特殊的患者,做PTCA手术确实能够降低这类患者的实际死亡率。同时,我们也应该看见,做PTCA手术会明显增加患者的入ICU时长,由于ICU病房的特殊性使得入ICU开销巨大,使得做PTCA手术的ICU患者在这一花销上可能大于非手术组。虽然,本研究纳入的患者病例数很大,在一定程度上足以满足统计学意义上的大样本性质,且通过PSM匹配了大部分临床病理资料的偏移 [20] [21] 问题。但是,由于PSM方法的特殊性,如果没有把所有影响结果的协变量都纳入其中进行匹配,将会使得结果造成一定的误差,且这种误差随着没有纳入的协变量的数量增加而增大。所以,如果该eICU数据库的ICU患者数据没有把最终影响我们结果的协变量完全记录进来的话,将会对我们最终的研究和分析的结果产生一定程度上的影响。因此,需要从更多多维度、大样本量的临床研究来证明PTCA手术对于这一类ICU患者的特殊治疗价值。

言而总之,本文基于eICU数据库的研究和分析表明,通过PTCA手术能降低心肺功能等异常的这类ICU患者的实际死亡率,对于可耐受手术的这类特殊ICU患者可积极尝试这种治疗方案。

基金项目

项目名称:贵州省数据驱动建模学习与优化创新团队。

合同编号:黔科合平台人才[2020]5016。

参考文献

[1] Chirde, S.R. (2021) TCTAP C-031 LM Bifurcation PTCA by TAP. Journal of the American College of Cardiology, 77, S97-S98.
https://doi.org/10.1016/j.jacc.2021.03.221
[2] Di Donna, C., Cavallo, A.U., Pugliese, L., Ricci, F., De Stasio, V., Presicce, M., et al. (2021) Anatomic Features in SCAD Assessed by CCT: A Propensity Score Matching Case Control Study. Annales de Cardiologie et d’Angéiologie, 70, 161-167.
https://doi.org/10.1016/j.ancard.2021.01.003
[3] Xu, Z.J., Zhuo, Z.G., Song, T.N., Alai, G.-H., Shen, X., Yao, P., et al. (2020) Role of Nodal Skip Metastasis in Patients with Mid-Thoracic Oesophageal Squamous Cell Carcinoma: A Propensity Score Matching Study. European Journal of Cardio-Thoracic Surgery, 59, 799-806.
https://doi.org/10.1093/ejcts/ezaa371
[4] Wang, Y., Liu, Y., Lv, Q., Zheng, D., Zhou, L., Ouyang, W., et al. (2020) Effect and Safety of Chinese Herbal Medicine Granules in Patients with Severe Coronavirus Disease 2019 in Wuhan, China: A Retrospective, Single-Center Study with Propensity Score Matching. Phytomedicine, 85, Article ID: 153404.
https://doi.org/10.1016/j.phymed.2020.153404
[5] 和月月, 周常春, 张峰. 生态扶贫政策对农户生计策略和收入的影响[J]. 统计与决策, 2021, 37(4): 82-86.
[6] 杨沛轩, 农育新, 陈闽霞, 张莉芊, 郑晓滨. 手术对广泛期小细胞肺癌患者生存的影响: 基于SEER数据库的倾向得分匹配分析[J]. 天津医科大学学报, 2021, 27(1): 36-42.
[7] 鲁伟群, 刘海鹰. IVB期结直肠癌患者原发灶切除的临床意义: 基于SEER数据库的倾向得分匹配分析[J]. 中国普通外科杂志, 2018, 27(4): 427-434.
[8] 赵学武, 张新刚, 柴鹰, 刘广亮. 面向不均衡数据集的在线式异质媒体网络事件发现[J]. 科学技术与工程, 2016, 16(16): 227-232.
[9] Schober, P. and Vetter, T.R. (2021) Kaplan-Meier Curves, Log-Rank Tests, and Cox Regression for Time-to-Event Data. Anesthesia & Analgesia, 132, 969-970.
https://doi.org/10.1213/ANE.0000000000005358
[10] Irvine, A., Waise, S., Green, E. and Stuart, B. (2020) A Non-Linear Optimization Method to Extract Summary Statistics from Kaplan-Meier Survival Plots Using the Published P Value. BMC Medical Research Methodology, 20, Article No. 269.
https://doi.org/10.1186/s12874-020-01092-x
[11] Su, Q., Lv, Q. and Wu, R. (2019) Mining Expression and Prognosis of FOLR1 in Ovarian Cancer by Using Oncomine and Kaplan-Meier Plotter. Pteridines, 30, 158-164.
https://doi.org/10.1515/pteridines-2019-0020
[12] Philippe, F. and John, O. (2019) Comparing Kaplan-Meier Curves with Delayed Treatment Effects: Applications in Immunotherapy Trials. Journal of the Royal Statistical Society: Series C (Applied Statistics), 68, 915-939.
https://doi.org/10.1111/rssc.12345
[13] 彭大松. 非实验数据的因果分析——以PSM模型在体育健康回报研究中的应用为例[J]. 统计与信息论坛, 2017, 32(3): 10-18.
[14] Mellhammar, L., Kahn, F., Whitlow, C., Kander, T., Christensson, B. and Linder, A. (2021) Bacteremic Sepsis Leads to Higher Mortality When Adjusting for Confounders with Propensity Score Matching. Scientific Reports, 11, Article No. 6972.
https://doi.org/10.1038/s41598-021-86346-4
[15] Ysea-Hill, O., Gomez, C., Shah, A., Hammel, I., Rodriguez-Suarez, M. and Ruiz, J.G. (2021) Race-Based Differences in MCI and Dementia: A Propensity Score Matching Study. American Journal of Geriatric Psychiatry, 29, S48-S49.
https://doi.org/10.1016/j.jagp.2021.01.042
[16] 统计分析中检验方法的选择[J]. 临床输血与检验, 2018, 19(1): 70.
[17] Ramchandani, R., Finkelstein, D.M. and Schoenfeld, D.A. (2020) Estimation for an Accelerated Failure Time Model with Intermediate States as Auxiliary Information. Lifetime Data Analysis, 26, 1-20.
https://doi.org/10.1007/s10985-018-9452-5
[18] Najafabadi, M.Z., Samani, E.B. and Ganjali, M. (2021) Joint Modeling of Longitudinal Count and Time-to-Event Data with Excess Zero Using Accelerated Failure Time Model: An Application with CD4 Cell Counts. Communication in Statistics-Theory and Methods, No. 6, 1-21.
https://doi.org/10.1080/03610926.2021.1872635
[19] Chen, W. and Ren, F. (2020) Polynomial-Based Smoothing Estimation for a Semiparametric Accelerated Failure Time Partial Linear Model. Open Access Library Journal, 7, Article No. e6824.
https://doi.org/10.4236/oalib.1106824
[20] Kuriyama, N., Maeda, K., Komatsubara, H., Shinkai, T., Noguchi, D., Gyoten, K., et al. (2021) The Usefulness of Modified Splenic hilum Hanging Maneuver in Laparoscopic Splenectomy, Especially for Patients with Huge Spleen: A Case-Control Study with Propensity Score Matching. Surgical Endoscopy, 232, 1-9.
https://doi.org/10.1007/s00464-021-08348-7
[21] 陈康. 女性教育回报率真的比男性更高吗?——基于准实验研究的倾向得分匹配法研究[J]. 教育进展, 2020, 10(6): 1098-1108.
https://doi.org/10.12677/AE.2020.106186