1. 引言
心力衰竭作为心血管疾病的严重或晚期阶段,具有高发病率、高病死率、高住院率和高昂的医疗费用[1]。降低心力衰竭造成的社会经济负担已成为全球公共卫生领域的优先关注事项。在中国,由于人口老龄化、经济发展和生活方式变化,心力衰竭的患病率不断上升,给医疗系统带来了巨大压力。
心力衰竭风险的早期预测对于及时采取预防措施和干预患者的病情进程至关重要[2]。传统心力衰竭风险评估主要基于logistic模型,但其预测能力在大规模人群中有限,且在处理复杂非线性关系时较为局限[3]。随着大数据时代的到来,机器学习在处理多变量大样本数据时,相较于传统统计学模型更适合进行疾病预测。Tohyama等人将传统统计学模型与机器学习模型算法进行对比,得出后者集成学习模型C指数更高。由于机器学习方法具有较高的模型容量,能克服以上传统统计模型的缺陷,从而显著提高预测性能[4]。心力衰竭的患病率长期居高不下,高昂的住院治疗费用给患者带来了较大负担[5]。随着对慢性心力衰竭研究的深入及药物研发的增加,治疗心力衰竭的方案逐渐由住院方案倾向于药物治疗[6]。传统的心衰治疗药物主要包括血管扩张剂、利尿剂、β受体阻滞剂等,“金三角”在一定程度上改善了患者的预后,但其对心功能患者的症状改善并不明显,仍然有较高的再入院率以及病死率[7]。心衰发生通常涉及多种通路,需结合不同作用机制的药物对心力衰竭有效治疗。Gan等人提出不同机制药物的联合治疗,能防止心衰进一步恶化并最大限度地提高患者的预后[8]。对于新型药物治疗,目前大多数研究仅停留在药物安全性的研究上,但对于进入市场后的成本效应研究较少,且大多数为单一对比,并未组合对比为患者选出经济效益更好的药物。
本研究旨在构建心衰患者生存预测模型,结合传统生存分析方法和多种机器学习方法,并利用Markov模型评估药物治疗的经济效益,以改善患者的结局并减轻患者的负担。本文首先整理并预处理心衰患者医疗记录数据集,然后利用生存分析模型和机器学习模型对患者的结局进行预测,选出效果最佳的模型。接着,利用最佳模型进行特征排序,选出对心力衰竭效果有积极影响的指标,并引入Markov模型对药物进行经济效益评价。最后,总结文章的主要结论。
2. 心衰患者生存预测模型的构建
2.1. Cox回归模型
2.1.1. Cox模型的基本原理
本文考虑到Cox回归模型能够有效刻画事件在不同时间点的风险率变化情况以及描述影响生存时间的因素指标,且能够预测研究对象的生存时间和生存概率,因此,本文尝试引入Cox模型来探究各因素指标对心力衰竭患者的预后是否有显著影响并评估模型预测患者生存结局的性能,从而构建有效的生存预测模型。
假设对n名患者的生存时间进行分析,
和
分别为第i名患者的生存时间和删失时间,向量
表示第i名患者生存时间的各影响因素,即q维协变量。对于
,其中
、
分别表示第i名患者的观测时间和右删失变量。因此,构建的风险模型基本形式为:
(1)
其中,非参数
表示在t时刻患者在协变量均为0的情况下的基本风险量,
为q维回归参数。
考虑到MM算法[9] [10]分离参数的优点,且能够有效地简化高维优化问题,因此,文章将MM算法应用于Cox回归模型半参数的极大似然估计中,通过组装分解技术来优化模型,灵活构造最小化函数,将高维目标函数分解成可分离的低维函数,从而得到回归参数和基准累积风险的极大似然估计。
根据公式(1)可得对数似然函数表达式:
(2)
其中,
为基准累积风险函数。
2.1.2. 变量选择(MCP惩罚、SCAD惩罚)
为了能够筛选出重要特征变量,减弱非显著性变量,本文采用MCP惩罚[11]和SCAD惩罚[12]在观测似然函数的基础上增加惩罚项对样本数据进行变量选择,从而实现数据降维。
MCP惩罚函数为:
(3)
SCAD惩罚函数为:
(4)
其中,MCP惩罚函数中的γ设定为3,SCAD惩罚函数中的γ设定为3.7。
在实际应用中,惩罚Cox回归模型的优劣与选择合适的惩罚参数λ的取值密切相关。惩罚参数λ的取值越小,模型复杂程度越高,模型精确程度也越高。因此,选择合适的惩罚参数λ是至关重要的。本文考虑借助BIC准则[13]来选择惩罚参数λ,公式如下:
(5)
其中,
,
是参数向量
中非零分量的个数。
2.2. 机器学习
传统的统计学方法预测精度在部分实际数据上并不理想,而机器学习算法模型对于数据分布的限制较小,有更大的假设空间和拟合效果,因此我们利用四种机器学习方法:BP神经网络[14]、支持向量机[15]、决策树、随机森林对患者生存结局进行预测并评估模型的性能。
3. 心衰数据生存预测及实证分析
3.1. 数据采集及处理
本文使用了来自2015年4月至12月期间费萨拉巴德心脏病研究所和费萨拉巴德联合医院的299例心力衰竭患者的医疗记录数据集[16],包括105名女性和194名男性,年龄介于40至95岁之间。所有患者均为纽约心脏协会心力衰竭分级III或IV级。该数据集包含了13个特征,涵盖临床、生理和生活方式信息。关于数据集的介绍见下表1。
Table 1. Patient characteristics and characterization
表1. 患者特征及特征介绍
特征 |
特征说明 |
范围 |
Age |
患者年龄(岁) |
[40, …, 95] |
Anaermia |
患者是否贫血 |
[0, 1] |
High blood pressure |
患者是否有高血压 |
[0, 1] |
Creatinine phosphokinase (CPK) |
血液中CPK的水平(mcg/L) |
[23, …, 7861] |
Diabetes |
患者是否有糖尿病 |
[0, 1] |
Ejection fraction |
每次收缩时流出心脏的血液百分比 |
[14, …, 80] |
Sex |
患者性别 |
[0, 1] |
Platelets |
血液中的血小板含量(千个/ml) |
[0, 1] |
Serum creatinine |
血液中肌酐的水平(mg/dL) |
[0.50, …, 9.40] |
Serum sodium |
血液中的钠含量(mEq/L) |
[114, …, 148] |
Smoking |
患者是否吸烟 |
[0, 1] |
Time |
随访时间(天) |
[4, …, 285] |
(target) death event |
患者是否在随访期间死亡 |
[0, 1] |
注:该数据集中存在部分特征为二分类变量(Anaermia、High blood pressure、Diabetes、Sex、Platelets、Smoking、(target) death event),性别特征0表示女性,1表示男性,另外,血小板数量X在四分位数的基础上被分为三个水平(X ≤ Q1、Q1 < X ≤ Q3、X > Q3),经过处理得到两个哑变量,其余特征均用0表示否,1表示是。
3.2. Cox回归与变量选择
本文在70%训练集数据下,利用R软件对心力衰弱患者的相关特征变量进行模型建立以及重要影响因素的筛选,利用筛选出的指标构建有效的预后预测模型能够极大程度上指导临床方案的制定。首先,为了消除量纲的影响,对数据进行标准化处理。之后将数据代入惩罚Cox回归模型中,分别采用MCP惩罚和SCAD惩罚进行变量筛选。依据BIC准则得到影响心力衰弱患者的关键因素指标。其中,一部分变量的系数被压缩为零,且这两种压缩惩罚变量选择法筛选出的变量结果一致。最终纳入5项指标因素来建立模型,分别为患者的年龄、射血分数、高血压、血清肌酐和血清钠。由于Cox模型是基于比例风险假设的,基本假设为:协变量对生存率的影响不会随时间而改变,即风险比值
为固定值。为进一步验证变量筛选是否合理,本文将采用协变量检验法,来检验这6个指标是否满足比例风险假定,即将每个协变量与对数生存时间的交互作用项
放入模型中检验该交互作用项是否显著。经检验结果如表2显示,各交互作用项的P值均大于0.05,即交互作用项无统计学意义,且模型整体检验的P值为
,符合比例风险假定,因此模型的选择是合理的。
Table 2. Results of proportional risk hypothesis test
表2. 比例风险假设检验结果
指标 |
年龄 |
射血分数 |
高血压 |
血清肌酐 |
血清钠 |
卡方值 |
0.0878 |
4.2137 |
0.0161 |
1.9188 |
0.0612 |
P值 |
0.7670 |
0.0600 |
0.8990 |
0.1660 |
0.8050 |
MCP惩罚和SCAD惩罚的参数估计结果见表3。
Table 3. MCP and SCAD parameter estimation
表3. MCP和SCAD参数估计
惩罚 |
年龄 |
射血分数 |
高血压 |
血清肌酐 |
血清钠 |
MCP |
0.4880 |
−0.5113 |
0.2221 |
0.3848 |
−0.1511 |
SCAD |
0.4875 |
−0.5130 |
0.2232 |
0.3855 |
−0.1518 |
从上表可以看出,两种方法在参数估计方面的差异很小,其中射血分数对心力衰弱患者的生存结局的影响最具影响力,即射血分数值越低,心力衰弱患者的死亡风险增加。其次,年龄是另外一个显著因素,即随着患者的年龄增长,患者的死亡概率越大。其中,血清肌酐对患者生存结局的影响也较为明显。高血压和血清钠对患者的影响相对较弱。
3.3. 多种生存预测模型的比较分析
Figure 1. ROC graph of the model
图1. 模型的ROC曲线图
对心衰患者进行有效的生存预测,能够对高风险和低风险患者采取针对性的治疗措施,从而改善患者的症状,延长寿命。因此,构建合适的风险预测模型进一步提升临床实践中预测心力衰竭相关事件的精度是至关重要的,这也是加深了解心衰疾病发病机制的核心内容。本文首先选用生存分析方法中的Cox模型和多种机器学习模型利用测试集来构建心衰患者生存预测模型,测试样本中随访到患者的生存时间最长为250天。依据Cox模型绘制心力衰竭患者患病后100天、150天、200、250天的生存率预测的ROC曲线,如图1左边所示。其余机器学习模型生存率预测模型ROC曲线如图1右边所示。利用混淆矩阵对各模型预测性能进行评价,如表4~8所示,根据结果得出各模型的评价指标,如表9所示。
Table 4. Cox regression confusion matrix
表4. Cox回归混淆矩阵
|
实际患者在随访期间存活 |
实际患者在随访期间死亡 |
预测患者在随访期间存活 |
32 |
3 |
预测患者在随访期间死亡 |
13 |
12 |
Table 5. Decision tree confusion matrix
表5. 决策树混淆矩阵
|
实际患者在随访期间存活 |
实际患者在随访期间死亡 |
预测患者在随访期间存活 |
39 |
9 |
预测患者在随访期间死亡 |
6 |
6 |
Table 6. Support vector machine confusion matrix
表6. 支持向量机混淆矩阵
|
实际患者在随访期间存活 |
实际患者在随访期间死亡 |
预测患者在随访期间存活 |
30 |
2 |
预测患者在随访期间死亡 |
15 |
13 |
Table 7. BP neural network confusion matrix
表7. BP神经网络混淆矩阵
|
实际患者在随访期间存活 |
实际患者在随访期间死亡 |
预测患者在随访期间存活 |
32 |
2 |
预测患者在随访期间死亡 |
13 |
13 |
Table 8. Random forest confusion matrix
表8. 随机森林混淆矩阵
|
实际患者在随访期间存活 |
实际患者在随访期间死亡 |
预测患者在随访期间存活 |
33 |
3 |
预测患者在随访期间死亡 |
12 |
12 |
由图1可知,心力衰竭患者患病后250天的生存率预测ROC曲线的AUC值分别为0.8283、0.8272、0.7707、0.8226,表示模型预测效果良好。随后由图1右可得多种机器学习方法拥有较高的AUC值,表明其较好的预测效果。
Table 9. Evaluation of model classification performance
表9. 模型分类性能评价
|
准确率 |
敏感度 |
特异度 |
精确率 |
F1值 |
ROC AUC |
Cox回归 |
0.7333 |
0.7111 |
0.8000 |
0.9143 |
0.7585 |
0.8226 |
决策树 |
0.750 |
0.867 |
0.400 |
0.813 |
0.839 |
0.787 |
支持向量机 |
0.717 |
0.698 |
0.867 |
0.938 |
0.800 |
0.812 |
BP神经网络 |
0.750 |
0.711 |
0.867 |
0.921 |
0.810 |
0.785 |
随机森林 |
0.750 |
0.733 |
0.800 |
0.917 |
0.815 |
0.815 |
依据表4~8结果,并结合表9可得,除了经典决策树的特异度指标较低以外,其余基于新型机器学习方法构建的模型在预测心衰患者生存情况的表现高度一致。而基于大量决策树构建的随机森林模型在各方面表现最好,其预测能力能与生存分析方法中的Cox模型达到一致好的效果,说明随机森林模型未来广阔的应用前景。不仅如此,随机森林模型不依赖于高维变量的组合优化,针对存在较大异质性数据的处理,可通过加大决策树来消除具有极端情况的异质性,从而表现出良好的适用性和泛化性。
此外,基于MCP惩罚和SCAD惩罚的Cox回归的估计结果近似,且均支持射血分数、年龄和血清肌酐是三个最为重要的影响因素。因此,这三个指标因素为医生了解患者疾病的进展以及后续治疗方案措施采取的主要依据。
4. 心衰患者用药策略及药物经济效益分析
4.1. 特征排序
目前我国心衰患者治疗费用昂贵,寻找价廉药品,为更多的患者提供了获得治疗的机会,保障了患者的基本医疗权益。因此,本文对筛选出与生存时间高度相关的风险因素进行相对应的特征排名,找出导致心力衰竭的主要驱动因素,并从最重要的特征变量出发,进一步了解并分析心衰疾病的相关药物治疗情况。对于特征排序,本文采用传统的单变量生物统计分析方法和机器学习方法对特征变量进行排序,并比较了这两种方法的结果。
4.1.1. 单变量检验
我们使用常见的单变量检验,如Mann-Whitney U检验、Pearson相关系数和卡方检验来比较两组(存活个体和死亡患者)个体之间每个特征的分布。每个检验都有不同的含义,但它们都会产生一个分数,表示一个特征与目标关联的可能性。这些分数可以用来产生一个排名,列出从与目标相关度最高到与目标相关度最低的特征。将Mann-Whitney U检验(或Wilcoxon秩和检验)应用于与死亡事件目标相关的每个特征,检测我们是否可以拒绝由死亡事件定义的样本组的每个特征分布相同的原假设。该检验的P值低(接近0)表示分析的特征与死亡事件密切相关,P值高(接近1)表示相反。Pearson相关系数(PCC系数)表示两个列表中元素之间的线性相关性,表示相同的元素在不同位置。PCC系数的绝对值,如果两个列表的元素具有线性相关性,则为高值(接近1),否则为低值(接近0)。两个样本之间的卡方检验检查观察到的分布是由偶然造成的可能性有多大。较低的P值(接近于0)意味着这两个特征有很强的相关性;相反,高P值(接近1)意味着不能丢弃独立性的原假设。检验结果如表10~12所示。所有的生物统计学检验方法都确定血清肌酐和射血分数是最重要的两个特征。特别是Mann-Whitney U检验和卡方检验显示,这两个特征的P值都接近于0。Pearson相关系数检验结果显示,射血分数、年龄和血清肌酐均为最重要的特征变量。
Table 10. Mann-Whitney U test
表10. Mann-Whitney U检验
排序 |
特征变量 |
P值 |
1 |
血清肌酐 |
7.737e−09 |
2 |
射血分数 |
7.131e−05 |
3 |
年龄 |
0.000767 |
4 |
血清钠 |
0.002985 |
6 |
高血压 |
0.268100 |
Table 11. Pearson’s correlation coefficient
表11. Pearson相关系数
排序 |
特征变量 |
Abs (PCC) |
1 |
血清肌酐 |
0.3042 |
2 |
年龄 |
0.2519 |
3 |
射血分数 |
0.2298 |
4 |
血清钠 |
0.1632 |
6 |
高血压 |
0.0719 |
Table 12. Chi-square test
表12. 卡方检验
排序 |
特征变量 |
P值 |
1 |
射血分数 |
2.473e−05 |
2 |
血清肌酐 |
6.284e−05 |
3 |
年龄 |
0.02507 |
4 |
血清钠 |
0.04078 |
6 |
高血压 |
0.33340 |
4.1.2. 随机森林特征排序
1) 精度平均减少值(Mean Decrease Accuracy,简称MDA)
指原始精度与打乱该特征值后的精度之间的差值的平均值。在随机森林算法中,该指标被用来评估特征的重要性。计算步骤:确定每个特征在原始数据集中的精度,通过打乱该特征的值,进而重新计算出模型的精度。若一个特征对模型的精度影响越大,则打乱其值后,模型的精度就会大幅度下降,因此较大的“精度平均减少值”的特征通常被视作更重要的变量。
2) 基尼指数平均减少值(Mean Decrease Gini,简称MDG)
指所有树上该特征进行划分后所带来的基尼指数降低程度的平均值。在随机森林算法中,基尼指数是用于衡量一个随机选择的元素被错误分类的概率,当选择一个特征进行划分时,将计算划分后的基尼指数与划分前相比,降低的程度越大,则说明该特征越重要。
Table 13. Random forest variable ordering
表13. 随机森林变量排序
最后排名 |
变量 |
精度平均减少值 |
MDA排名 |
基尼指数平均减少值 |
MDG排名 |
1 |
血清肌酐 |
0.0416 |
1 |
9.1431 |
1 |
2 |
射血分数 |
0.0317 |
2 |
7.6860 |
2 |
3 |
年龄 |
0.0146 |
3 |
6.8884 |
3 |
4 |
血清纳 |
0.0002 |
4 |
5.8804 |
4 |
5 |
高血压 |
−0.0006 |
5 |
1.0638 |
5 |
Figure 2. Random forest variable ordering plot
图2. 随机森林变量排序图
根据表13或图2可以得出,血清肌酐和射血分数重要性较高。因此,再次变量选择后,仅用血清肌酐、射血分数两个选定特征对患者进行生存预测训练模型,得出的结果见表14和表15。
Table 14. Random forest confusion matrix after variable screening again
表14. 再次变量筛选后随机森林混淆矩阵
|
实际患者在随访期间存活 |
实际患者在随访期间死亡 |
预测患者在随访期间存活 |
40 |
5 |
预测患者在随访期间死亡 |
5 |
10 |
Table 15. Comparison of performance evaluation of random forest models
表15. 随机森林模型性能评价对比
|
准确率 |
敏感度 |
特异性 |
精确率 |
F1值 |
ROC AUC |
随机森林 |
0.750 |
0.733 |
0.800 |
0.917 |
0.815 |
0.815 |
随机森林 |
0.833 |
0.800 |
0.667 |
0.889 |
0.842 |
0.842 |
根据模型性能评价对比可得:仅用最重要的两个变量进行建模,其模型准确率、特异度、精确率、F1值以及ROC、AUC曲线相比之前均有所提高,直接选取两种重要指标的模型也能很好地预测患者的生存结果。
4.2. 药物经济学研究
根据模型结果表明,针对血清肌酐和射血分数特征的药物可能对心力衰竭的治疗效果有积极的影响。射血分数的控制是治疗心力衰竭的常规手段之一。因此,本文引入Markov模型来评估两种治疗射血分数降低类型的心力衰竭药物(维立西呱以及达格列净)的预后治疗效果和经济性,旨在为临床用药、药品价格的调整、医保报销以及医疗实施等提供相关证据支持。
4.2.1. 目标人群与干预措施
试验一:
维立西呱是第一种可溶性鸟苷酸环化酶(sGC)激动剂。它通过直接刺激sGC,提升细胞内环鸟苷酸(cGMP)水平,从而使平滑肌松弛并扩张血管[17]。被用于治疗近期静脉治疗后病情稳定的左室射血分数 < 45%的症状性慢性心力衰竭成人患者。因此,本文基于VICTORIA试验[18]的研究对象和用药等相关数据进行有效的经济评价。该试验将患者随机分为维立西呱联合标准治疗组(
)和标准治疗组(
),两组患者的心衰住院发生率分别为16.4%和17.5% (
);心血管死亡率分别为16.4%和17.5% (
);首次因心衰住院和心血管死亡的复合终点的发生率分别为35.5%和38.5% (
),说明维立西呱联合标准治疗组患者住院率和死亡率都显著低于标准治疗组,该新型药物的使用能够有效治疗因射血分数降低导致心衰的患者。
试验二:
达格列净是一种钠–葡萄糖协同转运蛋白2 (SGLT2)抑制剂,通过抑制SGLT2,减少滤过葡萄糖的重吸收,降低葡萄糖的肾阈值,从而增加尿糖排泄。DAPA-HF研究发现,标准化治疗的基础上加入达格列净,与安慰剂组相比,可显著降低合并或不合并糖尿病的射血分数减低型心衰患者的心血管死亡率和心衰再住院率[19]。因此,模型二基于DAPA-HF实验中观察到的特征和用药情况进行有效的经济效益评价。该实验基线病例来源于2370例患者的假设队列中的一名65岁患者,并将HErEF患者分为达格列净(10 mg,每日一次) + 标准治疗(达格列净组)与标准治疗(对照组)。模型假设心血管死亡率和心衰住院风险率在整个模型范围内保持不变。在DAPA-HF试验的随访期间,达格列净组中9.6%的患者和标准组中有11.5%的患者因心血管原因死亡,将数据转换为3个月概率,即达格列净组为1.644%,对照组为1.996%,并假设两组非心血管死亡率相同。而达格列净组的心衰住院风险为9.7%,对照组为13.4%,将其转换为3个月概率,即达格列净组为1.674%,对照组为2.346%。根据DAPA-HF实验结果,我们得出达格列净组再住院风险为2.517%,对照组为3.568%。说明达格列净联合标准治疗组患者住院率和死亡率都显著低于标准治疗组,该新型药物的使用能够有效治疗因射血分数降低导致心衰的患者。
上述两种药物都能对心衰患者进行有效治疗,因此我们进一步通过成本分析对比两种药物的治疗方案,将2023年我国人均GDP (89,358元)设为WIP阈值,应用相关经济学原理和方法来研究和评估药物治疗的成本与效益及其之间的关系,以实现在经济条件有限的情况下,获得最大的健康效益。
4.2.2. 建模分析
1、Markov模型介绍
Markov模型作为一种循环决策树模型,可用于药物经济学评价建模,特别适用于长期慢性病经济学评估。该模型考虑了临床事件和干预实施时间因素,模拟了患者在现实中的健康状态变化,并通过离散时点状态转移,粗略模拟患者健康状态的连续变化,如图3所示。根据心衰疾病的发展进程建立3个离散状态,即稳定状态、住院状态和死亡状态。本研究假定患者进入模型时均处于心衰稳定状态,整个模拟过程中的两组患者的治疗方案保持不变。将Markov循环周期设置为1个月,模拟时限20年。
Figure 3. Markov model state transfer plot for heart failure patients
图3. 心力衰竭患者Markov模型状态转移图
2、Markov模型构建
在本研究中,关于Markov模型的构建分为如下步骤:
1) 确定各个干预周期内可能出现的健康状态和事件。
2) 确定不同健康状态间的转化路径,包括从NYHA II级到IV级,以及从存活到死亡,并确定相应的转化概率。
3) 每个周期的时长和模型需要模拟的周期数。
4) 评估各个干预的成本和预后。
模型周期包括存活和死亡两种情况,存活患者分为不同纽约心功能分级状态(共5种)。存活患者可能经历无事件、心衰再住院和死亡(心血管死亡和非心血管死亡)。模型结构如图4所示。
Figure 4. Markov model structure diagram
图4. Markov模型结构图
3、模型参数设置
本文所构建的Markov模型的成本只考虑直接医疗成本(新型药品成本、标准心衰治理药物和心衰住院成本),采用质量调整生命年(QALY)和增量成本–效果比(ICER)作为健康产出指标,并依据每年4.2%的贴现率对未来的健康效用值和成本进行贴现。Markov模型的相关参数设定见表16。
Table 16. Markov model related parameter values and distribution
表16. Markov模型相关参数值及分布情况
参数 |
取值 |
波动范围 |
分布 |
来源 |
下限 |
上限 |
成本/元 |
|
|
|
|
|
三个月达格列净成本 |
414 |
227 |
711 |
Gamma |
文献[20] |
三个月维立西呱成本 |
5220 |
4176 |
6264 |
Gamma |
文献[21] |
三个月标准治疗费用 |
671 |
168 |
992 |
Gamma |
文献[23] |
单次心衰住院成本 |
13,956 |
6978 |
41,868 |
Gamma |
文献[22] |
模型一效用值 |
|
|
|
|
|
心衰稳定状态 |
0.871 |
0.783 |
0.959 |
Beta |
文献[24] |
心衰住院状态 |
0.215 |
0.042 |
0.388 |
Beta |
文献[24] |
死亡状态 |
0 |
|
|
|
文献[24] |
模型二效用值 |
|
|
|
|
|
心衰稳定状态 |
0.658 |
0.525 |
0.709 |
Beta |
文献[20] |
心衰住院状态 |
0.100 |
0.080 |
0.130 |
Beta |
文献[20] |
死亡状态 |
0 |
|
|
|
文献[20] |
4、不确定性分析
本研究以单因素敏感性分析和概率敏感性分析验证模型的稳健性。在单因素敏感性分析中,各参数在合理范围内独立变化,探究其对模型的影响,并使用旋风图呈现结果。同时,通过蒙特卡罗模拟对样本进行概率敏感性分析,评估模型参数的不确定性。
4.3. Markov基础分析结果
Table 17. Cost-utility analysis results
表17. 成本–效用分析结果
模型 |
增量成本/元 |
增量效用/QALYs |
ICER/(元/QALY) |
模型一 |
80660.64 |
0.19 |
429329.70 |
模型二 |
10755.33 |
0.36 |
29790.46 |
模型结果见表17,维立西呱联合标准治疗组相比标准治疗组的成本和效用分别增加了80660.64元和0.19 QALY,且ICER值(429329.70元/QALY)远高于所设定的WIP阈值,说明维立西呱联合标准治疗方案治疗射血分数降低的心衰疾病不具备经济性。而达格列净联合治疗方案相比于标准治疗组的成本和效用增加了10755.33元和0.36 QALY,其ICER值(29790.46元/QALY)低于设定的WIP阈值。相较于第二种模型,维立西呱的成本–效用比远高于达格列净,进一步表明达格列净较好的经济优势。紧接着,本文利用寿命表法模拟两种模型的队列生存分析图和成本–效益分析图,如图5、图6所示。由队列生存分析图可知,两种新型药物相较于标准治疗法都有一定的治疗效果,相较于标准治疗法,死亡人数均有所下降,而稳定状态人数均有小幅度上升,其中维立西呱的治疗效果优于达格列净的治疗效果。根据成本效益图可得,药物治疗后的花费相比标准花费增加,但达格列净所增加的费用相比维立西呱相对较少,但其效用相比维立西瓜较高,因此维立西呱的经济优势低于达格列净的经济优势。
Figure 5. Cost-benefit diagram of Model 1 (left) and Model 2 (right)
图5. 模型一(左)、二(右)成本–效益图
Figure 6. Queue population transfer situation of Model 1 (left) and Model 2 (right)
图6. 模型一(左)、二(右)队列人数转移情况
4.4. 敏感性分析结果
4.4.1. 单因素敏感性分析结果
Figure 7. Single-factor sensitivity analysis cyclone map of Model 1 (left) and Model 2 (right)
图7. 模型一(左)、二(右)单因素敏感性分析旋风图
单因素敏感性分析结果显示:上述两种模型中药物的花费对模型的稳健性影响较大;模型一的ICER均始终维持在所设定的WTP阈值上,与模型一成本–效益结果相同,说明本文对于模型一的基础分析结果稳健;模型二的ICER均始终维持在所设定的WTP阈值之下,与模型二成本–效益结果相同,说明本文对于模型二的基础分析结果稳健。结果详见图7。
4.4.2. 概率敏感性分析结果
由姓名下方放置作者的单一模型的概率敏感性分析结果可知,每个点代表一次模型的运行结果,其中X轴代表效果,Y轴代表成本。由图8可知,其散点都集中于图的右上角,即意味着模型较为确定,并且两个模型增加成本会使得效果显著增加。模型一的维立西呱联合标准治疗组方案在右下方的散点较少,说明药物联合方案相比标准方案几乎不具备经济性,其概率为0。而模型二的达格列净联合标准治疗组方案在右下方散点较多,说明药品联合方案相较于标准方案更具备经济性。
Figure 8. Probabilistic sensitivities of Model 1 (left) and Model 2 (right)
图8. 模型一(左)、二(右)概率敏感性
4.4.3. 成本可接受曲线
Figure 9. Cost-effectiveness acceptability curve of Model 1 (left) and Model 2 (right)
图9. 模型一(左)、二(右)成本–效果可接受曲线
成本效果可接受曲线,表示在某一项药物经济评价中,在给定的单位健康产出意愿支付值的条件下,每个方案具有的经济效益概率,所有比较方案的概率之和为1。横轴表示意愿支付值,由图9可知,在相同的意愿支付值范围内,维利西呱(模型一)药品联合的经济性概率始终为0,而标准方案的经济性概率较高,达格净列(模型二)药品联合在大约6000元意愿支付值时相交,此时标准方案与药品联合方案经济效用相同,并且小于所设WTP阈值,因此再次证明达格净列的经济性更好。
5. 总结
5.1. 医疗数据在心衰疾病预测中的应用
本文首先利用生存分析方法中的惩罚Cox模型对影响心衰患者生存结局的重要指标因素同时进行筛选和参数估计,主要筛选出了5个重要指标因素:患者的年龄、射血分数、高血压、血清肌酐、血清钠。从参数估计结果可以看出,射血分数对心力衰弱患者的结局事件最具影响力,即射血分数值越低,心力衰弱患者的死亡风险增加。其次,年龄是另外一个显著因素,即随着患者的年龄增长,患者的死亡概率越大。其中,血清肌酐对患者生存的影响也较为明显。因此,后续对疾病进展情况的了解可着重观察这三个因素。
随后,将选出的5个重要指标因素利用Cox模型和多种机器学习方法来构建心衰疾病的生存预测模型,其中Cox模型和随机森林模型能得到更为准确的预测效果。此外,相较于传统的生存分析方法,随机森林模型还能够对重要特征变量进行排序,根据排序结果可知射血分数和血清肌酐是最为重要的特征变量,且仅根据这两个特征利用随机森林模型就能得到不错的患者生存预测效果,这也凸显出随机森林未来在实际临床疾病的预测上的潜力。因此,将医疗大数据与人工智能中的机器学习方法有效结合,能够更为及时地跟进患者疾病的进展,从而对研究对象进行更加精确的风险评估和预测。值得一提的是,医生还可着重关注随机森林模型辨别出的最为重要的特征变量的变化情况,对患者进行点对点的精准治疗。
5.2. 医疗数据在心衰疾病治疗中的应用
利用生存分析方法中的惩罚射血分数作为影响心衰患者生存结局最为重要的特征指标之一,其值的降低会导致患者心衰疾病死亡风险显著增加,因此射血分数对于心衰的判断是至关重要的。研发针对射血分数降低的新型药物能够为心衰疾病的预后提供新途径,然而,在获得更好的治疗效果的同时,也会增加相应的治疗成本,故评估推广使用此类药物是否会增加医疗保健支付方面的经济压力是本文重点关注的内容之一。本文选用Markov模型来刻画心衰疾病的周期模型以模拟该病的长期病程,从而来分析和比较两种治疗射血分数降低类型的心衰药物(维立西呱和达格列净)的预后治疗效用和经济性。根据模型结果可知,维立西呱联合标准治疗组的ICER (429329.70元/QALY)远高于所设定的WIP阈值,而达格列净联合标准治疗组的ICER (29790.46元/QALY)远低于设定的WIP阈值,因此达格列净更具有经济性。但维立西呱的治疗效用略高于达格列净,在保证了药品治疗效果的同时,还应考虑到国家相关的药品政策的实施,合理地调低维立西呱的价格可能使其具备经济优势。在医疗大数据时代下,进一步帮助医生确定最有效的药物组合和治疗周期,同时国家对某些效用较好但价格昂贵的药品的医保报销比例适度上调,能更大程度地提升疾病的成功率具有重要的实际意义。