1. 背景
骨髓增生异常综合征(myelodysplastic syndromes, MDS)是一类起源于造血干/祖细胞的克隆性恶性肿瘤,表现为无效造血、外周血细胞减少及向急性髓系白血病(acute myeloid leukemia, AML)进展的风险。临床结局差异显著,低风险患者中位生存可达3~10年,而高风险患者通常不足2年[1] [2]。准确的预后评估对于治疗策略的选择至关重要。国际预后评分系统(International Prognostic Scoring System, IPSS) [3]和其修订版(IPSS-R) [4]长期以来被广泛应用于临床风险分层。然而,上述模型主要基于临床与细胞遗传学变量,未纳入分子遗传学信息,难以充分识别部分具有隐匿性高危分子特征的亚群。2022年提出的分子国际预后评分系统(IPSS-M)整合了31个关键基因的突变信息及临床要素,在欧美人群中显示出更优的预后判别力[5] [6]。鉴于MDS在不同人群间的遗传背景存在差异[7] [8],直接应用于中国患者可能存在适用性偏差。本研究回顾性纳入2018~2024年于安徽医科大学第一附属医院确诊且具备完整初诊临床、细胞遗传学及二代测序数据的MDS患者,比较IPSS、IPSS-R与IPSS-M在中国患者遗传背景下的预后评估效能。
2. 资料与方法
1) 研究对象与伦理
回顾性收集2018年1月至2024年12月在安徽医科大学第一附属医院血液科初诊并符合WHO 2016标准的MDS患者。纳入标准:① 初诊时有完整的临床、细胞遗传学及二代测序数据;② 随访资料完整。排除标准:① 合并其他恶性血液病或实体瘤;② 治疗前已接受造血干细胞移植。筛选纳入82例具备完整初诊临床资料、细胞遗传学及二代测序(NGS)数据的患者,年龄24~95岁。研究已获安徽医科大学第一附属医院临床研究独立伦理委员会批准(PJ2025-06-58),遵循《赫尔辛基宣言》原则。
2) 临床资料、细胞遗传学与分子检测
通过电子病历与数据库提取患者的年龄、性别、WHO分型、骨髓原始细胞比例(BM blasts)、白细胞计数(WBC)、中性粒细胞绝对计数(ANC)、血红蛋白(Hb)、血小板(PLT)、细胞遗传学及NGS基因突变信息。细胞遗传学采用G显带法并依据ISCN 2016命名系统报告。基因检测涵盖MDS常见突变基因(如TP53、ASXL1、RUNX1、SF3B1、TET2等)。
3) 风险分层与治疗策略
使用IPSS、IPSS-R及IPSS-M网络计算器(https:mds-risk-model.com)分别计算评分并分配风险等级。治疗策略参考IPSS/IPSS-R分层实施:低危患者以最佳支持治疗(BSC)、免疫调节剂(如沙利度胺、来那度胺)或免疫抑制治疗(如抗胸腺细胞球蛋白、环孢素)为主;高危患者接受去甲基化药物(HMA,如阿扎胞苷、地西他滨)单药、HMA联合化疗。BSC包括输血、细胞因子支持(EPO、G-CSF、GM-CSF、TPO)及铁螯合治疗。阿扎胞苷方案:75 mg/m2,每日皮下给药7 d,每28 d一疗程;地西他滨:20 mg/m2,每日一次,连续5 d [9]。
4) 研究终点与统计学分析
主要终点为总生存期(OS),定义为自确诊日至死亡(未删失)或末次随访(删失)。采用Mann-Whitney U检验比较连续变量的组间分布差异;Fisher精确检验或χ2检验比较分类变量分布差异。生存曲线采用Kaplan-Meier法,并以log-rank检验比较差异。模型预测精度通过加权和非加权中位生存时间残差(weighted median survival residual)进行比较,使用Wilcoxon符号秩检验比较配对残差分布,计算效应量r。采用time-dependent ROC曲线(通过R语言4.5.1 timeROC包实现)在10、20、30、40、50、60个月处评估AUC (曲线下面积)及其随时间变化趋势。双侧检验P < 0.05为差异有统计学意义。
3. 结果
1) 患者基线特征
共纳入82例MDS患者,其中<60岁28例(34.1%),≥60岁54例(65.9%);中位年龄66岁(IQR: 57~72),中位随访时间为19个月,中位生存时间24个月(IQR: 12~55),诊断时骨髓原始细胞比例中位数为4.0% (IQR: 1.6~6.9),Hb为68.5 g/L (IQR: 55.2~80.0),PLT为53 × 109/L (IQR: 25.0~113.5),ANC为0.8 × 109/L (IQR: 0.4~1.6)。IPSS分层:低危2例(2.44%)、中危-1 52例(63.41%)、中危-2 22例(26.83%)、高危6例(7.32%)。IPSS-R分层:低危9例(11.0%)、中危30例(36.6%)、高危24例(29.3%)、极高危19例(23.2%)。IPSS-M分层:极低危(very low) 0例(0%)、低危(low) 7例(8.5%)、中危低(Moderate low) 11例(11.4%)、中危高(Moderate high) 11例(11.4%)、高危(high) 24例(29.3%)、很高危(very high) 29例(35.4%)。年龄分层下,<60岁与≥60岁两组在BM原始细胞、Hb、PLT、ANC的分布差异均无统计学意义(U检验P值分别为0.604、0.172、0.795、0.581);两年龄组在IPSS、IPSS-R及IPSS-M风险分布上的差异亦无统计学意义(Fisher/χ2检验,均P > 0.05),在WHO2022分型的分布有统计学差异(P = 0.032) (表1)。
Table 1. Baseline characteristics of 82 MDS patients
表1. 82例MDS患者基线特征
82例MDS患者基线特征1,2,3 |
特征 |
总体 |
<60岁 |
≥60岁 |
P值 |
血液学特征 |
|
|
|
|
骨髓原始细胞(%) |
4.0 (1.6, 6.9) |
3.0 (1.9, 5.6) |
4.5 (1.6, 7.0) |
0.604 |
血红蛋白(g/L) |
68.5 (55.2, 80.0) |
60.0 (50.5, 76.0) |
71.0 (57.2, 80.0) |
0.172 |
血小板(×109/L) |
53.0 (25.0, 113.5) |
65.0 (24.2, 160.8) |
53.0 (26.8, 104.5) |
0.795 |
中性粒细胞绝对数(×109/L) |
0.8 (0.4, 1.6) |
0.8 (0.4, 1.3) |
0.8 (0.5, 1.8) |
0.581 |
性别 |
|
|
|
|
男 |
51 (62.2%) |
16 (57.1%) |
35 (64.8%) |
0.66 |
女 |
31 (37.8%) |
12 (42.9%) |
19 (35.2%) |
|
IPSS危险度 |
|
|
|
|
低危 |
2 (2.4%) |
1 (3.6%) |
1 (1.9%) |
0.879 |
中危-1 |
52 (63.4%) |
19 (67.9%) |
33 (61.1%) |
|
中危-2 |
22 (26.8%) |
6 (21.4%) |
16 (29.6%) |
|
高危 |
6 (7.3%) |
2 (7.1%) |
4 (7.4%) |
|
IPSS-R危险度 |
|
|
|
|
低危 |
9 (11.0%) |
4 (14.3%) |
5 (9.3%) |
0.641 |
中危 |
30 (36.6%) |
9 (32.1%) |
21 (38.9%) |
|
高危 |
24 (29.3%) |
10 (35.7%) |
14 (25.9%) |
|
极高危 |
19 (23.2%) |
5 (17.9%) |
14 (25.9%) |
|
IPSS-M危险度 |
|
|
|
|
low |
7 (8.5%) |
3 (10.7%) |
4 (7.4%) |
0.582 |
moderate low |
11 (13.4%) |
6 (21.4%) |
5 (9.3%) |
|
moderate high |
11 (13.4%) |
3 (10.7%) |
8 (14.8%) |
|
high |
24 (29.3%) |
7 (25.0%) |
17 (31.5%) |
|
very high |
29 (35.4%) |
9 (32.1%) |
20 (37.0%) |
|
WHO 2022分型 |
|
|
|
|
MDS-LB |
32 (39.0%) |
6 (21.4%) |
26 (48.1%) |
0.032 |
MDS-LB-RS |
8 (9.8%) |
6 (21.4%) |
2 (3.7%) |
|
MDS-IB1 |
22 (26.8%) |
7 (25.0%) |
15 (27.8%) |
|
MDS-IB2 |
5 (6.1%) |
2 (7.1%) |
3 (5.6%) |
|
MDS-5q |
11 (13.4%) |
6 (21.4%) |
5 (9.3%) |
|
MDS-biTP53 |
4 (4.9%) |
1 (3.6%) |
3 (5.6%) |
|
随访信息 |
|
|
|
|
中位随访时间(月) |
19 |
26 |
16 |
|
1MDS = 骨髓异常增生综合征;2血液学数据中以中位数(第一四分位数,第三四分位数)表示;分类型数据以频数(百分比)表示;3连续变量用Mann-WhitneyU检验;分类型变量用卡方或Fisher精确检验。
2) 生存分析与风险重分类
Kaplan-Meier生存分析显示,IPSS、IPSS-R及IPSS-M各风险组的总生存期存在显著差异(log-rank检验,均P < 0.001)。与IPSS-R相比,IPSS-M使42/82例(52.4%)患者发生风险重分类:IPSS-R低危组(n = 9)中,4例保持低危、5例上调至更高风险;中危组(n = 30)中,3例下调至低危、14例保持中危(中危低7例、中危高7例)、13例上调(高危11例、极高危2例);高危组(n = 24)中,5例下调(中危低1例、中危高4例)、9例保持高危、10例上调至极高危;极高危组(n = 19)中,3例下调至高危、16例保持在IPSS-M很高危组(图1~4)。生存分析显示[10]。
Figure 1. Kaplan-Meier survival analysis of risk groups defined by IPSS
图1. IPSS分组的Kaplan-Meier生存曲线
Figure 2. Kaplan-Meier survival analysis of risk groups defined by IPSS-R
图2. IPSS-R分组的Kaplan-Meier生存曲线
Figure 3. Kaplan-Meier survival analysis of risk groups defined by IPSS-M
图3. IPSS-M分组的Kaplan-Meier生存曲线
Figure 4. Risk reclassification of 82 patients based on IPSS, IPSS-R, and IPSS-M
图4. 82例患者IPSS、IPSS-R及IPSS-M的风险重分类
3) 模型预测精度比较
共纳入82例骨髓增生异常综合征(MDS)患者的实际生存数据,采用加权中位生存时间残差分析(Weighted Median Survival Residual Analysis)及未加权分析评估IPSS-R与IPSS-M两种危险度分级系统的预测准确性。加权分析中,使用逆概率删失权重(Inverse Probability of Censoring Weighting, IPCW)调整删失偏倚,计算每位患者预测生存时间与实际生存时间差值的绝对值(绝对残差,单位:月),并取其中位数(MAR)作为预测误差指标[11]。
结果显示:
Wilcoxon配对符号秩检验表明,无论加权与否,IPSS-M的预测误差均显著低于IPSS-R (加权:V = 1540.5,P < 0.001,效应量r = 0.74;未加权:V = 1496.0,P < 0.001,效应量r = 0.71;Cohen标准:大效应),提示IPSS-M在预测患者生存预后方面较IPSS-R更为精准(图5)。
Figure 5. Comparison of absolute residuals between IPSS-R and IPSS-M
图5. IPSS-R vs IPSS-M绝对残差比较
4) 时间依赖性ROC曲线分析
时间依赖性ROC分析在10、20、30、40、50、60个月进行评估:IPSS的最高AUC为0.729 (t = 20个月);IPSS-R的最高AUC为0.782 (t = 40个月);IPSS-M的最高AUC为0.954 (t = 40个月)。在>50个月时IPSS-M的AUC呈下降趋势,可能与样本量尤其低危组例数较少及删失比例增加有关。总体上,IPSS-M在全时段均优于IPSS与IPSS-R [12] (图6(a),图6(b))。
(a)
(b)
注:采用time-dependent ROC方法在10、20、30、40、50及60个月处计算三种评分系统的AUC。结果显示IPSS-M在40个月时预测效能最佳(AUC = 0.954),优于IPSS-R (AUC = 0.782)和IPSS (AUC = 0.729);整体上IPSS-M在各随访时间点均表现出更高的预后判别力。
Figure 6. Time-dependent ROC curve analysis comparing the predictive power of IPSS, IPSS-R, and IPSS-M
图6. 时间依赖性ROC曲线比较IPSS、IPSS-R及IPSS-M的预测效能
4. 讨论
本研究基于中国MDS患者的真实世界队列,系统比较了IPSS、IPSS-R与IPSS-M在风险分层与预后预测方面的表现。主要发现包括:其一,IPSS-M对超过半数(52.4%)患者实现了风险重分类,尤其在原IPSS-R低/中危人群中识别出具有不良分子特征的高危亚群;其二,三种评分体系均能区分不同风险组的生存差异,但IPSS-M的判别能力最强;其三,来自两种互补统计框架的结果达成一致:加权中位生存时间残差显示IPSS-M的预测误差显著更小,而time-dependent ROC进一步证实其随时间维度的稳健优势。
1) 与已有研究的关系与差异
IPSS与IPSS-R自提出以来,在指导MDS的预后评估与治疗选择方面具有里程碑意义。然而,随着NGS的普及,分子突变信息在疾病分层中的价值愈加凸显。既往研究表明,携带SF3B1突变的MDS患者可能存在多系发育不良的发生率显著降低,而TP53、EZH2、ETV6、RUNX1和ASXL1基因突变则可能被预示为患者总生存率低的预测因子[13]-[17],IPSS-M将31个基因(包括TP53、ASXL1、RUNX1、SF3B1、TET2、ETV6等)整合进模型,在原始构建与外部验证研究中均显示出较IPSS-R更高的C-index与AUC [7] [13] [18] [19]。我们的结果与上述研究一致,并进一步在中国MDS患者中验证了该优势[2] [20]。值得注意的是,本研究IPSS-M分层中高危与很高危比例(合计64.7%)相对较高,提示就诊时疾病负荷较重或分子不良因素富集,可能与就诊延迟、区域转诊选择偏倚或基因谱差异相关。
2) 分子机制与生物学解释
IPSS-M的优越性源于其对“分子高危克隆”的捕捉能力。TP53双等位突变与复杂核型密切相关,驱动克隆不稳定与对治疗的固有耐药;ASXL1突变与表观遗传失衡相关,常提示疾病进展;RUNX1突变影响造血分化与自我更新;相反,SF3B1突变常与环形铁粒幼细胞特征相关,预后相对较好[13] [19] [21]。传统模型仅以细胞遗传学与临床参数分层,无法识别同一临床表型下存在的分子异质性,导致中危“混杂池”内既包含预后较好的患者,也包含潜在的高危人群。IPSS-M通过分子权重的引入使二者得以区分,因此在我们队列中出现了中危向高危/极高危的大比例上调。
3) 临床意义与实践转化
准确的风险评估对个体化治疗方案的制定至关重要。对于被IPSS-M上调为高危的患者,临床上应更积极评估造血干细胞移植(HSCT)的时机,或在移植前期采用HMA联合策略控制疾病负荷;对于仍判定为低危的患者,则可避免过度治疗,采取BSC与症状控制为主的策略。因此,IPSS-M的引入有助于优化治疗决策,使个体化治疗方案更加精准,但仍需前瞻性研究进一步验证其在不同临床亚群中的实际效用。
4) 方法学思考
本研究同时采用了基于残差的精度度量与时间维度的判别度量。加权中位生存时间残差可直观反映“预测生存与实际生存”的偏差大小,对小样本与删失数据较为稳健;time-dependent ROC则提供了不同时间点的AUC,揭示模型在中长期随访下的区分能力变化。两者一致地指向IPSS-M的优势,增强了结论的稳健性。未来还可引入校准曲线、决策曲线分析(DCA)与靶向校准(如动态基准风险)等,从判别、校准与临床净获益三个维度建立更全面的评估框架。
5) 局限性
本研究存在多方面局限。首先,本研究样本量有限,尤其低危组例数较少,可能导致远期(>50个月) AUC估计的不稳定;其次,本研究为单中心回顾性设计,患者入组与治疗方案存在一定异质性,可能引入选择偏倚。第三,NGS面板间平台差异与检测灵敏度差异可能影响少数基因的判定;第四,仅纳入初诊突变谱,未能动态评估克隆演化对预后的影响。第五,未纳入治疗因素(如HMA、HSCT等)进行调整,部分生存差异可能受治疗策略影响。
6) 展望
未来需建设覆盖全国的前瞻性多中心MDS登记与生物样本库,系统汇总临床–细胞遗传学–分子数据,以评估IPSS-M在中国患者群的真实世界表现,且可基于中国患者突变谱的权重重估与评估校准,开发更具地域代表性的改良版评分系统。以期对每一位临床患者都能实现精准治疗与预后干预。
数据可用性声明
研究所依据的去标识化数据可在合理请求下向通讯作者申请获得。受伦理与隐私保护要求限制,涉及个人身份标识与敏感信息的数据不予公开。研究未生成超出本文陈述之外的其他可共享数据。
伦理审批与知情同意
本研究经安徽医科大学第一附属医院临床研究独立伦理委员会批准(PJ2025-06-58),并遵循《赫尔辛基宣言》相关原则。鉴于回顾性非干预性研究性质,伦理委员会批准了对既往病历数据的豁免书面知情同意。
NOTES
*第一作者。
#通讯作者。