骨肉瘤患者预后研究的发展
Advancement in Prognostic Studies among Patients Diagnosed with Osteosarcoma
DOI: 10.12677/acm.2024.143944, PDF, HTML, XML, 下载: 38  浏览: 55 
作者: 周楚雍, 向志钢*:吉首大学医学院,湖南 吉首;朱 钧*:吉首大学第四附属医院骨科,湖南 怀化
关键词: 骨肉瘤预后研究机器学习列线图Osteosarcoma Prognostic Studies Machine Learning Nomogram
摘要: 骨肉瘤是一种源自间充质细胞的恶性骨肿瘤,其特征是肿瘤细胞直接形成骨或骨样组织的增殖,通常情况下,骨肉瘤起源于骨骼,极少数情况下起源于软组织。癌症患者的预后是指患者在一定时间范围内发展为结局事件。预后研究旨在探究患者在特定基线健康状态(起点)下与未来结果(终点)之间的关联,以促进健康状况的改善。因此,预后研究结果应该是临床决策、医疗保健政策、发现和评估患者管理的新方法中不可或缺的一部分,作者根据相关的参考文献和数据总结分析了恶性骨肿瘤预后研究的发展。
Abstract: Osteosarcoma is a malignancy arising from mesenchymal cells, characterized by the direct formation of bone or bone-like tissue by tumor cells. While primarily originating from bone, there are rare instances in which osteosarcoma originates from soft tissues. The prognosis of cancer patients is defined as the occurrence of outcome events within a specific timeframe. Prognostic studies seek to investigate the relationship between patients’ initial health status and subsequent outcomes, with the goal of improving healthcare conditions. Consequently, the findings from prognostic studies should be considered vital in clinical decision-making, healthcare policies, and the identification and assessment of novel approaches in patient management. Drawing upon pertinent literature and data, the author provides a comprehensive overview of the advancements made in prognostic studies concerning malignant bone tumors.
文章引用:周楚雍, 朱钧, 向志钢. 骨肉瘤患者预后研究的发展[J]. 临床医学进展, 2024, 14(3): 2060-2065. https://doi.org/10.12677/acm.2024.143944

1. 引言

骨肉瘤(Osteosarcoma, OS)是一种源自间充质细胞的恶性骨肿瘤,其特征是肿瘤细胞直接形成骨或骨样组织的增殖,通常情况下,骨肉瘤起源于骨骼,极少数情况下起源于软组织 [1] 。该疾病的发病率约为每100万人中的6~8例,位居恶性骨肿瘤的首位(约占20%),且呈逐年上升的趋势 [2] [3] 。骨肉瘤主要发生在儿童和青少年群体,其具有强烈的局部组织侵袭性和肺转移能力 [2] ,男性患病率约为女性患病率的1.4倍 [1] 。随着诊疗标准的规范化和多种药物联合化疗的应用,无转移四肢骨肉瘤的5年生存率已从20%提高至60%~78% [4] 。然而,近30年来,无论是提高化疗剂量还是改变化疗方案,均未能显著提高骨肉瘤患者的生存率,约30%的患者在确诊后5年内会经历肿瘤进展、转移并最终死亡 [5] 。统计数据显示,骨肉瘤的发病率和死亡率以每年约1.4%的速度持续增长 [6] 。

癌症患者的预后是指患者在一定时间范围内发展为结局事件(包括疾病进展、复发、死亡等)的概率或风险 [7] 。预后研究旨在探究患者在特定基线健康状态(起点)下与未来结果(终点)之间的关联,以促进健康状况的改善 [7] 。因此,预后研究结果应该是临床决策、医疗保健政策、发现和评估患者管理的新方法中不可或缺的一部分 [8] 。

在临床诊疗工作中,肿瘤患者及其家属常常会提出一些关于生存期的问题,例如“我还能活多久”。医生通常会根据患者的检查结果和自身经验来预测患者的生存期。然而,这种方法的预测效果有限,并且容易受到医生主观认知偏差的影响。研究表明,医生对患者生存时间的预测往往会比实际生存时间长约45%,而预测误差在一周以内的病例仅占25%。即使是经验丰富的临床医学专家,其临床预测准确率也只有约30% [9] 。经过多年的发展,目前对于癌症的预后已经有了许多种的预测方法。

本文综述了骨肉瘤预后研究的最新进展,并对各种预测方法的优缺点进行了讨论,旨在展望未来提高骨肉瘤预后准确率的可能性。

2. 统计学方法

大量的临床研究尝试使用统计学方法来解释癌症的预后,线性回归、Logistic回归和Cox比例风险模型是医学统计分析中使用频率最高的3种多因素统计方法 [10] 。Kaplan-Meier生存曲线和Cox比例风险模型是生存分析中常用的方法,但它们都存在一定的局限性。

Kaplan-Meier生存曲线是一种非参数方法,它可以直观地描述未调整的生存时间。然而,该方法无法控制混杂因素,并且在处理精确生存时间数据时并不适用。此外,在样本量较小或数据较少的情况下,准确性不高。此外,当数据中存在混杂变量时,Kaplan-Meier曲线无法进行多变量调整 [11] 。

Cox比例风险模型是一种半参数回归技术,可以估计变量与危险率之间的关系,并且适用于控制多个混杂因素。然而,该模型基于比例风险假设,即组之间的相对风险在随时间变化时保持不变。然而,这个假设并不总是成立的,一旦违背,将导致误导性的结果。此外,Cox模型对生存曲线施加单一形状,缺乏灵活性,并且在处理连续协变量或高维数据时预测效果欠佳。此外,它与Kaplan-Meier曲线一样,受数据量的影响较大 [11] 。

大量研究结果表明发病年龄、肿瘤部位、肿瘤大小、转移情况、手术类型等是预测骨肉瘤患者预后的独立因素 [12] 。然而,单个因素的预测能力是非常有限的,而且此类研究的结论是对具有共同特征的骨肉瘤患者进行整体评估,而不是对某个具体骨肉瘤患者的生存期进行预测,这种预测缺乏个性化,对于特定个体的预测是不准确的。通过这些研究,仅能证明这些独立因素对疾病预后的影响,并不能对其进行准确的预测。

3. TNM分期

TNM分期系统最早由国际癌症联合会(UICC)在20世纪初期创建。这个系统旨在统一和标准化癌症分期的方式,通过评估肿瘤(Tumor, T)、淋巴结(Node, N)和远处转移(Metastasis, M)来确定癌症的严重程度。随后,美国关节委员会癌症(AJCC)也开始采用并发展这一系统 [13] ,骨肉瘤的分期见图1。对肿瘤的研究表明,随着时间的推移,大多数肿瘤会逐渐从原发部位扩散至淋巴结,然后通过淋巴结转移到远处器官,癌症分期有助于确定肿瘤在体内扩散的程度或进展,使医生能够便于向患者传达疾病状况和预后信息,指导手术治疗,并为后续的辅助治疗提供指导。但使用TNM分期进行预后预测并不准确 [14] 。

Figure 1. The 7th edition of the AJCC cancer staging for Osteosarcoma

图1. 第七版AJCC骨肉瘤分期

4. 分子标志物

近年来,随着科学技术的不断进步,分子生物学领域在癌症研究中的应用日益广泛。骨肉瘤作为一种少见但具有高度侵袭性的骨髓肿瘤,其预后研究对于深入了解病理生理机制和制定更有效的治疗方案至关重要。在这一背景下,分子生物标志物的发现和应用成为了骨肉瘤预后研究中的焦点之一。

分子生物标志物是指能够在分子水平上反映疾病状态或预后的特定分子结构或表达。在骨肉瘤预后研究中,研究人员通过深入挖掘肿瘤细胞内部的分子变化,寻找那些与患者生存期、疾病进展等密切相关的标志物。这些标志物的发现为骨肉瘤的个体化治疗和预后评估提供了有力的支持。

骨肉瘤缺乏特异性的肿瘤标志物;但血清生化标志物如血清碱性磷酸酶(ALP)和乳酸脱氢酶(LDH)在骨肉瘤的诊断、预后和治疗反应中具有一定的参考意义 [1] 。40%~80%的骨肉瘤患者碱性磷酸酶水平有升高,伴有转移或多中心骨肉瘤患者的碱性磷酸酶和乳酸脱氢酶水平可有更为显著的升高 [15] [16] 。肿瘤活跃度水平越高,碱性磷酸酶的水平就越高,预后就越差。

根据2019年Bo Gou [17] 的研究结果显示,术前平均血小板体积与血小板水平(MPV/PCT)与骨肉瘤的预后存在一定的关联。该研究针对188名接受新辅助化疗和肿瘤手术切除的骨肉瘤患者进行了分析,高MPV/PCT比值可能是男性骨肉瘤患者良好预后的独立预测因子。这些发现提示,术前MPV/PCT比值有望作为骨肉瘤患者预后的一个独立标志物,但仍需要进一步的研究来验证这些结论。

在2022年的研究中,Tao Guo [18] 等人对114例骨肉瘤患者的标本进行了研究,探讨了SMARCB1表达与骨肉瘤患者生存率之间的关系。研究结果显示,SMARCB1表达弱的患者的5年生存率(45.5%,95% CI:30.0%~61.0%)明显低于表达强的患者(78.9%,95% CI:63.8%~94.0%) (P < 0.001)。研究还对SMARCB1表达与骨肉瘤生存率中的其他因素(如年龄、性别、疾病状态和对新辅助化疗的反应)进行了多因素分析。通过Cox回归分析,结果证实弱SMARCB1表达是骨肉瘤患者生存率缩短的唯一独立危险因素(P = 0.015)。

5. 列线图

列线图,又称为诺莫图(Nomogram),是当前医学领域中广泛应用的数学工具,该理论于1884年由法国工程师Philbert Madurice d’Ocagne提出,用于预测特定临床事件(如癌症的复发或生存率)的概率 [19] 。它将复杂的统计预测模型简化为易于理解的图形表示形式,帮助医生和患者在临床决策中使用。诺莫图通过整合个体患者的特定资料,生成针对该患者的事件概率估计。相对于TNM分期的局限性,列线图具有许多优势。首先,诺莫图能够综合患者的个人信息和疾病特征,生成针对个体患者的事件(如死亡或复发)概率预测,为医生和患者提供个性化的信息。其次,列线图能够纳入连续变量和影响疾病预后的相关决定因素进行分析 [20] 。第三,通过简单的图形表示法,诺莫图将复杂的统计预测模型转化为容易理解和使用的工具,便于在临床决策中快速应用 [21] 。

在2021年Haibo Zhan [14] 等人通过从美国癌症统计数据的监测、流行病学和最终结果(SEER)数据库中选取诊断为Ewing肉瘤的患者数据,通过单变量和多变量Cox回归分析,识别出与预后独立相关的风险因素,并据此构建列线图,用于预测患者的3年和5年总生存(OS)及癌症特异性生存(CSS)。通过训练组和验证组对列线图进行了内部和外部验证,并通过ROC曲线、C指数和校准曲线评估了其预测能力。与第七版TNM分期进行比较,研究结果显示,该列线图在预测Ewing肉瘤患者的3年和5年总体生存率(OS)以及癌症特异性生存率(CSS)方面,表现出较高的准确性。

列线图根据所有自变量的回归系数设定评分标准,然后给出每个自变量的评分值并计算总分,从而计算发生特定事件的概率。在多种肿瘤中,列线图对患者个体预后的判断优于医师基于临床经验的推测 [22] [23] [24] [25] 。然而,列线图本质上是基于统计学中的逻辑回归或Cox回归模型。这类模型通常基于每个预测因子与肿瘤患者出现某个临床事件(如生存、死亡、复发或转移等)的结果呈线性相关的假设进行推断,从而过度简化了某些复杂关系,包括非线性关联、非线性相互作用和效应修正等,导致预测准确性下降 [26] [27] 。

6. 机器学习

近年来,机器学习受到广泛关注,为克服无法识别复杂关系带来了希望。例如,人工神经网络(Artificial Neural Network, ANN)模拟大脑神经网络的模式来处理非线性数据关系;支持向量机(Support Vector Machine, SVM)能够处理复杂特征数据集,并将其转化为凸优化问题,通过引用核函数将非线性问题映射到高维特征空间中以进行判别;卷积神经网络(Convolutional Neural Network, CNN)可以自动学习特征,并将结果泛化到未知数据中 [28] 。

机器学习利用现代计算机知识和数学算法,释放数据生成机制,考虑各个变量之间的交互作用和效应修正,识别各个预测因子之间的复杂关系,完成(半)参数化建模 [29] ,以更有效地处理医疗数据的复杂性和多样性。

Bing-li Ba [30] 等利用美国SEER数据库(Surveillance, Epidemiology, and End Results databases)中骨肉瘤的患者数据。通过六种机器学习技术开发了远处转移的预测模型,包括逻辑回归(LR)、支持向量机(SVM)、高斯朴素贝叶斯(Gaussian NB)、极端梯度提升(XG Boost)、随机森林(RF)和k最近邻算法(kNN),采用自适应合成(ADASYN)技术来处理不平衡的数据。Shapley附加解释(SHAP)分析为每个患者生成了可视化的解释。最后,采用平均精确度(AP)、灵敏度、特异性、准确性、f1评分、精度–召回率曲线、标定图和决策曲线分析(DCA)对模型的有效性进行评价。证明6种机器学习算法实现了0.661~0.781预测远处转移的AP。RF模型的性能最佳,准确率为71.8%,证明机器学习方法能够精确预测骨肉瘤患者生存率,以帮助临床医生进行临床决策。

7. 结论

骨肉瘤患者预后研究正逐步展现出多方面的进展。通过深入研究影响患者预后的因素及医学治疗的不断创新,我们加深了对骨肉瘤预后研究的认识。分子生物标志物的应用为预后研究提供了新的视角,为个性化治疗奠定了基础。列线图将复杂的统计预测模型简化为易于理解的图形表示形式,在临床实践上更容易理解并更加个性化、更加精准。机器学习是目前癌症预后研究的热点,在骨肉瘤方面也有应用,它具有通过大数据提升准确率的优点。在未来,我们期待通过综合性手段,为骨肉瘤患者提供更有效的治疗方案,进一步提升患者的生存质量。

NOTES

*通讯作者。

参考文献

[1] Messerschmitt, P.J., Garcia, R.M., Abdul-Karim, F.W., et al. (2009) Osteosarcoma. The Journal of the American Academy of Orthopaedic Surgeons, 17, 515-527.
https://doi.org/10.5435/00124635-200908000-00005
[2] Zhao, X., Wu, Q., Gong, X., et al. (2021) Osteosarcoma: A Review of Current and Future Therapeutic Approaches. Biomedical Engineering Online, 20, Article No. 24.
https://doi.org/10.1186/s12938-021-00860-0
[3] Jo, V.Y. and Fletcher, C.D. (2014) WHO Classification of Soft Tissue Tumours: An Update Based on the 2013 (4th) Edition. Pathology, 46, 95-104.
https://doi.org/10.1097/PAT.0000000000000050
[4] Anderson, M.E. (2016) Update on Survival in Osteosarcoma. The Orthopedic Clinics of North America, 47, 283-292.
https://doi.org/10.1016/j.ocl.2015.08.022
[5] Marchandet, L., Lallier, M., Charrier, C., et al. (2021) Mechanisms of Resistance to Conventional Therapies for Osteosarcoma. Cancers, 13, Article 683.
https://doi.org/10.3390/cancers13040683
[6] Siegel, R.L., Miller, K.D. and Jemal, A. (2017) Cancer Statistics, 2017. CA: A Cancer Journal for Clinicians, 67, 7-30.
https://doi.org/10.3322/caac.21387
[7] Moons, K.G., Royston, P., Vergouwe, Y., et al. (2009) Prognosis and Prognostic Research: What, Why, and How? BMJ, 338, b375.
https://doi.org/10.1136/bmj.b375
[8] Hemingway, H., Croft, P., Perel, P., et al. (2013) Prognosis Research Strategy (PROGRESS) 1: A Framework for Researching Clinical Outcomes. BMJ, 346, e5595.
https://doi.org/10.1136/bmj.e5595
[9] Glare, P., Virik, K., Jones, M., et al. (2003) A Systematic Review of Physicians’ Survival Predictions in Terminally Ill Cancer Patients. BMJ, 327, 195-198.
https://doi.org/10.1136/bmj.327.7408.195
[10] 周支瑞, 李博. 临床预测模型构建方法学[M]. 长沙: 中南大学出版社, 2021.
[11] Nieto, F.J. and Coresh, J. (1996) Adjusting Survival Curves for Confounders: A Review and a New Method. American Journal of Epidemiology, 143, 1059-1068.
https://doi.org/10.1093/oxfordjournals.aje.a008670
[12] 杨乾坤, 陈通, 王巍, 等. 骨肉瘤预后相关的临床预测指标[J]. 中华肿瘤杂志, 2021, 43(5): 516-522.
[13] Edge, S.B. and Compton, C.C. (2010) The American Joint Committee on Cancer: The 7th Edition of the AJCC Cancer Staging Manual and the Future of TNM. Annals of Surgical Oncology, 17, 1471-1474.
https://doi.org/10.1245/s10434-010-0985-4
[14] Zhan, H., Mo, F., Zhu, M., et al. (2021) A SEER-Based Nomogram Accurately Predicts Prognosis in Ewing’s Sarcoma. Scientific Reports, 11, Article No. 22723.
https://doi.org/10.1038/s41598-021-02134-0
[15] Ren, H.Y., Sun, L.L., Li, H.Y., et al. (2015) Prognostic Significance of Serum Alkaline Phosphatase Level in Osteosarcoma: A Meta-Analysis of Published Data. BioMed Research International, 2015, Article ID: 160835.
https://doi.org/10.1155/2015/160835
[16] Chen, J., Sun, M.X., Hua, Y.Q., et al. (2014) Prognostic Significance of Serum Lactate Dehydrogenase Level in Osteosarcoma: A Meta-Analysis. Journal of Cancer Research and Clinical Oncology, 140, 1205-1210.
https://doi.org/10.1007/s00432-014-1644-0
[17] Gou, B., Cao, H., Cheng, X., et al. (2019) Prognostic Value of Mean Platelet Volume to Plateletcrit Ratio in Patients with Osteosarcoma. Cancer Management and Research, 11, 1615-1621.
https://doi.org/10.2147/CMAR.S193949
[18] Guo, T., Wei, R., Dean, D.C., et al. (2022) SMARCB1 Expression Is a Novel Diagnostic and Prognostic Biomarker for Osteosarcoma. Bioscience Reports, 42, BSR20212446.
https://doi.org/10.1042/BSR20212446
[19] Kattan, M.W., Leung, D.H. and Brennan, M.F. (2002) Postoperative Nomogram for 12-Year Sarcoma-Specific Death. Journal of Clinical Oncology, 20, 791-796.
https://doi.org/10.1200/JCO.2002.20.3.791
[20] 蔺海山, 哈巴西∙卡肯, 马超, 等. 基于SEER数据库绘制列线图分析软骨肉瘤患者预后相关因素[J]. 现代肿瘤医学, 2022, 30(7): 1292-1299.
[21] Iasonos, A., Schrag, D., Raj, G.V., et al. (2008) How to Build and Interpret a Nomogram for Cancer Prognosis. Journal of Clinical Oncology, 26, 1364-1370.
https://doi.org/10.1200/JCO.2007.12.9791
[22] 左怡洁, 闵安杰, 胡传宇, 等. 基于SEER数据库的口底鳞状细胞癌特异性预后分析及列线图模型构建[J]. 临床口腔医学杂志, 2021, 37(6): 339-344.
[23] 黄凯, 张长乐, 吴文涌, 等. 结肠癌列线图预后风险模型构建:基于SEER数据库的回顾性研究[J]. 安徽医科大学学报, 2021, 56(2): 299-305.
[24] 李文乐, 胡朝晖, 王永辉, 等. 基于SEER数据库脊索瘤临床预测模型的建立及验证[J]. 中国骨与关节杂志, 2021, 10(2): 85-92.
[25] Morlacco, A., Modonutti, D., Motterle, G., et al. (2021) Nomograms in Urologic Oncology: Lights and Shadows. Journal of Clinical Medicine, 10, Article 980.
https://doi.org/10.3390/jcm10050980
[26] Breslow, N.E. and Day, N.E. (1975) Indirect Standardization and Multiplicative Models for Rates, with Reference to the Age Adjustment of Cancer Incidence and Relative Frequency Data. Journal of Chronic Diseases, 28, 289-303.
https://doi.org/10.1016/0021-9681(75)90010-7
[27] Chen, J.H. and Asch, S.M. (2017) Machine Learning and Prediction in Medicine—Beyond the Peak of Inflated Expectations. The New England Journal of Medicine, 376, 2507-2509.
https://doi.org/10.1056/NEJMp1702071
[28] Fernández-Delgado, M., Cernadas, E., Barro, S., et al. (2014) Do We Need Hundreds of Classifiers to Solve Real World Classification Problems. Journal of Machine Learning Research, 15, 3133-3181.
[29] Ryo, M. and Rillig, M.C. (2017) Statistically Reinforced Machine Learning for Nonlinear Patterns and Variable Interactions. Ecosphere, 8, e01976.
https://doi.org/10.1002/ecs2.1976
[30] Bai, B.L., Wu, Z.Y., Weng, S.J., et al. (2023) Application of Interpretable Machine Learning Algorithms to Predict Distant Metastasis in Osteosarcoma. Cancer Medicine, 12, 5025-5034.
https://doi.org/10.1002/cam4.5225