构建胰腺癌术后复发预测模型:基于SEER数据库
Constructing a Predictive Model for Pancreatic Cancer Postoperative Recurrence: Based on the SEER Database
DOI: 10.12677/acm.2024.1451502, PDF, HTML, XML, 下载: 48  浏览: 79  科研立项经费支持
作者: 曹荣健, 赵建建, 李 倩, 刘福国, 周建蕊, 荆 雪*:青岛大学附属医院消化内科,山东 青岛
关键词: 胰腺癌复发预测模型Pancreatic Cancer Recurrence Prediction Model
摘要: 目的:发现关于胰腺癌术后复发风险要素,构建胰腺癌患者术后复发的风险预测模型。方法:从SEER数据库中提取2000年至2018年期间诊断为胰腺癌的3960例患者的临床资料,随机分为建模组和验证组,使用单因素和多因素Logistic回归模型分析胰腺癌患者术后复发的风险因素并构建列线图模型;使用ROC曲线及的曲线下面积(AUC)和校正曲线评估模型的准确性,使用DAC决策曲线评估患者的获益程度。结果:多因素Logistic回归分析发现,年龄、原发灶部位、病理类型、组织学分级、T分级、淋巴结阳性个数、放化疗情况是患者预后的独立影响因素(P < 0.05)。训练组ROC曲线下面积(AUC值)为0.765 (95%CI: 0.746~0.783),验证组ROC曲线下面积(AUC值)为0.770 (95%CI: 0.742~0.798),校准曲线表明预测值与实际值有良好的一致性,决策曲线(DCA)显示模型有良好的临床效用。结论:本研究成功构建了胰腺癌患者术后复发的风险预测模型。
Abstract: Objective: To find out the risk factors of postoperative recurrence of pancreatic cancer and construct a risk prediction model for postoperative recurrence of pancreatic cancer. Methods: The clinical data of 3960 patients diagnosed with pancreatic cancer from 2000 to 2018 were extracted from SEER database and randomly divided into a modeling group and a validation group. Single factor and multi factor logistic regression models were used to analyze the risk factors of postoperative recurrence of pancreatic cancer patients and construct a nomogram model; ROC curve and area under curve (AUC) and calibration curve were used to evaluate the accuracy of the model, and DAC decision curve was used to evaluate the degree of benefit for patients. Results: Multivariate logistic regression analysis revealed that age, primary lesion location, pathological type, histological grade, T-grade, number of positive lymph nodes, and radiation and chemotherapy status were independent prognostic factors for patients (P < 0.05). The area under the ROC curve (AUC value) of the training group was 0.765 (95%CI: 0.746~0.783), while the area under the ROC curve (AUC value) of the validation group was 0.770 (95%CI: 0.742~0.798). The calibration curve showed good consistency between the predicted and actual values, and the decision curve (DCA) showed that the model had good clinical utility. Conclusion: This study successfully constructed a risk prediction model for postoperative recurrence of pancreatic cancer.
文章引用:曹荣健, 赵建建, 李倩, 刘福国, 周建蕊, 荆雪. 构建胰腺癌术后复发预测模型:基于SEER数据库[J]. 临床医学进展, 2024, 14(5): 871-882. https://doi.org/10.12677/acm.2024.1451502

1. 背景

胰腺癌是全球癌症死亡主要原因之一,每年胰腺癌的新发病例约45.89万,死亡病例约43.22万,年发病率几乎等于年死亡率,其全球负担在过去25年中增加了一倍以上 [1] [2] 。2015年中国新发胰腺癌9.5万例,8.5万人因之死亡,胰腺癌位居恶性肿瘤发病谱的第10位,死亡谱的第7位 [3] 。完全切除对于胰腺癌的治愈至关重要。虽然切除率逐渐增加,但预后仍然很差,五年生存率低于20% [4] 。CA19-9可用于胰腺癌评估分期、预后、可切除性、复发和治疗效果,是美国食品药品管理局(FDA)唯一批准的可用于临床的胰腺癌血清标志物,但其灵敏度和特异度有限 [5] [6] 。美国癌症联合会(AJCC)制定的肿瘤–淋巴结转移(TNM)癌症分期系统也是临床上较为常用的预测胰腺癌预后的方法 [7] ,但是如分化程度、病理类型,性别、年龄等其他可以影响预后的因素并没有包括。因此,确定可靠的复发预测因素非常重要。

2. 资料与方法

2.1. 资料收集

监测、流行病学和最终结果(SEER)数据库库由美国国立癌症研究所于1973年建立,共收集了约35%的美国人口的肿瘤相关数据,是目前世界上最具有权威性的癌症数据库之一 [8] 。本研究从SEER网站(https://seer.cancer.gov)注册账号,申请使用权限,然后采用SEER*stat软件(8.4.0.1版本)从数据库中下载获得2000~2018年胰腺癌术后患者的临床数据,包括年龄、性别、种族、原发灶部位、组织学分级、TNM分级、淋巴结阳性、放化疗情况及肿瘤大小。并将已经远处转移的病例、缺少数据的进行剔除,共有3960名患者纳入研究。

2.2. 统计分析

首先应用随机数字分组法,通过Excel中的RANDBETWEEN()指令随机生成3960个0~3960之间的随机数,按照2:1的比例,前2766个随机数对应的病例纳入训练组,后1194个随机数对应的病例纳入训练组。SEER数据库虽然注明了部分患者因复发而死亡,但未统计患者具体的复发时间,因此我们无法进行Cox回归分析,而采用Logistic回归分析胰腺癌术后复发转移的危险因素。

使用SPSS25.0软件对数据进行Logistic单因素分析,P ≤ 0.05认为有统计学意义,纳入多因素分析。基于筛选出的独立危险因素,利用R语言(4.2.1)软件rms包构建列线图、ROC曲线及校正曲线,应用rmda软件包绘制决策曲线。

3. 结果

3.1. 基本信息

患者的临床病理特征和治疗信息:在总样本中,60~69年龄段的患者最多,占比为36.65%,70~79年龄段次之,占比28.3%,两者总占比为64.95%;男性占比为49.7%,女性占比为50.2%;白人占总人数的80.3%、黑人占10.5%、其他人种占9.2%;胰腺头部为好发部位占比64%;病理类型最多的为腺癌,占比49.67%,其次为浸润性导管癌占比31%;67.8的患者处于T3分期,淋巴结阳性4个以上的占81%,放疗人数占总人数的28.9%,化疗占53.9%,肿瘤平均大小为41.82 mm。患者的临床特征及相关诊疗信息,总数据、复发患者、未复发患者及训练组、验证组信息如表1所示。

Table 1. Baseline characteristics table

表1. 基线特征表

3.2. 与胰腺癌术后复发的相关危险因素筛选

通过对训练组进行单因素Logistic分析,得出年龄、原发灶部位、病理类型、组织学分级、T分级、淋巴结阳性数、放化疗情况是患者复发的相关危险因素(P < 0.05)。将上述因素再进行多因素Logistic分析,年龄(<60岁)、原发灶部位(胰腺尾部)、病理类型(神经内分泌癌、其他类别)、组织学分级(低分化、高分化、未分化)、T分级(T1、T2)、淋巴结阳性个数、放化疗最终纳入预测模型(P < 0.05),详见表2

Table 2. Univariate and multivariate logistic regression analyses

表2. 单因素、多因素logistic分析

3.3. 列线图的构建和验证

将训练组通过Logistic多因素回归筛选出的有统计学意义(P < 0.05)的预后影响因素即年龄、原发灶部位、病理类型、组织学分级、T分级、淋巴结阳性个数、放疗、化疗9个独立的危险因素通过R语言构建列线图,详见图1。列线图所示总分数越高,发生术后复发概率也越大。

3.4. ROC曲线与校准曲线

训练组ROC曲线下面积(AUC值)为0.765 (95%CI: 0.746~0.783),验证组ROC曲线下面积(AUC值)为0.770 (95%CI: 0.742~0.798) (图2)。校准曲线显示复发预测值和实际值有较好的一致性(图3),表明该模型比较好的的精确度及准确度。

3.5. DAC决策曲线

决策曲线分析(DAC)是一种评估预测模型的方法,通过远处转移的风险阈值(X轴)和净收益(Y 轴)衡量其临床有效性 [9] 。该预测模型的DCA曲线显示风险阈值为0.2~0.8时,基于列线图模型采取临床干预决策带来的净收益率高于未采取临床干预决策,表明该列线图预测模型的临床效能较好(图4)。

Figure 1. Nomogram for predicting pancreatic cancer recurrence after resection

图1. 预测胰腺癌术后复发的列线图

(a)(b)

Figure 2. (a) ROC curve for the training group; (b) ROC curve for the validation group

图2. (a) 练组ROC曲线;(b) 验证组ROC曲线

(a)(b)

Figure 3. (a) Calibration plot for the training group; (b) Calibration plot for the validation group

图3. (a) 训练组校准图;(b) 验证组校准图

Figure 4. Decision curve for DAC

图4. DAC决策曲线

4. 讨论

胰腺癌依然是现在最具治疗挑战性的恶性肿瘤之一。在目前可用于治疗胰腺癌的所有方法中,只有切除术提供了治愈的机会,但是大多数患者即使在以治愈为目的的切除后仍会复发,长期结局依然不令人满意,大多在手术后2年内复发,5年生存率仅为10%~40%,中位总生存期为28个月 [10] [11] 。在本研究的3960例患者中2369例出现了复发(59.8%),胰腺癌易复发的特点严重影响患者的生存时间和预后。许多数研究表明CA19-9水平、手术切缘状况、是否存在淋巴结转移等因素可用于预测术后复发 [12] 。但这些指标还不能够准确评估患者术后生存情况,有待于探索新的更具个性化的评分系统用于判断术后复发几率。列线图可以根据个体患者的概况量身定制,通过纳入多种危险因素,计算每个个体的特定事件的概率,将统计预测模型简化为事件概率的单一数值估计,更准确地估计患者预后 [13] [14] 。目前我们在知网、Pubmed等平台搜索中发现,还没有基于大样本数据的胰腺癌术后复发预测模型。因此,本研究基于SEER数据库胰腺癌患者信息,筛选出胰腺癌复发的危险因素,为临床医生提供一个经济实用的模型来预测患者的复发,具有非常高的应用价值。

本研究经过单因素及多因素分析得出年龄、原发灶部位、病理类型、组织学分级、T分级、淋巴结阳性个数、放化疗情况是发生复发的独立危险因素。胰腺癌通常是老年人的疾病,因为90%的新诊断患者年龄超过55岁,大多数在七八十岁。虽然胰腺癌很少在45岁之前出现,但此后发病率急剧上升。随着慢性病生存率的提高,被诊断患有胰腺癌的老年患者数量正在增加 [1] 。冯程程等 [15] 的研究认为随着年龄的增加,胰腺癌发病率呈现逐年增长趋势,表明年龄是胰腺癌发生的危险因素,可能与年龄相关的免疫力下降和胰腺癌危险因素的累积有关,这与本研究单因素Logistic比例风险回归分析的结果类似。关于原发灶部位,有研究 [16] 认为因为胰头、胰体、胰尾在消化和分泌方面具有不同的作用,因而其临床特征不同,可能是由不同的组织学成分和不同的生物学功能引起的,胰体癌、尾癌患者的生存率优于胰腺头癌患者。肿瘤的组织学分级、分化程度、病理类型、淋巴结阳性个数和T分级是公认影响胰腺癌预后的重要因素。分化程度高表明肿瘤恶性程度及侵袭能力强,发生复发的可能性也就更大 [17] 。T分期也表明肿瘤局部浸润的程度越广,远处转移的风险高。淋巴结转移阳性的影响被认为是预后最重要的指标之一,淋巴结转移阳性可将5年OS从40%降至10%以下 [18] ,阳性数目越多,意味着肿瘤细胞微转移的可能性越大,易导致术后肿瘤细胞残留,从而发生术后复发 [19] 。放化疗情况是我们所能控制的减少患者复发率的因素,化疗是多模式胰腺癌治疗的重要组成部分,根治性切除术后,辅助化疗可显著提高无病生存期和总生存期 [20] 。虽然化疗和手术在胰腺癌中起主要作用,但放疗(RT)在这种疾病的多模式管理中仍然占有一席之地 [21] ,一项研究表明 [22] 辅助放化疗可显著提高胰十二指肠切除术后头、颈部或胰腺突腺癌的生存率,在我们的研究中也得出相似的结论,是否化疗是影响患者术后复发的独立危险因素,单因素分析、多因素分析P值均小于0.005。

虽然在以前的研究中,肿瘤大小是胰腺癌可切除性和预后最重要的决定因素之一 [23] 。Satake等 [24] 发现,肿瘤大小 < 40毫米的PAC代表更好的预后,但本研究中不同直径胰腺癌的复发情况无统计学差异(P = 0.51)。

本研究有以下优点:首先,本研究有较为大样本量(3960例)的临床数据,研究结果有较高的可靠性。其次,我们预测模型训练组AUC (0.765)、验证组AUC (0.770)均高于0.7,说明我们的预测模型在预测胰腺癌复发方面具有相对较高的准确性。本研究也存在一些局限性。第一,作为一项回顾性研究存在一定的选择偏倚。第二,缺乏相关的实验室检查数据,早先有报道CA199水平与复发有关 [25] ,另外,癌胚抗原(Carcinoembryonic antigen, CEA)作为一种广泛应用的肿瘤标志物,其在诊断胰腺癌时的特异性与CA19-9相当,但其灵敏度相对较低,这意味着并非所有胰腺癌患者都会表现出CEA水平的显著升高。另一方面,糖类抗原125 (Carbohydrate antigen 125, CA125)水平的升高则与胰腺癌术后早期发生远处转移有关,它能够在一定程度上揭示胰腺癌的转移能力及其发展趋势。临床实践中还会使用到诸如CA50、CA15-3、CA242、CA72-4等一系列肿瘤标志物。将这些标志物联合起来进行检测,有助于提高对胰腺癌诊断的敏感性和特异性,从而更准确地识别疾病状态。增加相应的实验室指标可以进一步增加预测模型的准确度。

5. 结论

综上,本研究确定了胰腺癌复发相关的9个危险因素,建立了一个具有较高准确性的列线图模型,帮助临床医师评估术后胰腺癌患者的复发风险,通过为患者提供个体化的诊疗方案,提高患者的生存率。

基金项目

山东省自然科学基金面上项目(ZR202103040311);

山东省医药卫生科技发展计划(No. ZR202103040311)。

NOTES

*通讯作者。

参考文献

[1] GBD 2017 Pancreatic Cancer Collaborators (2019) The Global, Regional, and National Burden of Pancreatic Cancer and Its Attributable Risk Factors in 195 Countries and Territories, 1990-2017: A Systematic Analysis for the Global Burden of Disease Study 2017. The Lancet Gastroenterology & Hepatology, 4, 934-947.
[2] 张敏, 徐杰茹, 陈磊, 等. 2005-2016年中国胰腺癌发病趋势及影响因素分析[J]. 中南医学科学杂志, 2022, 50(3): 358-361.
[3] Chen, W., Zheng, R., Baade, P.D., et al. (2016) Cancer Statistics in China, 2015. CA: A Cancer Journal for Clinicians, 66, 115-132.
https://doi.org/10.3322/caac.21338
[4] Oettle, H., Post, S., Neuhaus, P., et al. (2007) Adjuvant Chemotherapy with Gemcitabine vs Observation in Patients Undergoing Curative-Intent Resection of Pancreatic Cancer: A Randomized Controlled Trial. JAMA, 297, 267-277.
https://doi.org/10.1001/jama.297.3.267
[5] Luo, G., Jin K., Deng S., et al. (2021) Roles of CA19-9 in Pancreatic Cancer: Biomarker, Predictor, and Promoter. Biochimica et Biophysica Acta (BBA)-Reviews on Cancer, 1875, Article 188409.
https://doi.org/10.1016/j.bbcan.2020.188409
[6] 田永, 王瑞勤, 常越, 等. 微小RNA-143、糖类抗原19-9在胰腺癌诊断和预后预测中的应用价值[J]. 癌症进展, 2022, 20(14): 1505-1508.
[7] Edge, S.B. and Compton C.C. (2010) The American Joint Committee on Cancer: The 7th Edition of the AJCC Cancer Staging Manual and the Future of TNM. Annals of Surgical Oncology, 17, 1471-1474.
https://doi.org/10.1245/s10434-010-0985-4
[8] Doll, K.M., Rademaker, A. and Sosa, J.A. (2018) Practical Guide to Surgical Data Sets: Surveillance, Epidemiology, and End Results (SEER) Database. JAMA Surgery, 153, 588-589.
https://doi.org/10.1001/jamasurg.2018.0501
[9] Van Calster, B., Wynants, L., Verbakel, J.F.M., et al. (2018) Reporting and Interpreting Decision Curve Analysis: A Guide for Investigators. European Urology, 74, 796-804.
https://doi.org/10.1016/j.eururo.2018.08.038
[10] Okusaka, T. (2022) Treatment for Postoperative Recurrence of Pancreatic Cancer: A Narrative Review. Chinese Clinical Oncology, 11, Article 19.
https://doi.org/10.21037/cco-21-87
[11] Tanaka, M., Mihačević, A.L., Probst, P., et al. (2019) Meta-Analysis of Recurrence Pattern after Resection for Pancreatic Cancer. British Journal of Surgery, 106, 1590-1601.
https://doi.org/10.1002/bjs.11295
[12] 王若尘, 吴德全. 复发性胰腺癌的预测及治疗的研究进展[J]. 医学研究生学报, 2020, 33(5): 555-560.
[13] Iasonos, A., Schrag, D., Raj, G.V., et al. (2008) How to Build and Interpret a Nomogram for Cancer Prognosis. Journal of Clinical Oncology, 26, 1364-1370.
https://doi.org/10.1200/JCO.2007.12.9791
[14] 赛麦提喀日·阿布都巴日, 梅玉洁, 安恒庆, 等. 基于SEER数据库构建前列腺癌术后生存率预测模型[J]. 现代预防医学, 2022, 49(21): 4026-4032.
[15] 冯程程, 许传志, 何杰宇, 等. 1990-2019年中国20~84岁人群胰腺癌发病趋势分析[J]. 中华肿瘤防治杂志, 2022, 29(18): 1323-1329.
[16] Yin, L., Xiao, L., Gao, Y., et al. (2020) Comparative Bioinformatical Analysis of Pancreatic Head Cancer and Pancreatic Body/Tail Cancer. Medical Oncology, 37, Article No. 46.
https://doi.org/10.1007/s12032-020-01370-0
[17] Adachi, E., Maehara, S., Tsujita, E., et al. (2002) Clinicopathologic Risk Factors for Recurrence after a Curative Hepatic Resection for Hepatocellular Carcinoma. Surgery, 131, S148-S152.
https://doi.org/10.1067/msy.2002.119496
[18] Erdem, S., Bölükbaş, M., Müller, S.A., et al. (2020) Role of Lymphadenectomy in Resectable Pancreatic Cancer. Langenbeck’s Archives of Surgery, 405, 889-902.
https://doi.org/10.1007/s00423-020-01980-2
[19] 张世祥. 影响胰头癌切除术后患者预后的相关因素分析[D]: [硕士学位论文]. 银川: 宁夏医科大学, 2020.
[20] Springerfeld, C., Jäger, D., Büchler, M.W., et al. (2019) Chemotherapy for Pancreatic Cancer. Presse Médicale, 48, e159-e174.
https://doi.org/10.1016/j.lpm.2019.02.025
[21] Brunner, T.B., Haustermans, K., Huguet, F., et al. (2021) ESTRO ACROP Guidelines for Target Volume Definition in Pancreatic Cancer. Radiotherapy and Oncology, 154, 60-69.
https://doi.org/10.1016/j.radonc.2020.07.052
[22] Yeo, C.J., Abrams, R.A., Grochow, L.B., et al. (1997) Pancreaticoduodenectomy for Pancreatic Adenocarcinoma: Postoperative Adjuvant Chemoradiation Improves Survival. A Prospective, Single-Institution Experience. Annals of Surgery, 225, 621-633.
https://doi.org/10.1097/00000658-199705000-00018
[23] Chiang, K.C., Yeh, C.N., Lee, W.C., et al. (2009) Prognostic Analysis of Patients with Pancreatic Head Adenocarcinoma Less Than 2 cm Undergoing Resection. World Journal of Gastroenterology, 15, 4305-4310.
https://doi.org/10.3748/wjg.15.4305
[24] Satake, K., Chung, Y.S., Umeyama, K., et al. (1991) The Possibility of Diagnosing Small Pancreatic Cancer (Less Than 4.0 cm) by Measuring Various Serum Tumor Markers: A Retrospective Study. Cancer, 68, 149-152.
https://doi.org/10.1002/1097-0142(19910701)68:1<149::AID-CNCR2820680127>3.0.CO;2-9
[25] Chen, Y., Gao, S.G., Chen, J.M., et al. (2015) Serum CA242, CA199, CA125, CEA, and TSGF Are Biomarkers for the Efficacy and Prognosis of Cryoablation in Pancreatic Cancer Patients. Cell Biochemistry and Biophysics, 71, 1287-1291.
https://doi.org/10.1007/s12013-014-0345-2