1. 引言
原发性肺癌是目前全球最常见的癌症之一,也是全球因癌症死亡的主要原因。根据GLOBOCAN 2022数据,2022年全球新发肺癌病例达248万例,占癌症总发病12.4%,死亡病例181.7万例[1],肺腺癌(LUAD)是其主要类型,占比约为50% [2]。伴随低剂量计算机断层扫描(CT)筛查的广泛采用,I期LUAD的检出率大幅提高[3]。值得注意的是,与I期肺鳞癌相比,I期肺腺癌术后远期预后较差,术后5年复发率约10~30%,术后2年无病生存率(Disease-Free Survival DFS)约70~80%。肺癌术后复发是影响患者长期生存的核心问题,而单基因预后标志物的研究为精准预测复发风险提供了新方向[4]。
CD3EAP (CD3e Molecule-Associated Protein)作为位于19q13.3染色体易感区域的基因,因其与DNA修复、细胞增殖及免疫调控的密切关联,近年来逐渐成为肺癌预后研究的热点[5]。CD3EAP与ERCC1基因在基因组上存在3'UTR区域的重叠,两者共同参与核苷酸切除修复(NER)通路,对多环芳烃诱导的DNA损伤修复起关键作用[6]。研究表明,CD3EAP敲低会显著抑制ERCC1的表达,进而导致基因组不稳定性和癌变风险升高[7]。此外,CD3EAP作为RNA聚合酶I的亚单位,可能通过调控核糖体生物合成影响肿瘤细胞的增殖能力。有研究显示,CD3EAP所在的19q13.3区域遗传多态性与肺癌易感性显著相关,携带特定基因型的患者肺癌风险增加2.1倍,且修复能力差异与术后复发存在潜在关联[8]。
然而,现有研究多聚焦于CD3EAP在肺癌发生中的作用,对其作为术后复发独立预测因子的探索仍未见报道。因此,深入解析CD3EAP在患者组织中的表达模式,有望为复发风险分层提供新思路。基于此,本研究通过功能机制与临床验证相结合,首次将CD3EAP提升为肺癌术后复发的相关预测因子,同时整合环境暴露、以往的复发相关预测因子,为个体化术后管理提供创新性思路。
2. 资料与方法
2.1. 资料与组织标本收集
选取2022年1月至2022年12月在青岛大学附属医院市南院区胸外科152例接受手术切除治疗,并经病理确诊为LUAD的患者作为研究对象。收集患者肺癌组织,所有患者术前均无其他恶性肿瘤病史,术前未接受输血、放化疗治疗及新辅助治疗,术后未进行靶向治疗。具有完整的临床病理及术后随访资料。本次实验已经我院医学伦理委员会审批,审批号为QYFYW2LL29756,所有患者及其家属知情同意并签署知情同意书。通过电话、门诊或上门访问等方式每3个月对患者进行一次随访,截止时间为2024年12月31日,中位随访时间为30个月。以无复发生存期(Recurrence-Free Survival, RFS)为主要研究终点。RFS定义为肺癌术后至复发时间。
2.2. 检测方法
收集患者的癌组织。对样本进行预处理,解冻后采用AmoyDx试剂盒同步提取DNA/RNA。分别构建DNA片段二代测序文库和链特异性cDNA文库。DNA样本经超声破碎至200~250 bp片段后,使用文库制备试剂盒进行末端修复、A尾添加、接头连接及文库扩增。RNA样本根据Agilent 2100生物分析仪系统测得的DV200值确定95℃热片段化时间,随后使用定向RNA文库制备试剂盒进行逆转录、互补RNA合成及链特异性文库构建。文库混合质检合格后,在Illumina NovaSeq 6000测序仪上进行测序。测序数据进行分析及注释流程处理。
2.3. 从数据库挖掘分析CD3EAP在LUAD中的表达及临床意义
登录Kaplan-Meier Plotter (http://kmplot.com/analysis/index.php)数据库。网站首页点击“Start KM plotter for lung cancer”获得肺癌组织基因表达谱,在Gene symbol处选择CD3EAP,选择进行手术切除的肺腺癌患者,得出相应生存结果并绘制生存曲线。
2.4. 统计学分析
临床病理数据应用SPSS26.O统计软件进行分析,计数资料以n (%)表示,χ2检验分析CD3EAP表达量与临床病理特征的相关性,Kaplan-Meier生存曲线分析预后,Log-rank检验生存曲线的差异,cox比例风险回归分析用于评估预后风险因素。利用多因素分析中的独立风险因素建立Nomogram预后模型预用于预测3年RFS。通过校准曲线在实验队列中进行模型的内部验证。绘制受试者工作特征(ROC)曲线并计算曲线下面积(AUC)评估CD3EAP对肺腺癌患者预后的预测价值。采用Kaplan-Meier Plotter数据库分析LUAD中CD3EAP表达及与预后的关系。以P < 0.05为差异有统计学意义。
3. 结果
3.1. CD3EAP表达量与NSCLC临床病理相关参数的关系
为避免偏态分布和离群值影响,取152例肺腺癌组织中CD3EAP表达量中位数(TPM = 19.87),将CD3EAP表达高于或等于中位数的76例患者纳入高表达组,CD3EAP表达低于中位数的76例患者纳入低表达组,分析并比较两组患者与临床病理特征的关系。结果见表1,CD3EAP基因表达水平与患者的性别(χ2 = 5.630, P = 0.018)和吸烟史(χ2 = 4.738, P = 0.030)存在显著相关性,而与年龄、肿瘤大小、病理分期、术后住院时间、手术方式、手术位置等因素无关(均P > 0.05)。
Table 1. Relationship between CD3EAP expression and clinicopathological characteristics of patients
表1. CD3EAP表达与患者临床病理特征的关系
特征 |
类别 |
分组 |
χ2 |
P |
低表达组(n = 76) |
高表达组(n = 76) |
N(%) |
N (%) |
年龄 |
<60岁 |
36 (47.37) |
38 (50.00) |
|
|
≥60岁 |
40 (52.63) |
38 (50.00) |
0.105 |
0.746 |
性别 |
女 |
56 (73.68) |
42 (55.26) |
|
|
男 |
20 (26.32) |
34 (44.74) |
5.630 |
0.018 |
肿瘤大小 |
<2 cm |
64 (84.21) |
62 (81.58) |
|
|
≥2 cm |
12 (15.79) |
14 (18.42) |
0.186 |
0.667 |
病理分期 |
Ⅰa |
60 (78.95) |
54 (71.05) |
|
|
≥Ⅰb |
16 (21.05) |
22 (28.95) |
1.263 |
0.261 |
吸烟史 |
无 |
61 (80.26) |
49 (64.47) |
|
|
有 |
15 (19.74) |
27 (35.53) |
4.738 |
0.030 |
术后住院时间 |
<5天 |
46 (60.53) |
47 (61.84) |
|
|
≥5天 |
30 (39.47) |
29 (38.16) |
0.028 |
0.868 |
手术位置 |
左 |
30 (39.47) |
35 (46.05) |
|
|
右 |
46 (60.53) |
41 (53.95) |
0.672 |
0.412 |
手术方式 |
肺叶切除 |
29 (38.16) |
28 (36.84) |
|
|
亚肺叶切除 |
47 (61.84) |
48 (63.16) |
0.028 |
0.867 |
饮酒 |
有 |
6 (7.89) |
4 (5.26) |
|
|
无 |
70 (92.11) |
72 (94.74) |
0.428 |
0.513 |
3.2. CD3EAP表达水平与患者预后复发的关系
截至随访结束时间,152例入组患者均获得完整随访资料,中位随访时间为30个月。Kaplan-Meier生存分析显示术后3年无复发生存率CD3EAP高表达组为74.0%,CD3EAP低表达组为89.1%,CD3EAP低表达总体无复发生存率显著高于高表达组,差异有统计学意义(P = 0.007) (见图1)。
Figure 1. RFS of different CD3EAP expression groups
图1. 同CD3EAP表达量分组的RFS
3.3. LUAD术后患者RFS的单因素COX回归分析
分析各临床病理资料和患者RFS的关系,结果显示:肿瘤大小(P = 0.008)、CD3EAP表达量(P = 0.013)、病理分期(P = 0.001)、吸烟史(P = 0.006)这四个因素与NSCLC患者的RFS有关,而性别(P = 0.253)、年龄(P = 0.993)、术后住院时间(P = 0.790)、手术位置(P = 0.361)、手术方式(P = 0.934)、饮酒(P = 0.335)与LUAD患者RFS无关(见表2)。
Table 2. Univariate cox regression analysis of prognosis in patients with lung adenocarcinoma
表2. 肺腺癌患者预后单因素cox回归分析
临床病理特征 |
HR |
HR (95% CI) |
P值 |
年龄(≥60岁) |
0.997 |
0.487~2.039 |
0.993 |
性别(女) |
1.524 |
0.740~3.139 |
0.253 |
肿瘤大小(≥2 cm) |
2.801 |
1.309~5.991 |
0.008 |
CD3EEAP表达量(高) |
2.682 |
1.228~5.859 |
0.013 |
病理分期(Ⅰb及以上) |
3.350 |
1.627~6.897 |
0.001 |
吸烟史(有) |
2.741 |
1.336~5.622 |
0.006 |
术后住院时间(≥5天) |
0.904 |
0.430~1.900 |
0.790 |
手术位置(左肺) |
1.396 |
0.682~2.856 |
0.361 |
手术方式(肺叶切除) |
0.969 |
0.461~2.037 |
0.934 |
饮酒(有) |
1.800 |
0.545~5.941 |
0.335 |
3.4. NSCLC术后患者生存预后多因素分析
将上述单因素分析中得出的风险指标纳入cox回归模型多因素分析。显示病理分期为Ⅰb期及以上(P = 0.036)、有吸烟史(P = 0.028)、CD3EAP高表达(P = 0.042)是影响LUAD术后患者预后不良的独立危险因素(见表3)。
Table 3. Multivariate cox regression analysis of prognosis in patients with lung adenocarcinoma
表3. 肺腺癌患者预后多因素cox回归分析
临床病理特征 |
HR |
HR (95% CI) |
P值 |
肿瘤大小(≥2 cm) |
1.993 |
0.844~4.710 |
0.116 |
吸烟史(有) |
2.266 |
1.091~4.707 |
0.028 |
CD3EAP表达量(高表达) |
2.288 |
1.030~5.086 |
0.042 |
病理分期(Ⅰb及以上) |
2.393 |
1.058~5.413 |
0.036 |
3.5. 建立Nomogram预后模型并进行内部验证
Figure 2. Nomgram of 33-month RFS of patients after LUAD
图2. LUAD术后患者33个月RFS的Nomgram图
Figure 3. Calibration curve in the validation cohort
图3. 验证队列中的校准曲线图
利用COX多因素分析的结果,建立LUAD患者术后预后复发模型,即将患者的CD3EAP表达量、吸烟史、病理分期纳入预后模型。为探讨此预后模型中各风险因素的预后价值,本研究采用Nomogram图对3年RFS进行预测,即建立Nomogram预测模型(见图2)。对建立的Nomogram预测模型进行内部验证。校准曲线用于立Nomogram预测模型的预测一致性(见图3)。该图表明Nomogram预测模型的预测值与实际观测值有很大的一致性。33个月的RFS C-指数为0.80,具备较好的验证准确性。
3.6. 绘制ROC曲线
根据上述模型中的独立风险因素,采用CD3EAP表达量单独预测(model1)以及CD3EAP、吸烟史、病理分期联合预测预(model2)后进行分析。结果显示CD3EAP单独预测的曲线下面积(AUC)为0.639,联合预测的曲线下面积(AUC)为0.773,联合预测模型诊断价值较高(见图4)。
注:Model 1:CD3EAP表达量单独预测;Model 2:联合预测。
Figure 4. ROC chart obtained according to the above model
图4. 根据上述模型得到的ROC图
4. 讨论
肺癌是我国以及全球恶性肿瘤死亡的首要病因,其发生是遗传易感性与环境暴露共同作用的结果[9]。吸烟仍是主要风险因素,与石棉、柴油尾气等职业暴露存在协同致癌效应,显著提升肺癌风险[9]。尽管早期肺腺癌患者可通过手术实现根治性切除,但其术后5年复发率仍高达20%~40% [10]。传统复发预测主要依赖病理分期和吸烟史,但存在显著局限性:例如,I期患者中仍有10.7%出现复发,而吸烟史虽与DNA损伤修复能力下降相关,但其独立预测效能不足[11]。近年来,生物标志物的探索成为研究热点,如EGFR突变状态虽与总生存率(OS)相关,但并非无复发生存期(RFS)的独立预测因子;CAR (C反应蛋白与白蛋白比值)虽被提出作为术后复发的独立风险因素,但其机制尚不明确[10]。因此,开发整合临床病理特征与分子标志物的多因素预测模型,对于精准识别高危复发人群至关重要[12]。
CD3EAP基因位于染色体19q13.3区域,与ERCC1、PPP1R13L等基因形成重叠转录单元,参与DNA损伤修复、RNA聚合酶I转录调控及细胞凋亡通路[5]。在肺癌流行病学研究中,CD3EAP rs967591G > A多态性被证实可降低非吸烟女性NSCLC风险[13]。这也在一定程度上解释了本研究中两组患者在性别方面的显著差异(P < 0.05)。染色体19q13.3区域的RAI基因单体型,以及部分CD3EAP邻近位点,与绝经后乳腺癌风险显著相关,纯合子携带者的风险比达9.5 (95% CI: 2.21~40.79),提示该区域基因可能在激素相关癌症中具有跨癌种作用[14]。之前的研究多基于基因多态性而非表达量,而基因多态性与基因表达的调控关系存在人群异质性[15]。此外,还存在未区分复发与生存的驱动机制、缺乏针对早期肺腺癌术后复发的特异性模型等缺陷[16]。故本研究探讨了CD3EAP表达量对早期肺腺癌患者复发率的影响以及临床意义。
CD3EAP可能通过多机制协同驱动肺腺癌复发:其一,通过激活PI3K/AKT/mTOR通路诱导自噬,维持肿瘤细胞代谢与存活;其二,上调CDK2、Cyclin A2/B1等细胞周期因子,加速S/G2-M期进程,促进增殖。同时,CD3EAP通过ATR-CHEK1信号轴增强DNA损伤修复能力,与ERCC1协同介导顺铂耐药。在免疫微环境中,CD3EAP可能通过消耗IL-2及调控PD-L1表达抑制T细胞抗肿瘤活性,促进免疫逃逸。此外,其遗传变异及表观遗传沉默与预后不良显著相关。
本研究首次将CD3EAP表达量纳入肺腺癌术后复发预测模型,并证实其与病理分期、吸烟史的联合预测价值,发现CD3EAP高表达患者的复发风险显著增加,且ROC曲线下面积(AUC)在联合模型中提升至0.763,既往研究提示,CD3EAP过表达通过激活自噬通路促进肿瘤细胞存活[17],本研究在临床层面进一步证实了该机制,这一发现为精准识别需强化术后监测或辅助治疗的高危患者提供了新工具。本研究采用多维度整合分析,突破了传统单基因研究的局限性。吸烟史与CD3EAP的交互作用提示,环境暴露可能通过表观遗传修饰调控基因表达,这为未来研究基因–环境互作提供了方法论参考[18]。此外,CD3EAP与ERCC1的共表达模式提示,开发基于染色体19q13.3区域的多基因panel可能进一步提升预测效能[19]。该研究仍存在对于CD3EAP表达量分组截取值方面选择的不足,以往的研究中缺乏对于该基因在肺癌预后方面定量化的讨论以及分组的方法,尤其是在临床方面。而中位数的选择能确保两组数量相当并且减少极端值影响,但更为精细的划分方法有待进一步研究。
值得注意的是,CD3EAP与总生存率缺乏关联,提示其可能通过独特机制驱动早期复发[20]。一种可能的解释是:CD3EAP通过调控RNA聚合酶活性,促进核糖体生物合成,加速肿瘤细胞增殖[5]。这些机制与吸烟协同作用,共同构成复发风险升高的生物学基础[21]。
综上所述,CD3EAP在LUAD癌组织中的高表达与男性,有吸烟史显著相关。其在癌组织中的相对高表达水平是术后复发的独立危险因素之一,有望成为LUAD潜在的预后评估分子标志物。
伦理批准和知情同意
本研究涉及的所有试验均已通过青岛大学医学院伦理委员会的审核批准(文件号QYFYW2LL29756)。所有试验过程均遵照《赫尔辛基宣言》的条例进行。受试对象或其亲属已经签署知情同意书。
声 明
赵策、周亮参与了研究设计;赵策、王子成、刘汉群、矫文捷参与了论文的写作和修改。所有作者均阅读并同意发表该论文,且均声明不存在利益冲突。
基金项目
山东省自然科学基金《circSNK1G3及miR-143-3p调控HOXA10信号传导促进肺腺癌的生长和转移的研究》;项目编号:ZR2020MH234。
NOTES
*通讯作者。