1. 引言
肺癌作为全球范围内发病率和死亡率最高的恶性肿瘤之一,其疾病负担与社会影响受到医学界和公共卫生领域的关注。2022年全球癌症统计数据显示,肺癌以新增248万例(占癌症总病例12.4%)重新成为第一大癌症,死亡病例达182万例(占总死亡18.7%) [1]。目前,肺癌仍是我国发病率和死亡率最高的恶性肿瘤,2022年新发病例106.06万,死亡73.33万,占所有恶性肿瘤的22.0%和28.5% [2]。早期肺癌常无明显症状,出现症状时已为晚期,直接导致肺癌患者预后差,晚期肺癌患者5年生存率约在20%左右[3]。
肺癌主要分为小细胞肺癌(Small Cell Lung Carcinoma, SCLC)和非小细胞肺癌(Non-Small Cell Lung Cancer, NSCLC),NSCLC主要包括肺腺癌(Lung Adenocarcinoma, LUAD)、肺鳞状细胞癌(Lung Squamous cell Carcinoma, LUSC)和大细胞癌(Large Cell Carcinoma, LCC)。吸烟仍是肺癌首要危险因素,约85%的肺癌病例与烟草暴露直接相关,且男性发病率显著高于女性(IRR = 2.2~5.6)。此外,职业暴露(如石棉、砷)、空气污染(PM2.5)、遗传易感性(如EGFR、ALK基因变异)及慢性肺部疾病(如COPD)亦为重要诱因。值得注意的是,非吸烟人群肺癌比例上升,提示环境与基因交互作用的复杂性[4]。
近年来,肺癌的治疗从传统化疗逐渐转向精准靶向与免疫治疗。靶向药物针对特定驱动基因突变(如EGFR、ALK、ROS1等)直接抑制肿瘤细胞增殖信号通路。然而,临床上仅有30%~50%患者携带可靶向的驱动基因突变,罕见突变(如HER2、RET等)仍缺乏有效药物[5]。因此,免疫疗法应运而生。研究表明,免疫检查点抑制剂(ICIs)具有可耐受的安全性、免疫记忆导致的持续治疗反应性等优势[6]。但ICIs对实体瘤患者的总体有效率仅为20%~40%,且不同癌种间差异显著,由于其耐药机制复杂,单一标志物不足以全面评估免疫应答,需要多种标志物检测提升预测精度,实现精准免疫治疗的全面落地[7]。
肿瘤突变负荷(Tumor Mutational Burden, TMB)指肿瘤基因组编码区每兆碱基(mut/Mb)的非同义体细胞突变数量,反映肿瘤产生新抗原的潜力。新抗原可被免疫系统识别为“非我”,激活T细胞介导的抗肿瘤免疫反应,从而增强ICIs的疗效[8]。TMB在一定程度上可以反映肿瘤细胞内DNA修复的损伤情况。DNA错配修复系统(Mismatch Repair, MMR)的核心功能是识别并纠正DNA复制过程中产生的碱基错配。MMR突变会导致基因组微卫星区域的重复序列长度异常改变,这种现象称为微卫星不稳定性(Microsatellite Instability, MSI)。在多种肿瘤中,dMMR和MSI-H患者具有较高的TMB [9] [10]。研究表明,TMB可以作为预测ICIs治疗的生物标记物,但其具体机制尚不明确[11]。因此,本研究旨在通过生物信息学分析方法分析不同TMB状态下的基因特异性及表达模式,进一步探索TMB与肺癌之间的关系。
2. 材料与方法
2.1. 数据来源
The cBioPortal for Cancer Genomics (https://www.cbioportal.org/)是一个整合分析了大规模癌症基因组学数据的公共资源数据库。本研究从cBioPortal中获取LUAD和LUSC的表达谱和临床信息,包含495例LUAD样本和474例LUSC样本。从The Cancer Genome Atlas Program (TCGA)数据库(https://www.cancer.gov/ccg/research/genome-sequencing/tcga)下载33种癌症的基因表达谱及临床信息,从CCLE数据库(https://sites.broadinstitute.org/ccle)中下载21种癌症细胞系数据。
2.2. 表达和差异分析
采用Wilcoxon秩和检验比较样本间的表达差异。以TMB中位值分组,将肺癌样本分为高TMB (TMB-H)组和低TMB (TMB-L)组。采用R Studio limma包进行差异分析,以|log2FC| > 0.58469,p < 0.05为筛选阈值来获得TMB-H组和TMB-L组之间的差异表达基因(DEGs)。选择log2FC > 0.58469的DEGs为新的基因集进行后续分析。
2.3. 富集分析
使用R Studio clusterProfiler包对DEGs进行GO功能富集分析和KEGG通路富集分析,其中,GO功能分析包括生物过程(Biological Process, BP)、细胞组成(Cellular Component, CC)和分子功能(Molecular Function, MF)三个方面。以p < 0.05为显著性阈值,将获取的结果以气泡图的形式展示。
2.4. 生存分析
利用R Studio survival包整合生存时间、生存状态和基因表达数据,Cox比例风险回归法评估每个基因的预后显著性,R Studio forest包用于绘制森林图,Log-Rank检验用于评估不同组样本之间的预后差异显著性,Kaplan-Meier生存曲线用于展示两组样本之间的生存差异。p < 0.05为具有差异显著性。
2.5. TMB与MSI、免疫的相关性
选择R Studio IOBR包中的CIBERSORT法,基于基因表达谱分析每个样本的6种免疫浸润细胞评分。使用Spearman等级相关性分析法分析各样本中MYEOV与TMB、MSI及免疫检查点的关系。
2.6. 基因突变分析
通过整合肿瘤样本的突变数据,使用棒棒糖图可视化MYEOV在不同肿瘤中的体细胞突变率。利用R包计算MYEOV在变异组和非变异组中的表达差异,应用非配对的Wilcoxon检验进行差异显著性分析。此外,利用Spearman等级相关性分析法分析各样本中MYEOV与DNA修复基因(MMRs,包括MLH1、MSH2、MSH6、PMS2、EPCAM)的相关性。
2.7. 测序数据分析
收集8例肺癌患者,其中女性患者3例,男性患者5例,所有的患者信息均来自康复大学青岛中心医院。取患者的肺叶组织,基于全外显子测序(Whole Exome Sequencing, WES)技术检测与肿瘤发生发展相关的基因突变数据,包括体细胞变异、TMB及MSI。随后,剔除1个不合格样本后,进行转录组测序分析,得到一个包含7对样本的基因表达谱。采用t检验比较肺癌组织和癌旁组织中的MYEOV表达差异,p < 0.05为具有统计学意义。
3. 结果
3.1. 预后基因选取
A:各临床性状的桑基图;B:TMB评分在LUAD和LUSC中的水平,*p < 0.05;C:TMB-L和TMB-H组的生存差异;D:全基因生存分析的分组比例图,每个模块中包含不同的基因,A代表p > 0.05且HR < 1,B代表p > 0.05且HR > 1,C代表p < 0.05且HR < 1,D代表p < 0.05且HR > 1;E:TMB-H组和TMB-L组的DEGs分析结果;F:上调DEGs与预后基因的交集。
Figure 1. The screening of differentially expressed genes with prognostic significance based on TMB grouping
图1. 依据TMB分组筛选有预后意义的差异表达基因
桑基图展示了LUAD和LUSC中不同临床性状之间的样本流向(图1A)。箱线图显示,在LUSC中TMB评分具有更高的显著性(图1B)。Kaplan-Meier生存曲线显示,尽管无显著差异,但TMB-H组却与更好的预后相关(图1C)。通过生存分析筛选出2144个与肺癌预后显著相关的基因(p < 0.05),从中挑选出1170个危险基因(HR > 1)成为一个新的基因集(图1D)。将肺癌样本分为TMB-H组和TMB-L组进行DEGs分析,得到751个上调基因,和247个下调基因(图1E)。将TMB-H组上调的751个DEGs与1170个预后危险基因取交集,得到24个关键基因(图1F)。
3.2. DEGs的功能与途径分析
A具有统计学意义的KEGG富集通路;前10条显著的B BP、C CC、D MF分析条目。红色表示显著性更大,p < 0.05为具有显著性。
Figure 2. KEGG pathway and GO functional enrichment analysis of DEGs
图2. DEGs的KEGG途径和GO功能富集分析
富集分析显示,DEGs显著富集于Olfactory Transduction (嗅觉传导)、Fat Digestion and Absorption (脂肪消化和吸收)、Linoleic Acid Metabolism (亚油酸代谢)等KEGG信号通路(图2A);GO分析中的BP主要包括Sensory Perception of Chemical Stimulus (对化学刺激的感官知觉)、Male Gamete Generation (雄性配子的产生)、Detection of Chemical Stimulus Involved in Sensory Perception (检测涉及感官知觉的化学刺激)等(图2B),CC主要包括Nucleosome (核小体)、DNA Packaging Complex (DNA包装复合物)、Axoneme Part (轴突部分)等(图2C),MF主要包括G Protein-Coupled Receptor Activity (G蛋白偶联受体活性)、Transmembrane Signaling Receptor Activity (跨膜信号受体活性)、Signaling Receptor Activity (信号受体活性等分子功能)等(图2D)。
3.3. 关键基因选取
A:24个基因的单因素COX分析;B:24个基因的多因素COX分析;C:MSRB3-AS1的Kaplan-Meier生存曲线;D:MYEOV的Kaplan-Meier生存曲线;E:MYEOV在LUAD与正常样本及LUSC与正常样本之间的表达水平;F:TMB-H组及TMB-L组中MYEOV的表达情况。
Figure 3. COX regression model and survival analysis
图3. COX回归分析及生存分析
单因素Cox分析发现,24个基因均与肺癌预后相关(p < 0.05) (图3A),而多因素Cox分析显示MSRB3-AS1和MYEOV是肺癌的独立预后基因(p < 0.05) (图3B)。Kaplan-Meier生存分析发现,MSRB3-AS1和MYEOV均与肺癌预后显著相关,不同的是,MSRB3-AS1是肺癌的保护基因,而MYEOV是肺癌的危险因素(图3C、图3D)。因此本研究选择MYEOV进行后续分析。结果表明,MYEOV在LUAD和LUSC样本中高表达,在正常组织中低表达(图3E)。将肺癌样本分为TMB-H、TMB-L两组,发现MYEOV在TMB-H组中具有更高水平的表达(图3F)。
3.4. MYEOV在不同肿瘤中的表达和预后
如图所示,与正常组织相比,MYEOV在大部分肿瘤组织中呈高表达状态,包括LUSC和LUAD (图4A)。图4B中展示了MYEOV在各肿瘤细胞系中的表达水平。对比预后结果可知,对总生存期(OS)而言,MYEOV在LUSC和LUAD中均具有显著性,而对于无进展生存期(PFS)来说,MYEOV只与LUSC显著相关(图4C、图4D)。
A:MYEOV在TCGA数据集的不同肿瘤样本和正常样本间的表达;B:MYEOV在CCLE数据集的各肿瘤中的表达;C:MYEOV在TCGA各肿瘤中的总生存期(OS)情况;D:MYEOV在TCGA各肿瘤中的无进展生存期(PFS)情况。*p < 0.05,**p < 0.01,***p < 0.001,****p < 0.0001。
Figure 4. Expression and prognosis analysis of MYEOV in different tumors
图4. MYEOV在不同肿瘤中的表达及预后分析
3.5. MYEOV与免疫检查点、TMB、MSI的相关性
A:6种免疫细胞在TMB高低组中的评分比较;B:免疫检查点在各肿瘤样本中与MYEOV表达的相关性热图;C:各肿瘤样本中MYEOV表达与TMB评分的相关性;D:肺癌样本中MYEOV表达与TMB水平的相关性;E:各肿瘤样本中MYEOV表达与MSI评分的相关性;F:TMB-H组及TMB-L组中MSI评分的比较。*p < 0.05,***p < 0.001。
Figure 5. The immune scores and MSI scores of the TMB-H group and the TMB-L group
图5. TMB-H组及TMB-L组的免疫评分和MSI评分
B细胞、CD4+ T细胞及骨髓树突状细胞的评分在TMB-H组及TMB-L组中均存在显著差异(图5A)。在LUSC和LUAD中,可以明显地看到MYEOV的表达与TNFSF15、TNFSF9、KIR3DL1、CD80、CD28等免疫检查点显著相关,这些基因主要与T细胞、NK细胞等免疫细胞活动相关(图5B)。图5C和图5E展示了各肿瘤中MYEOV表达与TMB和MSI的相关性。在肺癌组织中,MYEOV表达与TMB水平呈显著正相关(图5D)。在TMB-H组及TMB-L组中,MSI评分具有显著性差异(图5F)。
3.6. MYEOV突变比较
图6A显示MYEOV在LUAD和LUSC中的突变率分别为1.0%和0.8%。整合各肿瘤的拷贝数变异(CNV)数据,分析得知LUSC和LUAD中的CNV具有显著差异(图6B)。突变景观图展示了每个样本的生存、TMB等情况,从图中可知8%的肺癌患者存在MYEOV突变,且多数是LUSC患者(图6C)。通过评估各肿瘤中MYROV表达与MMRs之间的关系发现,在LUSC中MSH6与MYEOV呈显著负相关(图6D)。
A:各肿瘤中MYEOV的突变情况(仅展示突变率大于0.5%的肿瘤类型);B:各肿瘤样本中SNV分型的比较;C:MYEOV在肺癌中的突变景观;D:各肿瘤中MYEOV表达与MMRs的关系。*p < 0.05,**p < 0.01,***p < 0.001。
Figure 6. The tumor mutation of MYEOV
图6. MYEOV的肿瘤突变情况
3.7. 测序数据验证MYEOV的表达
WES数据显示,在本研究所收集的患者中绝大部分患者的TMB水平较低,只有一个患者的TMB水平较高,达到了16.32 Muts/Mb,并且该患者的体细胞变异数最高,为20 (图7A)。RNA-seq数据分析显示,与癌旁组织相比,MYEOV在肺癌组织中显著高表达(图7B)。
A:WES数据展示不同肺癌患者的TMB水平及体细胞变异情况;B:使用RNA-seq数据验证MYEOV在肺癌组织与癌旁组织中的表达。
Figure 7. Sequencing data verified the TMB level and expression level of MYEOV
图7. 测序数据验证MYEOV的TMB水平及表达水平
4. 讨论
早期NSCLC的治疗通常可以使患者获得良好的预后,然而多数患者确诊即晚期,导致生存率降低。低剂量CT(LDCT)是目前全球公认的肺癌筛查核心手段,由于其高分辨率成像的优势,LDCT可检测直径< 5 mm的肺结节,尤其适用于早期肺癌的发现,可显著降低高危人群的肺癌死亡率(20%~24%)和全因死亡率(6.7%~32%)。LDCT的局限性包括假阳性率高和辐射暴露风险等,对于优化临床效果和成本效益的关键方面仍存在不确定性[12]。血液生物标志物检测在完善肺癌筛查的选择标准、帮助管理不确定的肺结节、支持个体化筛查时间间隔以及帮助预测对辅助治疗的反应方面等发挥作用,尤其有助于提高不吸烟人群的肺癌检出率[13]。由非同义突变产生的肿瘤新抗原存在于肿瘤的整个恶性进程中,其不适当的表达可引起自身免疫调节的改变,这些由免疫系统失调产生的自身抗体被发现具备生物标志物的潜能[14] [15]。根据《肿瘤突变负荷检测及临床应用中国专家共识(2020)》推荐,在晚期NSCLC免疫单药治疗前应检测TMB,并联合其他标志物(如PD-L1)综合解读[10]。TMB通过量化肿瘤突变负荷反映新抗原潜力,是预测ICIs疗效的重要生物标志物,但其应用需结合癌种特异性阈值、检测标准化及多维度生物标志物分析。
2020年,美国食品药品监督管理局(Food and Drug Administration, FDA)基于KEYNOTE-158临床试验结果批准了帕博利珠单抗(Pembrolizumab)用于TMB-H的实体瘤患者。一项关于NSCLC患者的多中心队列研究结果表明,TMB水平的升高与PD-1/PD-L1抑制剂的疗效增强显著相关,且与CD8+ T细胞浸润、PD-L1表达水平升高及免疫微环境的激活有关,联合PD-L1表达分层后,TMB-H且PD-L1高表达患者的总体缓解率(Overall Response Rate, ORR)可达57% [16]。在关于膀胱癌的多组学分析中,结果显示高TMB患者的OS和无病生存期(DFS)显著优于低TMB组,且免疫细胞浸润(如活化的CD4+ T细胞)与TMB水平呈正相关[17]。本研究结果显示,TMB评分高低与肺癌患者的预后虽无显著意义,但高TMB指向更长的生存期。此外,MSI-H和TMB-H具有一定的相关性,约83%的MSI-H患者同时为TMB-H [18]。MSI-H状态的实体瘤具有较高的肿瘤免疫原性,对ICIs敏感,这促使帕博利珠单抗能够被批准用于MSI-H或dMMR状态的晚期实体瘤患者的治疗,然而其在肺癌中的作用还需进一步研究验证[19]。本研究结果表明,此结论同样适用于肺癌。
WES是TMB检测的金标准[20],为降低测序成本和分析难度,经过验证的靶向二代测序(Next-Generation Sequencing Panel, NGS Panel)可作为临床检测TMB的替代方式[21]。本研究基于WES数据开展研究,依据TMB将样本分为TMB-H、TMB-L两组,分析得到关键基因MYEOV。MYEOV基因(Myeloma Overexpressed Gene,骨髓瘤过表达基因)位于人类染色体11q13区域,是一种与多种肿瘤发生发展密切相关的癌基因。该基因编码的蛋白功能尚不完全明确,但在多种恶性肿瘤中呈现高表达,且与患者预后不良显著相关[22]。MYEOV是胰腺癌患者疾病特异性生存的独立预后因素,通过激活叶酸代谢途径(如上调MTHFD2等基因)促进核酸和氨基酸合成,同时增强c-Myc和mTORC1信号通路活性,驱动肿瘤细胞的代谢适应性和增殖[22];除此之外,MYEOV还可以与ARHGAP1相互作用来促进胰腺癌的发生发展,共同调控细胞骨架重塑和侵袭能力[23]。
本研究结果发现,MYEOV在肺癌组织中高表达,与肺癌的不良预后密切相关,并且其表达水平与肺癌TMB呈正相关。进一步分析MYEOV与免疫检查点的关系,发现MYEOV与TNFSF15、TNFSF9、KIR3DL1、CD80、CD28等免疫检查点显著相关,这些免疫检查点主要涉及T细胞、NK细胞等免疫细胞活动。这一结果与Rui Zhang等人的研究结果相符,他们分析发现,MYEOV表达与肿瘤纯度浸润水平呈负相关,与LUSC中CD8+ T细胞、CD4+ T细胞、树突状细胞和中性粒细胞呈正相关[24]。在胰腺癌中,MYEOV敲低后显著抑制TNF信号通路中趋化因子CXCL1、CXCL2和CXCL3的表达,可能减少肿瘤相关中性粒细胞的募集,间接影响抗肿瘤免疫应答[25]。除此之外,MYEOV还可以通过下调E-cadherin、上调N-cadherin和Vimentin促进胰腺癌细胞上皮间充质转化(EMT),这一作用与TGF-β/Smad信号通路的激活密切相关[23]。TGF-β信号增强通常与免疫抑制性微环境相关,进而降低ICIs的敏感性[26],提示MYEOV或可作为ICIs疗效的负向预测标志物。本研究初步揭示了MYEOV与免疫检查点的相关性,但目前关于MYEOV的研究多集中于其促癌功能(如增殖、转移等),其免疫调控机制多基于信号通路关联性推测,具体调控通路仍需通过动物模型及单细胞测序进一步验证;此外,不同数据库研究的人群特征、测序深度及随访时间差异可能引入偏倚,还需在大样本前瞻性队列中进一步验证,这将是未来工作的重点。
综上所述,本研究发现MYEOV在肺癌组织中高表达,表达水平与TMB呈正相关,并与多种免疫检查点显著相关,提示肺癌的不良预后。MYEOV联合TMB检测或可优化肿瘤免疫治疗疗效的预测模型,为临床提供更精准的生物标志物组合。
NOTES
*通讯作者。