1. 前言
肝癌是最常见的恶性肿瘤之一,我国是肝癌高发国家,发病率和死亡率均居世界首位 [1]。肝细胞癌(Hepatocellular carcinoma, HCC)是最常见的肝癌分型,据统计每年死于HCC的患者超80万人。由于HCC起病隐匿,早期症状不明显,大多数患者就诊时已为晚期或伴有转移,使得现有的根治性切除、放化疗技术以及新型的免疫治疗方案效果欠佳,患者预后仍较差 [2]。
细胞死亡通常被视作“主动”而非“被动”的过程,其主动介导的细胞自杀程序和被动死亡方式,统称为程序性死亡(programmed cell death, PCD) [3]。其包括细胞凋亡、自噬、铁死亡、细胞焦亡等多种PCD。以往研究表明PCD具有激活抗肿瘤免疫功能的免疫原性细胞死亡的功能从而抑制肿瘤发生。PCD还被发现能够增强髓系细胞诱导的适应性免疫抑制进而导致肿瘤的生长。在肿瘤进展中发挥了重要作用 [4]。随着对细胞坏死机理的深入研究,发现细胞坏死受到程序性调控,被重新定义为坏死性凋亡(Necroptosis) [4],是近年来新发现的PCD。坏死性凋亡不仅抑制肿瘤细胞的功能和特征,而且能够促进肿瘤早期形成以及生长,为肿瘤治疗的应用提供了参考方向。
lncRNA是一种长度超过200个核苷酸,蛋白质编码能力较弱的RNA [5]。研究表明lncRNA直接参与HCC进展并起到重要调节作用 [6],与肿瘤细胞的生物学行为密切关联 [7] [8]。随着关于坏死性凋亡的研究越来越深入,而与坏死性凋亡相关的lncRNA被陆续发现。然而lncRNA在HCC坏死性凋亡中的研究甚少。
本研究旨在探索三者之间深层关系,研究作为三者联合应用作为预后生物标志物或治疗靶点的潜在价值,通过TCGA数据库获取HCC表达组数据和临床数据,提取其中坏死性凋亡基因的表达量,共表达并构建与坏死性凋亡相关的候选lncRNA的预后模型,深入探讨模型预测价值 [9]。
2. 材料与方法
2.1. 数据的收集和处理
在TGCA数据库中下载Manifest、Cart、Metadata3个数据,解压并进行ID转换,获取行名为基因名,列名为样品名的矩阵(矩阵1);在TGCA数据库中下载Cart1个数据,获取行名是样本的名称,列名是生存时间、年龄、性别、分级、分期、TNM分期等临床数据的矩阵(矩阵2)。运用Strawberry Perl软件将下载的与坏死性凋亡相关数据提取信息,区分mRNA与lncRNA,整理用于后续分析。
2.2. 坏死性凋亡相关基因差异表达分析
运用R语言中Limma包读取mRNA信息文件,获取行名为坏死性凋亡基因的名称,列名为样品的名称的矩阵(矩阵3)。设置过滤条件为相关系数过滤标准 = 0.4和相关性检验p值 = 0.001进行筛选,通过共表达分析获取基因与lncRNA的相关系数的网络关系文件、节点属性文件以及坏死性凋亡相关的lncRNA表达量信息。并进行可视化绘制网络图。
运用R语言中Limma、Pheatmap筛选坏死性凋亡相关的差异基因,绘制热图和火山图对结果可视化。对lncRNA表达数据和生存数据进行合并,进行单因素和多因素的独立预后分析。依据单因素Cox分析方法,设置过滤标准CoxPfilter = 0.05,使用R语言对TCGA数据库中构建与坏死性凋亡相关lncRNA预后模型,并验证模型的准确性。
2.3. 肝细胞癌差异表达坏死性凋亡相关基因的生存分析
将基因数据和临床数据(年龄、性别、分期、分级)一并进行多因素Cox分析。筛选出独立预后坏死性凋亡相关的因素。风险评分等于lncRNA的表达量乘以风险系数,根据风险评分将肝癌患者分为高、低风险组。根据Kaplan-Meier生存分析比较高、低风险组之间生存情况的差异 [10]。使用R语言绘制ROC曲线,曲线下面积与我们构建的模型去预测病人的生存期的准确性成正相关 [11] [12]。使用临床分组验证所构建的模型是否适用于不同临床分组的病人。
2.4. 基因富集分析
使用R语言对HCC和正常组织表达差异的基因进行GO功能富集分析和KEGG通路分析,按矫正后的p值(FDR)进行排序。
3. 结果和分析
3.1. 肝细胞癌的差异表达坏死性凋亡相关基因和lncRNA的鉴定
从TGCA数据库下载374例HCC和50例癌旁组织样本数据,对转录组数据进行提取,获取坏死性凋亡基因的表达量、mRNA和lncRNA数据。通过共表达分析得到坏死性凋亡相关lncRNA数据(图1(A))。热图显示出HCC标本与癌旁标本有明显区别(图1(B))。火山图显示了HCC组织和正常对照组之间差异表达的免疫相关lncRNA的分布(图1(C))。
3.2. 基于坏死性凋亡相关lncRNA建立肝癌的预后风险模型
将差异表达的坏死性凋亡相关基因和年龄、性别、分级、病理分期、T分期等临床数据进行整合并进行多因素分析。根据风险评分将样本区分为高风险组和低风险组(图2(A))。热图显示出与坏死性凋亡相关的lncRNA在肝癌组织样本中的表达水平差异(图2(B))。桑基图提示在HCC标本中坏死性凋亡相关lncRNA的调控表达关系(图2(C))。根据风险评分相关性分析显示风险分值越高则患者的死亡率越高(图2(D))。生存分析显示高风险组总体生存率显著低于低风险组(图2(E)),表明此评分具有重要价值。
(A) 基于预后坏死性凋亡相关基因与坏死性凋亡相关lncRNA共表达构建的主要调控网络。橙色的节点代表着坏死性凋亡相关的基因,蓝色的节点代表着与这些基因共表达的lncRNA,获取的lncRNA作为坏死性凋亡相关的lncRNA。 (B) TCGA肝癌队列中坏死性凋亡相关lncRNA表达水平的热图。(C) 坏死性凋亡相关lncRNA在肝癌中表达情况的火山图。红色的点代表上调,绿色的点代表下调,黑色的点代表没有差异。
Figure 1. Identification of differentially expressed necroptosis-related genes and lncRNAs in hepatocellular carcinoma
图1. 肝细胞癌的差异表达坏死性凋亡相关基因和lncRNA的鉴定
为验证所构建的预后风险模型的预测价值,将提取的lncRNA的数据信息分为train组和teat组,使用train组数据去构建lncRNA预后风险模型,使用test组数据去验证lncRNA预后风险模型的准确性,对此进行验证(图2(F)、图2(G))。更进一步评估风险评分价值,通过AUC显示1年、3年和5年分别为0.763、0.748和0.724 (图2(H)),显著优于性别、年龄、TNM分期等临床因素的预测能力(AUC均小于0.508) (图2(I)),以上提示该风险评分可以较好地预测肝癌患者的不同生存期状况。
3.3. 肝癌坏死性凋亡相关lncRNA预后模型的评估
探究预后模型是否具有预测价值,对肝癌患者进行生存分析。单因素分析结果显示HR和95% CI分别为1.085和1.054~1.118 (p < 0.001) (图3(A))。多因素分析结果显示HR和95% CI分别为1.064和1.031~1.097 (p < 0.001) (图3(B))。表明坏死性凋亡相关lncRNA的风险预后模型是独立于临床风险因素的最显著的预后因素。
为了进一步去验证坏死性凋亡相关lncRNA的临床意义,将TCGA肝癌患者按临床相关特征进行了分组,并根据不同分组比较之间的差异,将患者分别按照性别、年龄和肿瘤分期进行分组。显示在不同分组中均为高风险组患者的总体生存率均显著低于低风险组患者(图3(C)~(E))。以上结果证明此模型为肝癌患者提供了重要的参考意义。
3.4. 基于临床特征参数与预后评分模型建立列线图
根据列线图中的预后因素的单个分值计算总分值,将分值和临床参数进行多因素分析并将结果进行可视化(图4(A))。而校准曲线显示实际与预测的1、3及5年生存率均较一致(图4(B))。以上均提示风险评分的准确性。
3.5. 肝癌中坏死性凋亡相关lncRNA特征的生物学意义
研究与肝癌坏死性凋亡相关lncRNA可能参与的生物学功能,对数据进行GSEA分析。结果表明,低风险组肝癌患者显著富集于嘧啶代谢、多糖降解、溶酶体系统的调控等 [13] [14] [15] (图5(A))。提示低风险组显著富集于与增殖相关的通路。而高风险组显著富集于如色氨酸代谢、视黄醇新陈代谢和脂肪酸代谢过程等代谢相关的通路 [16] [17] [18] (图5(B)),通过绘制的网路图结果与这些结果相一致:与细胞免疫、合成和代谢相关的信号通路发生了异常 [19] [20] [21] (图5(C))。以上结果对不同风险分组的肝癌患者的治疗提供了个体化的参考方向。
(A) 包括坏死性凋亡相关的lncRNA预后相关特征风险评分、年龄、性别、T、N及M分期等临床病理参数内容的肝癌患者1年、3年和5年生存概率预测的列线图。(B) 校正曲线显示了根据偏倚校正后的预后列线图预测的肝癌患者1年、3年和5年生存概率与实际生存率的一致性。
Figure 4. Establish nomograms based on clinical characteristic parameters and prognostic score models
图4. 基于临床特征参数与预后评分模型建立列线图
3.6. 肝癌中坏死性凋亡相关lncRNA与免疫细胞的相关性分析
为进一步验证肝癌中坏死性凋亡相关lncRNA与免疫细胞的相关性,绘制免疫细胞与风险得分的气泡图(图6(A))。基于TCGA肝癌高、低风险组患者样本的基因表达组数据进行ssGSEA差异分析,构建箱线图得到具有高、低风险组差异的免疫细胞(图6(B))和免疫相关功能(图6(C))。通过免疫检查点差异分析,获取具有高、低风险组差异的基因(图6(D))。
(A) 气泡图代表了免疫细胞与风险得分系数的相关性。 (B) 箱线图显示了高风险组患者和低风险组患者中免疫细胞的表达水平,横坐标代表免疫细胞,纵坐标代表免疫细胞的打分。 (C) 箱线图显示了高风险组患者和低风险组患者中免疫相关功能的表达水平,横坐标代表免疫相关功能,纵坐标代表免疫相关功能的打分。(D) 箱线图显示了高风险组患者和低风险组患者中免疫检查点的表达水平,横坐标代表免疫检查点,纵坐标代表免疫检查点的表达水平。
Figure 6. Correlative analysis of necrotic apoptosis-related lncRNA and immune cells in liver cancer
图6. 肝癌中坏死性凋亡相关lncRNA与免疫细胞的相关性分析
4. 结论
HCC是世界上最常见的恶性肿瘤之一,目前在我国仅次于肺癌、结直肠癌和胃癌,是第四位常见肿瘤和第二位的肿瘤的致死病因。HCC起病隐匿,多数患者就诊时已为晚期。以往研究表明,随着新的临床诊疗进展和HCC的早期诊断技术发展,HCC的流行病学在过去发生了显著的变化。血清甲胎蛋白(alpha-fetopretein, AFP)是临床最常用的肿瘤标志物之一 [22],在一定程度上有助于患者早期诊断 [23] [24] [25]。但敏感性较差仅为40%~65%,并且在其他肝疾病中AFP水平也升高,特异性水平不高。因此,对HCC生物标志物的研究和探索基础研究与临床治疗均具有重要意义。
PCD是由多种细胞因子与模式识别受体严格调控的精细过程,它受多种基因和多种信号通路的相互调控。凋亡是典型的PCD,而最新发现一种程序性细胞死亡的方式称为坏死性凋亡,与细胞凋亡存在共同的特征 [26]。现研究表明坏死性凋亡在动脉粥样硬化、炎症反应综合征和急性肾损伤等多种炎症性疾病中扮演重要角色 [27]。而最新发现与细胞凋亡有关的肿瘤可能对坏死性凋亡存在相关性。
癌症发生多由癌基因转录和蛋白质编码而实现。但既往研究表明,编码基因仅占人类基因组的2%,剩余超过90%的基因组为起调节作用的非编码基因。lncRNA的调控机制在癌症发生和发展中广泛存在,影响着与肿瘤相关基因的表达,发挥了重要的生物学功能和作用 [28]。伴随着高通量测序技术的发展,越来越多的lncRNA在癌症发生发展的过程逐渐被探索、发现、验证 [29] [30]。目前,lncRNA在肝癌中作用的研究已成为热点 [31]。
本研究运用生物信息学分析转录组数据,鉴定与坏死性凋亡相关的lncRNA。以往研究报道,lncRNA LUCAT1是一种新型的lncRNA,与吸烟相关非小细胞肺癌的预后不良有关。可作为肝癌患者新型诊断和治疗靶标,通过抑制肝细胞癌中的膜联蛋白A2 (ANXA2)磷酸化来促进肿瘤的发生 [32]。胰腺导管腺癌(PDAC)是胰腺癌中最常见的类型,lncRNA LUCAT1的过表达可能与PDAC的肿瘤大小和淋巴转移有关,体外实验表明lncRNA LUCAT1的下调可以抑制PDAC细胞的增殖、转移和侵袭。并且在卵巢癌中通过miR-199a-5p表达来促进肿瘤细胞的增殖 [33]。lncRNA ZFPM2-AS1的高表达与HCC的不良预后显著相关,此外,ZFPM2-AS1通过miR-18b-5p/VMA21轴在肺腺癌中促进增殖 [34]。而ZFPM2-AS1通过上调TRAF4促进食管鳞状细胞癌中的细胞生长 [35]。MCM3AP-AS1在TCGA的大多数癌症中表达上调。肾癌是世界上最常见的癌症之一,大约90%的病例为肾透明癌(RCC),一种肾小管上皮的恶性肿瘤。RCC的主要亚型为透明细胞肾细胞癌(ccRCC),lncRNA MCM3AP-AS1在ccRCC中表现出异常表达,通过调控DPP4诱导ccRCC肿瘤炎症和血管生成,因此,lncRNA MCM3AP-AS1可能作为新的分子标志物。在其他癌症中,MCM3AP-AS1通过靶向miR-194-5p在HCC中发挥致癌作用,并随后促进FOXA1表达 [36]。MCM3AP-AS1通过下调miRNA-93抑制宫颈鳞状细胞癌中的细胞增殖 [37]。并且,MCM3AP-AS1通过miR-138/FOXC1轴促进胃癌细胞的顺铂耐药性 [38]。同时,MCM3AP-AS1还报道通过miR-28-5p/CENPF轴促进乳腺癌的进展 [39]。虽然其他鉴定与坏死性凋亡相关lncRNA在癌症中的预后未有深入探究,但与肝癌功能和风险预后的相关性表明关于这些候选lncRNA的研究值得开展。
这项研究存在一些局限性,本研究是根据数据库所构建的预后模型,但该模型还需要进行大量的实验研究及临床数据的验证,这些选项需要在未来的研究中加以解决。
综上所述,本研究建立了一个与坏死性凋亡相关lncRNA所构成的肝癌患者的模型,该模型相较于传统指标,对肝癌患者预后有一定预测作用,在生存方面表现出较可信的准确性,在临床方面较好地显示了应用潜力和效益。
NOTES
*通讯作者Email: 17853296227@163.com