1. 背景
肝细胞癌(HCC)目前是全球死亡率第三高的癌症。在2020年,全球有82万人死于肝癌 [1] 。HCC通常在慢性肝病的背景下发生,是一种高度异质性的肿瘤,预后较差,主要的临床治疗方法是手术切除 [2] ,但大多数患者确诊时已是晚期,错过了最佳手术时机,而且患者术后容易复发 [3] [4] [5] 。此外,目前仍缺乏足够的生物标志物来判断患者的预后,这使得临床医生很难对肝细胞癌患者采取有效的治疗方案 [6] 。因此,积极探索HCC的生物标志物对准确诊断、个体化治疗和预测患者预后非常重要。
许多癌症治疗方法可通过调节细胞凋亡杀死癌细胞,然而,许多癌细胞能够逃避治疗诱导的细胞凋亡 [7] ,最终导致耐药和疾病复发 [8] 。调节性细胞死亡(RCD)不仅在维持细胞平衡方面起着关键作用,而且在包括HCC在内的许多癌细胞的增殖和转移方面也起着关键作用 [9] 。最近的研究发现了一种新的细胞死亡形式——“二硫凋亡”,它与二硫化物应激有关,且与ATP水平无关 [10] ,可以成为一种新的治疗靶点,值得进一步研究,为肿瘤治疗提供新思路。
长非编码RNA (lncRNA)是一种长度超过200个核苷酸的RNA,缺乏编码蛋白质的能力 [11] 。虽然lncRNA不参与蛋白质翻译,但大量研究表明,许多lncRNA在肿瘤细胞活动中发挥着关键作用 [12] [13] 。lncRNA影响细胞生长、侵袭和转移以及肿瘤血管生成,还能在表观遗传、转录和转录后水平调控基因表达,从而影响疾病进展 [14] [15] 。lncRNA可作为肿瘤标志物用于早期筛查、诊断、预后预测和药物反应 [16] [17] [18] 。然而,目前探讨HCC患者二硫化相关lncRNAs (DRLs)预后预测的研究还相对较少。
因此,本研究构建了一个DRLs风险模型,根据风险评分对HCC患者进行分层,该模型有望指导预后预测和临床用药。我们按照TRIPOD报告清单提交本文。
2. 材料和方法
2.1. 数据收集
下载癌症基因组图谱(TCGA)数据库(https://portal.gdc.cancer.gov/)中的HCC基因表达数据和相应的患者临床信息,包括50份正常样本和370份肿瘤样本。研究中使用的14个二硫化相关基因来自甘波谊的研究结果 [10] 。
2.2. 二硫化相关lncRNAs (DRLs)的鉴定
然后,提取二硫化相关基因的表达量,利用共表达分析(Pearson|coefficient correlation| > 0.40 and p < 0.001)获得其与DRLs的表达量,并构建lncRNA-mRNA共表达网络,然后对所获得的DRLs进行HCC样本与正常样本的差异分析。
2.3. 建立预后风险评估模型
所有患者数据按7:3的比例随机分为训练集和测试集。在训练集中,对差异表达的DRLs进行单变量Cox分析,以获得与总生存率相关的lncRNAs;对显著表达的候选lncRNAs进行LASSO回归分析,以排除过拟合基因,从而找到关键lncRNAs,并进行多变量Cox回归分析,构建风险评分公式:风险评分 = (ex lncRNA1 × CClncRNA1) + (ex lncRNA2 × CClncRNA2) + ... + (exp lncRNA4 × CClncRNA4)。根据风险评分公式计算训练组每个样本的风险评分,并根据训练组风险评分的中位数将训练集和测试集患者分为高风险组和低风险组。
2.4. 预后风险评估模型的验证
使用“survival”和“survminer”软件包,通过Kaplan-Meier分析验证了我们的DRLs差异表达风险模型,根据每组的事件数得出生存曲线,然后根据肿瘤分期将HCC患者分为早期组(I期和II期)和晚期组(III期和IV期),再分别绘制高危/低危组的生存曲线。为了验证所构建的DRLs风险模型是否适用于不同临床分期的HCC患者。接下来,我们采用单变量Cox和多变量Cox回归分析来评估风险评分和临床特征,以确定风险评分作为OS的独立预测因子。结合年龄、性别、病理分期和风险评分等变量,构建了预测HCC患者1年、3年和5年生存率的提名图。
2.5. GSEA富集和免疫细胞相关性分析
我们利用MSigDB富集数据集(c2.cp.kegg.v7.4.symbols.gmt)研究了不同风险队列之间基因表达的变化。我们使用了七种方法计算样本中的免疫浸润统计量,包括XCELL、TIMER、QUANTISEQ、MCPcounter、EPIC和CIBERSORT。
2.6. 肿瘤微环境、免疫检查点和免疫细胞浸润评估
使用“estimate”软件包的估算算法对肿瘤微环境(TME)成分的比例进行评估,得出三个分数:免疫得分(Immune Score)、基质得分(Stromal Score)和估计得分(Estimate Score)。接下来,我们使用R软件包“ggpubr”确定了潜在的免疫检查点基因,并研究了功能通路以及免疫细胞和免疫检查点与风险评分的关联。
2.7. 化疗和靶向药物反应预测
使用“ggpubr”和“pRRophetic”软件包获取不同药物在高风险组和低风险组中的IC50,筛选潜在的治疗药物,并探索高风险组和低风险组的药物敏感性。
2.8. 共识聚类
使用“ConsensusClusterPlus”软件包对370例HCC病例进行无监督聚类分析,根据四种差异表达的DRL进行分类,然后通过Kaplan-Meier (K-M)生存曲线评估HCC亚型与OS之间的关系。接着,利用“limma”R软件包和“Rtsne”R软件包构建PCA,结果显示不同风险组别和不同亚型的分布非常明显。
2.9. 肿瘤微环境评估、免疫检查点、免疫状态分析和药物反应的不同群组分析
利用“estimation”软件包中的估算算法获得了不同HCC亚型的免疫分数(Immune Score)、基质分数(Stromal Score)和ESTIMATES分数(Estimate Score)。接着,确定了不同HCC亚型中潜在免疫检查点的表达情况。“Pheatmap”R软件包用于绘制不同HCC亚型与免疫细胞之间的关系图。“ggpubr”和“pRRophetic”软件包用于获取不同药物在不同群组中的IC50,筛选潜在的治疗药物,并探索不同亚群对药物的敏感性。
2.10. 统计分析
本研究使用R studio进行统计分析,P值小于0.05即为差异有统计学意义。
3. 研究结果
3.1. 差异表达的DRLs
我们从TCGA数据库中获取了370个HCC肿瘤样本的表达数据,并通过对HCC患者的二硫化相关基因与lncRNA表达数据进行共表达分析(图1A),得到了948个DRLs,其中745个被区分为差异表达的DRLs (图1B,图1C),32个在肿瘤样本中表达上调,713个表达下调。


A B C
Figure 1. Identification of differentially expressed DRLs. A: Co-expression network of lncRNA and DRG. B: Heatmap of differential expression of DRL between tumor and normal tissues. C: Volcano map of differential expression of DRLs between tumor and normal tissues
图1. 差异表达的DRLs的鉴定。A:lncRNA和DRG的共表达网络。B:肿瘤和正常组织间DRL差异表达的热图。C:肿瘤与正常组织间DRLs差异表达的火山图
3.2. 预后模型的构建与验证
将370例患者按7:3随机分为训练集和测试集,训练集259例,测试集111例,比较两组患者的临床病理特征(表1)。通过对训练组差异表达的DRLs进行单变量COX分析(图2A),得到了251个与预后相关的差异表达DRLs,并在此基础上绘制了热图和冲击图(图2D,图2E)。然后对这些与预后相关的差异表达DRLs进一步进行套索回归分析(图2B,图2C)。我们得到了8个差异表达的DRLs,并对这些DRLs进行了多因素Cox回归分析,最终筛选出了4个与HCC患者生存显著相关的差异表达DRLs,并构建了一个由4个差异表达DRLs组成的预后模型:风险评分 = GIHCG*0.459 + MKLN1 − AS*0.474 + AL031985.3*0.350 + AL442125.2*0.434。图3G~I显示了每位患者的风险评分、生存率和特征lncRNAs的表达情况。这些数据表明,低风险评分的患者比高风险评分的患者有更好的临床预后,而且用于构建

Table 1. Comparison of clinicopathological features between training group and validation group
表1. 训练集与测试集临床病理特征的比较


A B


C D


E F



G
模型的特征lncRNAs在高风险评分的患者中高表达。根据KM曲线(图3A~C)可以看出,低风险评分的患者比高风险评分的患者存活时间更长。为了进一步探讨风险评分与HCC患者临床分期的相关性(图3E,图3F),我们评估了风险评分与临床特征之间的关系。结果显示,在根据风险评分分组的HCC患者人群中,无论是在HCC早期还是晚期,低风险评分患者的总生存时间都明显长于高风险评分患者,这表明该模型具有较高的预测准确性,可用于比较不同分期患者的生存预测。
单变量COX分析(图4A)结果显示,风险评分(HR = 1.303 (1.184~1.434), p < 0.001)和分期(1.680 (1.369~2.062), p < 0.001)均与患者预后相关。在多因素COX分析中(图4B),风险评分(1.265 (1.138~1.407), p < 0.001)和分期(1.637 (1.324~2.024), p < 0.001)可独立预测HCC患者的OS。根据ROC曲线(图4C,图4F),风险评分比其他临床指标更具预测性。
以患者性别、年龄、风险评分和临床分期为变量,构建了HCC患者1年、3年和5年的预测生存率提名图(图4G)。C指数曲线(图4H)结果显示,预测的1年、3年和5年生存概率分别与实际生存概率相吻合,这表明肝细胞癌患者的生存率与提名图预测值之间存在良好的一致性。
3.3. GSEA富集分析
GSEA分析结果显示(图5A),碱基切除修复、细胞周期、嘧啶代谢、RNA降解、剪接体等通路在高危组中被选择性富集,这些通路大多被认为与肿瘤进展密切相关,反映了分组的可靠性。低风险组中有脂肪酸代谢、甘氨酸、丝氨酸和苏氨酸代谢、亚油酸代谢、色氨酸代谢和缬氨酸代谢,这些结果表明高风险组富集了各种与肿瘤发生有关的特征,而低风险组中出现显著富集的通路大多与代谢有关。
3.4. 免疫特征与风险模型的关系
肿瘤微环境得分由“ESTIMATE”确定,结果显示两组的Estimate Score和Immune Score没有差异,而Stromal Score有显著差异(图5E~G)。低风险人群的TIDE分数也较高,这表明低风险患者可能更容易发生免疫逃逸。然而,利用ssGSEA算法分析免疫细胞与风险评分的相关性,气泡图结果显示大多数免疫细胞与风险评分呈正相关(图5B),尤其是T细胞CD4+ Th2、XCELL的普通淋巴祖细胞、EPIC的未定性细胞、中性粒细胞、髓系树突状细胞、单核细胞、MCPCOUNTER的单核细胞、CIBERSORT-ABS的巨噬细胞M0。此外,与高危组相比(图5C),低危组的中性粒细胞、髓样树突状细胞、MCPCOUNTER 的巨噬细胞、CIBERSORT-ABS的巨噬细胞M0、中性粒细胞、NK细胞更多,而高危组的巨噬细胞、iDCs水平更高。有报道称,阻断免疫检查点(图5H)是一种很有前景的HCC治疗方法,因此我们分析了高危组和低危组之间免疫检查点表达的差异。结果显示,MYH10、CD2AP、PDLIM1、FLNB、DSTN、MYL6、INF2、ACTB、IQGAP1、MYH9、FLNA、TLN1、CAPZB、ACTN4 在高危组和低危组之间存在差异。
3.5. 药物敏感性分析
我们尝试观察高危组和低危组对不同药物的敏感性,IC50值越低,对药物的敏感性越高,结果显示(图5I~M),低危患者对吉非替尼敏感,高危患者对博来霉素、吉西他滨、顺铂和依托泊苷敏感。这些都是一线抗肿瘤治疗药物,但这些药物很少用于治疗HCC,它们在未来可能大有可为。
3.6. 不同HCC亚型的免疫学特征和药物反应
根据用于构建风险模型的四个差异表达的DRL,我们将HCC患者分为两个亚型(图6A)。t-SNE结果(图6E~H)显示,两个群组和两个风险组的分布很清晰,簇2基本上都属于高风险组,而簇1则主要分布在低风险组(图6C)。在免疫细胞热图(图6D)中,群2在不同平台上的免疫细胞浸润程度最高,两个群之间的Estimate Score和Immune Score没有差异(图6I~K),而Stromal Score则有显著差异。此外,包括MYH10、CD2AP、PDLIM1、FLNB、DSTN、MYL6、INF2、ACTB、IQGAP1、MYH9、FLNA、TLN1、CAPZB、ACTN4在内的大多数免疫检查点(图6L)在集群2中比在集群1中更活跃,这表明集群2可能具有良好的免疫治疗效果。另外,通过比较药物敏感性(图7M~Q),我们发现簇2中的药物多为化疗药物,而簇1中的药物多为靶向药物,这表明簇2对化疗更敏感,而簇1可能对靶向治疗更敏感,实际上表明两组对药物治疗的效果是有选择性的,这有助于我们探索更精准的靶向治疗。


A B


C D

E F
G H
Figure 4. Nomogram for predicting OS. A: Univariate COX analysis of clinical characteristics. B: Multivariate COX analysis of clinical characteristics. C: ROC curves for the training group. D: ROC curves for the test group. E: ROC curves for the whole cohort. F: ROC curves for risk scores and clinical characteristics. G: Nomogram for predicting OS in HCC patients. H: C-index curves for predicting 1-year, 3-year, and 5-year survival rates
图4. 预测OS的诺莫图。A:临床特征的单变量COX分析。B:临床特征的多变量COX分析。C:训练集的ROC曲线。D:测试集的ROC曲线。E:整个队列的ROC曲线。F:风险评分和临床特征的ROC曲线。G:预测HCC患者OS的提名图。H:预测1年、3年和5年生存率的C指数曲线


A B

C D
E F
Figure 5. Nomogram for predicting PFS. A: Univariate COX analysis of clinical characteristics. B: Multivariate COX analysis of clinical characteristics. C: ROC curves for predicting 1-year, 3-year, and 5-year PFS rates. D: ROC curves for risk scores and clinical characteristics. E: Nomogram for predicting PFS in patients with HCC. F: C-index curves for predicting 1-year, 3-year, and 5-year PFS
图5. 预测PFS的诺莫图。A:临床特征的单变量COX分析。B:临床特征的多变量COX分析。C:预测1年、3年和5年无进展生存率(PFS)的ROC曲线。D:风险评分和临床特征的ROC曲线。E:预测肝细胞癌患者PFS的示意图。F:预测1年、3年和5年PFS的C指数曲线

A B

C D

E F G

H I

J K
L M
Figure 6. The relationship between risk scores and immune traits. A: Multiple GSEA analysis of high and low risk patients. B: Immune cell correlation analysis bubble plots. C-D: Immune cell box plot and immune correlation pathway analysis of high and low risk groups. E-G: Differences in immune microenvironment scores of two risk groups. H: Immune checkpoints of two risk groups. I-M: Drug sensitivity analysis of two risk groups
图6. 风险评分与免疫特征之间的关系。A:高风险和低风险患者的多重GSEA分析。B:免疫细胞相关性分析气泡图。C-D:高风险组和低风险组的免疫细胞方框图和免疫相关性通路分析。E-G:两个风险组的免疫微环境评分差异。H:两个风险组的免疫检查点。I-M:两个风险组的药物敏感性分析


A B


C D


E F


G H

I J K

L M

N O
P Q
Figure 7. Relationship between different HCC subtypes and immune traits. A: HCC was divided into 2 subtypes. B: KM curves of different subtypes. C: The ggalluvial of the interrelationship between two subtypes and high and low risk. D: Heatmap of subtype immune cell correlation analysis. E-H: The t-SNE and PCA analysis of different subtypes. I-K: The differences in immune micro environment scores of different subtypes. L: The differences in immune checkpoint expression between subtypes. M-Q: Drug sensitivity analysis of different subtypes
图7. 不同肝细胞癌亚型与免疫特征之间的关系。A:肝细胞癌被分为2个亚型。B:不同亚型的KM曲线。C:两个亚型与高风险和低风险之间相互关系的冲击图。D:亚型免疫细胞相关性分析热图。E-H:不同亚型的t-SNE和PCA分析。I-K:不同亚型的免疫微环境评分差异L亚型间免疫检查点表达的差异。M-Q:不同亚型的药物敏感性分析
4. 讨论
肝细胞癌是一种发病率很高的恶性肿瘤,大部分患者的预后都很差。因此,探索有价值的生物标志物对于评估肝细胞癌患者的预后和针对性治疗非常重要。RCD不仅在维持细胞平衡方面起着关键作用,而且对包括肝细胞癌 [19] 在内的许多癌症的细胞增殖和转移也至关重要。近年来,抗癌药物的研发越来越关注RCD通路,通过诱导或抑制RCD通路来达到治疗癌症的效果 [9] 。二硫化硫作为新发现的RCD通路,不同于以往的铁肽化和杯肽化,有望为预测肿瘤患者的预后和个体化治疗提供新的靶点,但目前还缺乏足够的生物标志物来预测患者的预后。越来越多的证据表明,异常表达的lncRNA可作为预测患者预后的新生物标志物。因此,我们构建了一个基于DRLs预测HCC患者预后的预测模型,以研究肿瘤微环境、免疫细胞浸润、免疫检查点和DRLs之间的关系,并基于一致性聚类分析构建了HCC分子亚型。
ROC、Kaplan-Meie曲线、柱状线图和热图分析结果表明,特征的风险评分是肝细胞癌患者的独立预测因子,也是不同临床分期患者的独立预测因子,可以可靠地预测肝细胞癌患者的预后。此前有学者构建了一个基于杯突相关lncRNA的风险模型,1年后的AUC值为0.716 [20] 。张进等构建了基于铁突变相关lncRNA的风险模型,1年后的AUC值为0.711,与之前报道的HCC lncRNA预测模型相比,我们的ROC曲线1年后的AUC值可以达到0.775,表明DRLs的预后特征准确可靠 [21] 。此外,通过绘制风险热图、风险曲线、ROC曲线和生存曲线,我们得出结论:风险模型确实具有良好的预测效果,这表明该模型可以区分HCC高危患者和低危患者。我们的研究还考察了免疫微环境的差异,检查了免疫检查点,评估了免疫状态,确定了潜在的疾病治疗药物,为HCC治疗提供了新的思路和选择。在ConsensusClusterPlus软件包的帮助下,我们根据用于构建风险模型的四个DRL将患者分为两个群组。根据生存研究,群组1的生存时间优于群组2。与群组1相比,群组2在大多数病例中免疫检查点表达明显增加。研究结果表明,共识聚类可能与免疫微环境有关,并与患者预后相关。因此,这些发现可作为靶向治疗的思路。
在之前的研究中,有研究者发现lncRNA MKLN1-AS在HCC患者中上调,并且这种表达上调与肿瘤生长、转移和血管浸润相关,这可能是因为MKLN1AS作为miR6543p的分子海绵,促进了肝癌衍生生长因子的释放,从而恶化了肝细胞癌的进展 [22] [23] 。LncRNA GIHCG的高表达有助于HCC的增值,这可能是因为GIHCG通过沉默miR-200b/a/429促进了体内HCC细胞的增殖和转移,GIHCG的敲除增强了癌细胞对拉帕替尼的敏感性,这些发现表明GIHCG可作为HCC的预后生物标志物和潜在的治疗靶点 [22] [23] [24] [25] [26] 。AL031985.3与CD4+常规T细胞、铁突变、免疫、糖酵解和坏死相关,这表明二硫化物突变与上述癌症的免疫和代谢调控之间可能存在关联 [16] [27] [28] [29] [30] [31] 。迄今为止,lncRNA AL442125.2尚未见文献报道。因此,需要更深入的研究来探讨这些lncRNA在HCC中的作用及其对肝癌细胞二硫化过程的影响。
在本研究中,我们构建了一个风险模型,并进行了共识聚类分析,从多个角度分析了该模型的预测性能。此外,我们还预测了一些可能用于治疗HCC的药物,这些药物可能有利于未来的治疗。
不过,我们的研究也存在一些不足。首先,数据样本主要来自TCGA数据集,而TCGA数据集有限且同质化严重。其次,我们的研究主要基于生物信息学分析,缺乏实验。因此,未来对二硫化相关lncRNA的研究还需进一步探索。
5. 结论
总之,我们发现了四个与HCC患者OS显著相关的预后lncRNA生物标志物,构建了一个预测HCC预后的DRLs预测模型,并利用数据集验证了结果。这些lncRNA的预测能力与其他临床特征无关,在一定程度上优于目前的临床分期。我们希望能为目前的HCC预后评估提供新的参考,并为靶向治疗策略带来新的启示。
利益冲突
作者报告在这项工作中没有利益冲突。
数据共享声明
本研究中分析的数据集可从癌症基因组图谱(TCGA)中获取。
伦理批准和知情同意
作者对工作的所有方面负责,确保与工作任何部分的准确性或完整性有关的问题得到适当的调查和解决。本研究根据《赫尔辛基宣言》(2013年修订)进行。
作者贡献
所有作者均对所报告的工作做出了重要贡献,无论是在构思和设计、数据采集,还是在数据分析和解释方面,参与了文章的起草或对重要的知识性内容进行了批判性修改,同意向当前期刊投稿,最终批准了将要发表的版本,并同意对工作的所有方面负责。