基于生物信息学探究肺腺癌miRNA-mRNA调控网络中的靶点基因
Exploring Target Genes in the miRNA-mRNA Regulatory Network of Lung Adenocarcinoma Based on Bioinformatics
DOI: 10.12677/jcpm.2025.42294, PDF, HTML, XML,   
作者: 段刘梦:华北理工大学基础医学院,河北省慢性疾病基础医学重点实验室,唐山市慢性病临床基础研究重点实验室,河北 唐山
关键词: 肺腺癌差异表达基因miRNA调控网络Lung Adenocarcinoma Differential Expression Genes miRNA Regulatory Network
摘要: 目的:本研究主要针对肺腺癌,旨在分析其组织中的差异表达基因,并探究miRNA-mRNA调控网络的关系,寻找潜在的分子靶点和治疗靶点。方法:通过下载GEO数据库中GSE74190和GSE140797数据,结合R语言进行数据分析,筛选出在两组芯片数据中具有差异表达的基因,即差异表达基因(differentially expressed genes, DGEs),作为后续研究的重点。对两组肺腺癌数据的DGEs进行miRNA-mRNA调控网络的构建,在CYTOSCAPE中进行可视化,得到关键调控网络与基因靶点,使用GEPIA2验证之前关键基因的表达与患者预后总生存率的关系。结果:miRNA-mRNA调控网络中显示有3个差异表达的miRNA基因均下调分别为hsa-miR-486-5p、hsa-miR-139-5p、hsa-miR-338-3p。在mRNA组中有7个差异表达基因,六个下调基因为DES、EMP2、COL6A6、PIK3R1、GDF10、LRRN3。一个上调基因为COL1A1。结论:探究差异miRNA在肺腺癌中通过调控下游靶向mRNA,建立miRNA-mRNA调控网络,使得我们对于肺腺癌中的基因调控机制更加深入了解,对肺腺癌中的生物学过程更加深入了解。本研究通过对关键miRNA-mRNA调控网络的构建,为肺腺癌的研究与治疗提供了新的靶点。
Abstract: Objective: To explore differentially expressed genes in lung adenocarcinoma tissue, study the relationship between miRNA-mRNA regulatory networks in lung adenocarcinoma, and identify potential molecular and therapeutic targets for lung adenocarcinoma. Method: Download samples from GEO, analyze data using R language based on GSE74190 and GSE140797 data and select genes with significant expression differences between the two sets of chip data, namely differentially expressed genes. Differently expressed genes (DGEs), and miRNA-mRNA regulatory networks were constructed on DGEs from two sets of lung adenocarcinoma data, visualized in CYTOSCAPE to obtain key regulatory networks and gene targets. GEPIA2 was used to validate the relationship between the expression of previous key genes and the overall survival rate of patients’ prognosis. Results: The results showed that three differentially expressed miRNA genes were downregulated in the miRNA-mRNA regulatory network, namely hsa-miR-486-5p, hsa-miR-139-5p, and hsa-miR-338-3p. There are 7 differentially expressed genes in the mRNA group, and six downregulated genes are DES, EMP2, COL6A6, PIK3R1, GDF10, and LRRN3. One upregulated gene is COL1A1. Conclusion: Exploring differential miRNAs in lung adenocarcinoma by regulating downstream targeted mRNA, and establishing a miRNA-mRNA regulatory network, enables us to have a deeper understanding of the gene regulatory mechanisms in lung adenocarcinoma and the biological processes in lung adenocarcinoma. This study provides new targets for the research and treatment of lung adenocarcinoma by constructing key miRNA-mRNA regulatory networks.
文章引用:段刘梦. 基于生物信息学探究肺腺癌miRNA-mRNA调控网络中的靶点基因[J]. 临床个性化医学, 2025, 4(2): 1196-1204. https://doi.org/10.12677/jcpm.2025.42294

1. 引言

肺腺癌是非小细胞肺癌的主要类型,约占所有肺癌的一半[1]。相比其他肺癌病理类型而言,肺腺癌发病机制复杂,且非吸烟人群中患病比例明显高于其他类型。因此,肺腺癌的早发现、早诊断、早治疗尤为关键,能有效提高患者的预后水平[2]。microRNA (miRNA)在肺腺癌调节中起着至关重要的作用。多个信使RNA (mRNA)可能受miRNA的调节,参与LUAD肿瘤发生和进展[3]-[5]。然而,参与LUAD的miRNA-mRNA调控网络尚未完全阐明。

miRNA在循环系统中易于检测,并携带有关于肿瘤起源的关键信息,因此它们被视作诊断和预后评估的重要生物标志物[6]。众多研究揭示,在LUAD患者中,miRNA的表达水平与健康个体存在显著差异。基因组学的研究广泛证实,多个mRNA在LUAD的肿瘤发生和进展过程中表现出异常表达,这些异常表达对疾病的发展具有重要影响。miRNA与mRNA之间的调控网络呈现出复杂特性:一方面,单个miRNA能够调控众多不同的mRNA;另一方面,单个mRNA也可能受到多种miRNA的共同调控[7] [8]。因此,有必要检查LUAD中的miRNA-mRNA调控网络,以促进我们对其分子机制的理解。

在这里,我们使用GEO数据构建了LUAD的miRNA-mRNA调控网络,以随后鉴定网络中的中心miRNA。使用基因本体(GO)和京都基因和基因组百科全书(KEGG)途径富集分析研究了枢纽miRNA靶向mRNA的功能富集分析[9]。以了解mRNA在LUAD发生和发展中的潜在机制。基因表达谱交互式分析(GEPIA)使我们能够评估这些关键的mRNA,并使用生存分析鉴定LUAD中的枢纽基因[10]。我们希望通过深入研究肺腺癌,确定其特异性高的分子标志物,探索新的潜在治疗靶点,更有针对性地治疗患者体内的基因突变,从而提高个体化治疗的疗效。为此,本研究运用生物信息学技术,挖掘肺腺癌中的分子标志物,并进一步探究其致病机制。具体地,我们构建miRNA-mRNA调控网络,分析关键基因和信号通路,进一步研究肺腺癌的致病机制,以期为深入理解肺腺癌的发病机制提供可靠的支持。通过这种方法,我们可以为肺腺癌的治疗和管理提供新思路和有效的治疗方案。

2. 材料与方法

2.1. 数据来源及处理

在GEO数据库下载Homo sapiens芯片数据,基于平台GPL19622的miRNA芯片数据集GSE74190和平台GPL13497的mRNA芯片数据集GSE140797两种数据集。miRNA芯片数据集中44个正常样本和36个癌样本,mRNA数据集中7个正常样本和7个癌样本,使用R语言软件进行分析,校正后的P < 0.05,|log2FC| > 2为标准确定差异表达基因(Differentially Expressed Genes)。根据差异表达基因进行后续分析。

2.2. 调控网络的构建

利用FunRich软件,对分析得到的miRNA和mRNA差异基因(DEGs)进行调控网络的构建,导入Cytoscape软件进行可视化[11]。最后选择调控网络中的miRNA与mRNA,并查看两者的表达情况。

2.3. 差异基因分析

利用org.Hs.eg.db和clusterProfiler两个包对差异表达的mRNA进行基因本体(GO)功能注释,并且使用京都基因与基因组百科全书(KEGG)分析这些基因所处的通路[12]-[14],筛选miRNA-mRNA调控网络所影响肺腺癌进程的关键通路。

2.4. 关键基因验证

利用GEPIA2 (Gene Expression Profiling Interactive Analysis, http://gepia2.cancer-pku.cn/#index)数据库进一步验证mRNA基因,验证mRNA基因在肺腺癌中的差异表达水平,并绘制Box-plot,确定与肺腺癌的进程更加相关的基因。

2.5. 关键基因的生存分析

利用GEPIA2数据库对mRNA基因进行生存分析观察mRNA基因的预后情况。

3. 结果

3.1. 肺腺癌和正常组织的DEGs

基于GSE74190和GSE140797的数据集筛选miRNA共上调基因6个,下调基因11个,mRNA共上调基因212个,下调基因260个(见图1)。

3.2. miRNA-mRNA调控网络

在FunRich软件通过对这些DEGs进行调控网络的构建找寻miRNA下游靶mRNA,在Cytoscape软件中进行可视化处理,结果如图2所示。通过Cytoscape软件构建miRNA-mRNA调控网络筛选出相关差异表达基因,hsa-miR-486-5p、hsa-miR-139-5p、hsa-miR-338-3p、DES、EMP2、COL6A6、PIK3R1、GDF10、LRRN3、COL1A1等基因,并确定各个基因的表达水平,见图3

(a) miRNA (b) mRNA

Figure 1. Volcano gram of differential genes for lung adenocarcinoma

1. 肺腺癌差异基因火山图

Figure 2. Regulatory network of miRNA-mRNA of differential genes

2. 差异基因miRNA-mRNA调控网络

3.3. GO和KEGG通路富集分析

下表(见表1)所示的差异表达基因的GO分析结果表明,这些差异表达基因主要涉及细胞外基质相关的信号通路和其他生物学过程,在肺腺癌的发病和发展过程中扮演着重要角色。进一步的KEGG通路分析结果表明,这些差异表达基因参与了多种生物学过程,如病毒蛋白与细胞因子之间的相互作用、细胞因子受体的调节、蛋白质的消化和吸收等。此外,这些基因还涉及细胞外基质与相关受体相互作用的重要通路。这些分析结果为我们深入探究肺腺癌的疾病机制提供了有力的支持,也为开发针对肺腺癌的治疗方法和策略提供了启示。

Figure 3. Box plot of differential gene expression

3. 差异基因表达箱线图

Table 1. GO and KEGG pathway enrichment analysis of differentially expressed genes related to gastric cancer

1. 胃癌相关差异表达基因的GO和KEGG通路富集分析

Category

ID

Term

Count

P Value

BP

GO:0030198

extracellular matrix organization

34

1.50E−12

GO:0043062

extracellular structure organization

34

1.66E−12

GO:0031589

cell-substrate adhesion

29

3.28E−10

CC

GO:0062023

collagen-containing extracellular matrix

35

3.00E−12

GO:0005911

cell-cell junction

30

1.12E−07

GO:0005581

collagen trimer

11

1.55E−06

MF

GO:0005539

glycosaminoglycan binding

22

3.18E−06

GO:0008201

heparin binding

17

3.84E−05

GO:0005201

extracellular matrix structural constituent

15

0.000550992

KEGG pathway

hsa04061

Viral protein interaction with cytokine and cytokine receptor

10

0.000160465

hsa04974

Protein digestion and absorption

10

0.000205184

hsa04512

ECM-receptor interaction

9

0.000288488

3.4. 关键基因验证

在GEPIA2数据库中分别对7个mRNA基因做基因表达差异验证分析,验证其关键性,发现COL1A1、COL6A6、DES、EMP2、GDF10、LRRN3、PIK3R1,7个Hub基因均与之前结果相一致,见图4

Figure 4. Expression level of mRNA gene in GEPIA2 database

4. mRNA基因在GEPIA2数据库中的表达水平

3.5. 关键基因的生存分析

应用GEPIA2 (http://gepia.cancer-pku.cn/)对7个调控靶mRNA进行生存曲线分析,生存曲线显示COL6A6、GDF10、PIK3R1与肺腺癌的总体生存率相关,且具有着显著影响(P < 0.05),而且COL6A6、GDF10、PIK3R1低表达患者预后更差(见图5)。由此推测COL6A6、GDF10、PIK3R1基因低表达可能与患者不良预后密切相关。

Figure 5. Survival analysis of mRNA genes in lung adenocarcinoma

5. mRNA基因在肺腺癌中的生存分析

4. 讨论

LAUD是一种高危疾病,死亡率高,其潜在发生和发展机制尚未完全确定[15] [16]。一些研究发现miRNA在LAUD中的作用,尽管这些发现缺乏一致性。在这里,我们使用miRNA-mRNA调控网络鉴定了LUAD中的几种枢纽miRNA和核心mRNA。总的来说,三个枢纽miRNA (即hsa-miR-486-5p、hsa-miR-139-5p和hsa-miR-338-3p)在LUAD肿瘤发生和进展中起重要作用。七个中心mRNA,即COL1A1、COL6A6、DES、EMP2、GDF10、LRRN3、PIK3R1。而COL6A6和PIK3R1与LUAD患者生存相关。这些发现表明,特定的miRNA和mRNA表达模式和功能分析有助于在临床环境中为LUAD患者识别新的预测标志物和治疗靶点。

网络中的三个枢纽miRNA在LUAD肿瘤发生和进展中发挥了最重要的作用。具体来说,与网络中的其他节点相比,hsa-miR-486-5p调控COL6A6和PIK3R1表达水平同时与预后不良有关,并与LUAD患者的蛋白吸收和细胞外基质途径相关。然而,鉴于记录hsa-miR-486-5p在LUAD中的直接机制的证据有限,需要进一步的实验来验证这些结果。已知实验研究表明PIK3R1基因是TCGA数据库中癌症谱系中第11个最常见的突变基因,PIK3R1基因在癌症中的表达普遍下降或丧失,但目前对其在肺癌中的作用了解较少。一些研究表明,敲除PIK3R1基因可能会减缓肿瘤的增殖和迁移,这表明该基因在不同类型的癌症中可能发挥着不同的功能。尽管相关研究还需要进一步深入探究,但这些发现有助于我们更好地了解肺癌及其他癌症的发病机制,为开发新的治疗策略提供有益启示。因此,癌症是一种极其复杂的疾病,受许多元素和生物过程的调节[17]

肿瘤微环境(TME)包含肿瘤细胞、周围细胞和分泌因子,它为癌症干细胞(CSC)的维持、癌细胞向转移部位的扩散、血管生成和细胞凋亡以及癌细胞的生长、增殖、侵袭和耐药性提供了有利的环境[18]。血管生成是肿瘤的基本特征,是指支持肿瘤生长和转移的异常血管生成[11]。TME中炎性细胞因子、血管生成因子和抗凋亡因子的高表达以及耐药机制,导致抗癌药物的治疗效果不佳和肿瘤进展[12]。TME可以显着促进肿瘤和转移进展,特别是通过自身失调的mi RNA表达或活性发挥作用。因此,miRNA是癌细胞和TME之间串扰的重要参与者。MiRNA是小的ncRNA,通常抑制mRNA的翻译和稳定性,因此能够调节多种细胞功能,包括增殖、迁移、分化、存活、侵袭和转移级联反应的几个步骤[13]

PIK3R1和COL6A6为调控网络中的预后相关mRNA,并显着预测LUAD的生存结局。这两种mRNA富集在细胞外基质与蛋白等信号通路中可能涉及肿瘤微环境(TME),导致肿瘤产生并影响LUAD的预后结果。随着研究的深入,越来越多的证据表明,肺腺癌的微环境(TME)可以显著地影响其发展[14]。TME中的细胞外基质重组、免疫反应、血管形态及能量物质的调节,都可以极大地推动肺腺癌的发展与恶化。先前的研究发现,PIK3R1基因在口腔鳞状细胞癌(OSCC)的迁移和侵袭方面具有重要作用。相关研究发现,在口腔鳞状细胞癌组织中PIK3R1的表达水平普遍下降,这说明PIK3R1可能是评估该疾病预后的关键因素,并且可能成为潜在的治疗靶点。进一步的研究有望深入探究PIK3R1在口腔鳞状细胞癌的作用机制,以促进更好的治疗策略的开发和应用。同时可能在肺腺癌中产生类似作用,其介导LUAD中的恶性生物学行为,包括生长,侵袭,转移和上皮到间充质转化(EMT)等[17] [19]。因此,我们发现了一个显著的hsa-miR-486-5p-PIK3R1轴,通过调节网络中的上述途径调节TME,从而在LUAD的发生和进展中起重要作用。尽管其他几个关键的mRNA在LUAD或肺癌中发挥了一些重要作用,这些不是LUAD生存的重要预测因素。

除了我们研究的优势之外,我们还应该指出几个局限性。我们所涉及的只是在生物信息学中进行的分析探究并没有进行实验的验证,而且实验中样本的数量和实验数据量不足等问题。在这项研究中,我们构建了LUAD的miRNA-mRNA调控网络,通过GEO数据集鉴定了三个核心miRNA [20] (即hsa-miR-486-5p、hsa-miR-139-5p和hsa-miR-338-3p)和七个中心mRNA (COL1A1、COL6A6、DES、EMP2、GDF10、LRRN3、PIK3R1)。我们还对这些最终靶基因进行了功能富集分析,以了解LUAD的潜在功能机制。这些发现为临床环境中的预测、预后和治疗靶点提供了新的分子标记,并强调了对LUAD的新机制见解。

5. 结论

本文通过生物信息学分析筛选出一个差异表达miRNA-mRNA调控网络,通过富集分析和通路富集确定影响的主要途径,在TCGA数据库的验证和生存分析得到了与肺腺癌发生发展的一个特异性轴hsa-miR-486-5p-PIK3R1,PIK3R1在肺腺癌中低表达,其具有调节PI3K通路进展的功能,主要参与细胞外基质等一系列通路变化,为肺腺癌的预防和治疗提供了新方法。

参考文献

[1] 刘凤森, 平玉, 张毅. 肺腺癌中成纤维细胞亚群临床及免疫特征的生物信息学分析[J]. 中国免疫学杂志, 2022, 38(17): 2118-2122, 2128.
[2] Zhang, L., Liu, Y., Zhuang, J., Guo, J., Li, Y., Dong, Y., et al. (2023) Identification of Key Genes and Biological Pathways in Lung Adenocarcinoma by Integrated Bioinformatics Analysis. World Journal of Clinical Cases, 11, 5504-5518.
https://doi.org/10.12998/wjcc.v11.i23.5504
[3] Sun, H., Zhang, M., Li, L. and Huang, Z. (2020) ALDH3B1 Is an Independent Prognostic Biomarker of Lung Adenocarcinoma. Technology in Cancer Research & Treatment, 19, 1-9.
https://doi.org/10.1177/1533033820946018
[4] Zhang, G., Dong, R., Kong, D., Liu, B., Zha, Y. and Luo, M. (2022) The Effect of GLUT1 on the Survival Rate and Immune Cell Infiltration of Lung Adenocarcinoma and Squamous Cell Carcinoma: A Meta and Bioinformatics Analysis. Anti-Cancer Agents in Medicinal Chemistry, 22, 223-238.
https://doi.org/10.2174/1871520621666210708115406
[5] Zhai, W., Duan, F., Wang, Y., Wang, J., Zhao, Z., Lin, Y., et al. (2022) Integrative Analysis of Bioinformatics and Machine Learning Algorithms Identifies a Novel Diagnostic Model Based on Costimulatory Molecule for Predicting Immune Microenvironment Status in Lung Adenocarcinoma. The American Journal of Pathology, 192, 1433-1447.
https://doi.org/10.1016/j.ajpath.2022.06.015
[6] Li, J., Yu, X., Liu, Q., Ou, S., Li, K., Kong, Y., et al. (2019) Screening of Important Lncrnas Associated with the Prognosis of Lung Adenocarcinoma, Based on Integrated Bioinformatics Analysis. Molecular Medicine Reports, 19, 4067-4080.
https://doi.org/10.3892/mmr.2019.10061
[7] Nacer, D.F., Liljedahl, H., Karlsson, A., Lindgren, D. and Staaf, J. (2021) Pan-Cancer Application of a Lung-Adenocarcinoma-Derived Gene-Expression-Based Prognostic Predictor. Briefings in Bioinformatics, 22, bbab154.
https://doi.org/10.1093/bib/bbab154
[8] Nguyen, T.T., Lee, H., Burt, B.M., Wu, J., Zhang, J., Amos, C.I., et al. (2022) A Lepidic Gene Signature Predicts Patient Prognosis and Sensitivity to Immunotherapy in Lung Adenocarcinoma. Genome Medicine, 14, Article No. 5.
https://doi.org/10.1186/s13073-021-01010-w
[9] Qin, J., Xu, Z., Deng, K., Qin, F., Wei, J., Yuan, L., et al. (2021) Development of a Gene Signature Associated with Iron Metabolism in Lung Adenocarcinoma. Bioengineered, 12, 4556-4568.
https://doi.org/10.1080/21655979.2021.1954840
[10] 张文婷, 刘亚锋, 胡春晓, 等. 肺腺癌预后代谢相关基因的生物信息学分析[J]. 细胞与分子免疫学杂志, 2023, 39(1): 41-48.
[11] Carmeliet, P. and Jain, R.K. (2011) Molecular Mechanisms and Clinical Applications of Angiogenesis. Nature, 473, 298-307.
https://doi.org/10.1038/nature10144
[12] Yeh, Y., Hsiao, H., Yeh, Y., Chen, T. and Li, T. (2018) Inflammatory Interferon Activates HIF-1α-Mediated Epithelial-To-Mesenchymal Transition via PI3K/AKT/mTOR Pathway. Journal of Experimental & Clinical Cancer Research, 37, Article No. 70.
https://doi.org/10.1186/s13046-018-0730-6
[13] Patil, N., Allgayer, H. and Leupold, J.H. (2020) Micrornas in the Tumor Microenvironment. In: Birbrair, A., Ed., Tumor Microenvironment, Springer 1-31.
https://doi.org/10.1007/978-3-030-50224-9_1
[14] Yi, M., Li, A., Zhou, L., Chu, Q., Luo, S. and Wu, K. (2021) Immune Signature-Based Risk Stratification and Prediction of Immune Checkpoint Inhibitor’s Efficacy for Lung Adenocarcinoma. Cancer Immunology, Immunotherapy, 70, 1705-1719.
https://doi.org/10.1007/s00262-020-02817-z
[15] 邓彪, 陈春源, 黄裕锋, 等. 肺腺癌患者代谢相关基因和免疫相关预后模型的建立[J]. 中国免疫学杂志, 2022, 38(15): 1851-1860.
[16] Yu, H., Pang, Z., Li, G. and Gu, T. (2020) Bioinformatics Analysis of Differentially Expressed miRNAs in Non‐Small Cell Lung Cancer. Journal of Clinical Laboratory Analysis, 35, e23588.
https://doi.org/10.1002/jcla.23588
[17] Song, J., Sun, Y., Cao, H., Liu, Z., Xi, L., Dong, C., et al. (2021) A Novel Pyroptosis-Related LncRNA Signature for Prognostic Prediction in Patients with Lung Adenocarcinoma. Bioengineered, 12, 5932-5949.
https://doi.org/10.1080/21655979.2021.1972078
[18] Xiao, Y., Hassani, M., Moghaddam, M.B., Fazilat, A., Ojarudi, M. and Valilo, M. (2025) Contribution of Tumor Microenvironment (TME) to Tumor Apoptosis, Angiogenesis, Metastasis, and Drug Resistance. Medical Oncology, 42, Article No. 108.
https://doi.org/10.1007/s12032-025-02675-8
[19] Zhang, M., Liu, X., Li, H., Li, R., Liu, X. and Qu, Y. (2018) Elevated mRNA Levels of AURKA, CDC20 and TPX2 Are Associated with Poor Prognosis of Smoking Related Lung Adenocarcinoma Using Bioinformatics Analysis. International Journal of Medical Sciences, 15, 1676-1685.
https://doi.org/10.7150/ijms.28728
[20] Deng, H., Huang, Y., Wang, L. and Chen, M. (2020) High Expression of UBB, RAC1, and ITGB1 Predicts Worse Prognosis among Nonsmoking Patients with Lung Adenocarcinoma through Bioinformatics Analysis. BioMed Research International, 2020, Article ID: 2071593.
https://doi.org/10.1155/2020/2071593