利用生物信息学分析帕金森病人黑质基因表达谱研究
The Bioinformatics Analyses on Expression Profiles of the Substantia Nigra in Parkinson’s Disease
DOI: 10.12677/HJCB.2020.104008, PDF, HTML, XML, 下载: 609  浏览: 1,943  科研立项经费支持
作者: 曹冰, 武鹏月, 张艳秋, 董雨轩, 王艳芹*:河北师范大学,河北 石家庄
关键词: 生物信息学帕金森病黑质基因表达谱Bioinformatics Parkinson’s Disease Substantia Nigra Gene Expression Profile
摘要: 目的:利用生物信息学分析帕金森病人黑质基因表达谱,为进一步帕金森病研究提供研究方向。方法:在Gene Expression Omnibus (GEO)数据库中使用“帕金森病”、“组织”、“表达谱”,并限定组织来源为“智人”,获得2020年3月22日前GEO数据库中的所有生物学样本信息数据。使用GEO2R、DAVID、STRING网站和Cytoscape软件进行数据分析。结果:根据检索条件获得了两个数据集,GSE42966 (对照组3名,帕金森病组6名)和GSE49036 (对照组8名,帕金森病组7个)。分析两个数据集GSE42966和GSE49036中分别存在632和1247个差异表达基因。在这两个数据集的差异基因中共有92个共表达差异基因,其中表达上调基因49个,表达下调基因43个。此外根据KEGG信号通路分析主要集中在细菌侵袭上皮细胞、神经营养蛋白信号通路、轴突导向和MAPK信号通路信号中富集。通过STRING网站构建PPI蛋白网络然后通过Cytoscape软件分析发现其中NTRK3、BDNF、GAB1、PCSK1、CHURC1、GFRA1、SHC4、DOK6、ASPA和ZEB2这十个基因为鉴定帕金森病的主关键基因。结论:通过两个数据集的生物信息学联合分析,找到与帕金森病相关的10个主关键基因,这可能为帕金森病分子通路的研究以及临床上治疗帕金森病提供新思路。
Abstract: Objective: The expression profiles of substantia nigra in Parkinson’s disease were analyzed by using bioinformatics identifying novel genetic targets. Methods: All biological data before March 22, 2020 related to “Parkinson’s disease”, “tissue”, “Expression profiles” and “homo sapiens” were down-loaded from the Gene Expression Omnibus (GEO) database. Then GEO2R, DAVID, STRING, and Cyto-scape software were used for data analysis. Results: According to the search conditions, two data sets were obtained, GSE42966 (3 in the control group, 6 in the PD group) and GSE49036 (8 in the control group, 7 in the PD group). From these two datasets 632 and 1247, differentially expressed genes were identified, respectively. There were a total of 92 differentially expressed genes in these two datasets, among which 49 genes were up-regulated and 43 genes were down-regulated. In ad-dition, according to the analysis of the KEGG pathway, the signaling pathways are mainly concen-trated in the signals of bacterial invasion of epithelial cells, neurotrophin signaling pathway, axon guidance and MAPK signaling pathway. The PPI network was established through the STRING web-site and then analyzed through Cytoscape software. Ten genes including NTRK3, BDNF, GAB1, PCSK1, CHURC1, GFRA1, SHC4, DOK6, ASPA and ZEB2 were identified as the hub genes for PD. Con-clusions: Through the combined bioinformatics analysis of the two data sets, 10 hub genes related to Parkinson’s disease were identified, which may provide new ideas for the research of molecular pathways of Parkinson’s disease and the clinical treatment of Parkinson’s disease.
文章引用:曹冰, 武鹏月, 张艳秋, 董雨轩, 王艳芹. 利用生物信息学分析帕金森病人黑质基因表达谱研究[J]. 计算生物学, 2020, 10(4): 69-77. https://doi.org/10.12677/HJCB.2020.104008

1. 引言

帕金森病(PD),又叫震颤麻痹,是一种常见于老年人仅次于阿尔兹海默症的神经系统变性疾病 [1],在65岁以上老年人中患此病的概率逐步增强,约为1%~2%,帕金森病传统上被认为是一种运动障碍。临床症状常表现为静止性震颤、步态和姿势障碍等运动障碍。同时还可能会伴随着智力受损、消化系统出现紊乱、抑郁等并发症。帕金森病目前以药物为主,可辅助电刺激,按摩针灸等治疗,减轻病痛,延缓疾病发展,但不能治愈此疾病。其诊断依赖于运动迟缓、肌肉强直和静止性震颤等运动症状 [2],但是此时患者中脑黑质的多巴胺能神经元已出现了病变,多巴胺能神经元变性死亡达到50%~60% [3]。PD是多种因素相互作用的结果,现代医学认为其与环境、基因、氧化应激与细胞凋亡、神经细胞老化加速、线粒体功能障碍、炎症、路易小体积聚等因素相关 [4] [5]。认知障碍在帕金森病患者中存在普遍,但在不同的疾病阶段表现是不同的。认知能力下降通常隐藏在更深层次的运动缺陷下,只有详细的神经认知评估才能揭示这些缺陷的影响程度 [6]。因为其复杂的致病机理,关于此病的研究也是从多个方面进行入手的,因为黑质多巴胺能受损导致黑质纹状体受损,所以多通过口服左旋多巴补充缺失的多巴胺;通过抗炎药的使用,可以减轻PD动物模型中的多巴胺能神经变性,减轻神经炎症 [7];通过ATP类似物(三磷酸激动素或其前体激动素)的使用,可以拯救患者PINK1的激酶活性,改善线粒体功能,增加了患者对氧化应激的敏感性 [8],但种种手段只能延缓PD的发展。目前对帕金森病的发病机理及干预靶点的研究多用大鼠、小鼠或猴子等,因为其表现的行为学症状和中脑黑质的病变与人类接近,可以较容易的获得其脑组织进行研究。但对于动物来说研究者不能获得患者的主观感受,而对于人类来说不能轻易获得其脑组织。目前已经确定与PD相关的易感基因有Parkin、DJ-1、PINK1、UCH-L1、α-synuclein [9]。有报道发现非运动障碍早于PD的发生 [10],包括抑郁、认知障碍、焦虑、胃肠功能障碍和睡眠障碍等 [11]。但是这些非运动障碍很难诊断出早期PD。因此我们本次在GEO数据库中,搜索相关的数据信息,对两个以人的黑质组织进行生物芯片分析的数据集,进行生物信息学分析。通过对PD相关基因生物学功能及其相互作用的分析可以为我们提供更具有价值的信息,以此来了解PD发病机制以及干预的靶点。

2. 材料方法

2.1. 数据收集

在Gene Expression Omnibus(GEO)数据库(http://www.ncbi.nlm.nih.gov/geo/)中搜索几个关键词,包括“帕金森病”、“组织”、“数组表达谱”、“智人”获取2020年3月22日前GEO数据库中的所有生物学样本信息。在搜索的91个数据信息中,本研究选择了两个以人的黑质组织为研究对象的数据集:GSE42966和GSE49036。GSE42966包含3名对照组和6名临床3~4期PD未治疗患者(Hoehn-CYahr量表)。GSE49036包含8名对照组和7名临床3~4期帕金森病患者(图1)。

Figure 1. Data processing and analysis process

图1. 数据处理和分析流程

2.2. 差异表达mRNAs选择标准

(http://www.ncbi.nlm.nih.gov/geo/GEO2R/)是一种在线分析工具,用于在GEO数据集中的样本组之间进行比较,以识别实验条件下的差异表达基因(differentially expressed genes, DEGs)。在我们的研究中,我们从两个数据集,包括GSE42966和GSE49036,获得了DEGs。当选择DEGs时,根据系统校正临界值定为P < 0.05,倍率变化为1.3。GSE42966数据集是用Agilent-014850 Whole Human Genome Microarray 4 × 44K G4112F进行分析的;GSE49036数据集是用[HG-U133_Plus_2] Affymetrix Human Genome U133 Plus 2.0 Array分析的。

2.3. 功能富集分析和KEGG信号通路分析

将GSE42966和GSE49036中与PD相关的共差异基因利用DAVID网站(https://david.ncifcrf.gov/)分析共差异基因功能特征。DAVID是一个基于web的系统,它整合了来自不同资源的信息来检测候选基因列表中的生物主题。基因本体论(Gene Ontology ,GO)用作描述基因的本质,包括1) 细胞组分(Cellular Component, CC):用来描述基因作用的位置;2) 分子功能(Molecular Function):用来描述分子水平活性;3) 生物学过程。而KEGG(Kyoto Encyclopedia of Genes and Genomes, KEGG)数据库是系统分析基因产物在细胞中的代谢途径以及这些基因产物功能的数据库。差异基因信号通路分析能够帮助我们更好地了解在一个生物学过程中某个或某一些蛋白质所扮演的角色。我们将P值小于0.05定义为富集显著。

2.4. 蛋白质–蛋白质相互作用(protein-protein interaction, PPI)网络分析和主关键基因的识别

利用检索基因/蛋白质相互作用搜索工具(STRING,https://STRINGdb.org/)在GSE42966和GSE49036两个数据集中构建蛋白质–蛋白质相互作用(PPI)网络。我们建立了只使用重叠差异表达基因的PPI网络,并将置信度截断值设置为大于0.4。

3. 结果

3.1. 差异基因

为了检测GSE42966和GSE49036中的DEGs,我们设置了灵敏度P < 0.05和倍数变化1.3。GEO2R分析表明GSE42966和GSE49036中分别存在632和1247 DEGs (图2)。在GSE42966和GSE49036中,共表达的差异基因有92个。其中49个基因表达上调,43个基因表达下调(图3)。

Figure 2. Volcano diagram of differential gene expression in two datasets

图2. 两个数据集中差异基因表达火山图

Figure 3. Wayne diagram of up-regulation and down-regulation of genes in two datasets

图3. 两个数据集中共上调和下调基因韦恩图

3.2. 功能富集和KEGG信号通路

对于DEGs,生物过程(biological process,BP)中最显著是神经系统发育、神经轴突导向、细胞骨架、蛋白磷酸化、抑制突触后电位正调控、细胞内信号转导、代谢过程、胞吐作用、解剖结构形态、磷脂酰肌醇磷酸酶去磷酸化、基因表达调控、神经元投射发育和多聚糖加工(图4)。

我们根据GO项列出了所有BP (生物过程) (图4(A))、CC (细胞组分) (图4(B))、分子功能(molecular function, MF) (图4(C))和KEGG途径(P < 0.05)。此外,KEGG途径分析显示DEGs集中在细菌侵染上皮细胞、轴突导向、神经营养蛋白信号通路、MAPK信号通路中富集(图4(D))。

Figure 4. Analysis of biological processes and KEGG signaling pathway

图4. 生物过程及KEGG信号通路分析

3.3. PPI网络及关键蛋白分析

利用GSE42966和GSE49036之间的92个重叠差异基因,通过STRING网站建立了蛋白质-蛋白质(PPI)网络(图5(A))。红色代表上升基因,绿色代表下降基因。随后,我们利用Cytoscape分析了连接结果,根据基因在网络中联系的多少从而将PPI网络中的10个基因鉴定为PD中的主关键基因,如果一个基因发生变化,那与之相联系的其他基因必然发生变化。其中包括NTRK3,BDNF,GAB1,GFRA1,ASPA,SHC4,PCSK1,DOK6,CHURC1,ZEB2 (图5(B))。颜色由深到浅代表其重要性依次过度,颜色越深代表越重要。

Figure 5. PPI network analysis and seed gene screening

图5. PPI网络分析和种子基因筛选

4. 讨论

帕金森病作为一种多发于60岁以上老年人的慢性神经系统退行性疾病,研究预计到2030年,发病人数将从870万上升到930万,严重影响了中老年人的生活 [12]。目前PD的发病机制暂不明确。临床上主要通过运动迟缓,肌僵直和静止性震颤等运动障碍作为诊断PD患者的依据。线粒体功能障碍、氧化应激、老龄化和遗传因素等都会造成PD的发生 [13]。环境因素被认为是发病原因之一,因为鱼藤酮和百草枯 [14] 等暴露均可造成中脑黑质多巴胺能神经元变性。

本研究通过生物信息学分析方法,对PD患者及正常人的黑质组织进行芯片分析的两个数据集GSE42966和GSE49036进行联合分析,在研究中发现共表达的差异基因有92个,其中49个基因表达上调,43个基因表达下调。这些差异基因在神经营养蛋白信号通路、轴突导向、MAPK信号通路信号中富集。由于这十个基因在PPI网络分析中高度表达,因此被鉴定为PD中的主关键基因,包括:NTRK3、SHC4、BDNF、CHURC1、GAB1、GFRA1、ASPA、PCSK1、DOK6和ZEB2。

神经营养蛋白因子作为生长因子家族的一员,在神经系统中发挥着重要的作用,包括对中枢神经系统的存活以及树突和轴突的维持,有研究表明神经营养蛋白突触可塑性中起着重要的作用 [15]。神经营养蛋白家族由神经营养因子(NGF)、神经营养蛋白(NT3)、脑源性神经营养因子(BDNF)和神经营养蛋白4/5(NT4/5)组成。这些神经营养蛋白可以和特定神经营养性酪氨酸激酶(NTRK)受体结合,NTRK受体可以激活MAPK和PI3K从而促进细胞存活与分化 [16]。150KD FL-NTRK3和50KD TR-NTRK3是NTRK3在人脑中存在的两种形式 [17]。有研究表明包括PD、AD和ALS在内的神经退行性疾病可能和突触可塑性缺失有关 [18]。当通过miRNA抑制TR-NTRK3时,将影响细胞膜和细胞骨架重构 [19]。在大鼠脑缺血损伤模型中发现NTRK3基因是神经再生的关键基因,当NTRK3上调时,可促进神经再生和神经可塑性 [20]。BDNF作为一种神经营养因子,其在海马、中脑、杏仁核、下丘脑、纹状体、脑桥、延髓等部位均有表达 [21]。研究发现在帕金森患者脑中和血液中观察到BDNF水平降低现象。有资料表明,PD中BDNF表达的降低可能导致α-突触核蛋白的累积,抑制多巴胺合成 [22]。沉默小鼠中编辑BDNF表达基因则会导致多巴胺能神经元的丢失 [23]。在MPTP小鼠模型中,发现激活BDNF表达后时,缓解了MPTP所导致的运动障碍 [24]。GDNF有着和BDNF类似的作用,在6-OHDA大鼠模型中,纹状体立体定位注射GDNF后,胶质细胞源性神经营养因子受体1 (glial cell line derived neurotrophic factor α1, GFRA1)表达升高,增加了黑质和纹状体TH表达,GFRA1是保护TH的有效靶点 [25]。GAB1 (GRB2结合蛋白1)是一种蛋白编码基因,其相关通路包括NGF通路和B细胞受体(BCR)的下游信号事件。DOK-6是p62DOK家族中Dok-4/5亚类的一个新成员,有研究发现在DOK-6在中枢神经系统中高表达,DOK-6可以联合GFRA1共同保护神经突触 [26]。

Table 1. List of genes identified with Parkinson

表1. 已经确定与帕金森有关的基因列表

在帕金森病中发现了调节纹状体多巴胺能终末神经支配逐渐丧失的现象,有研究者通过PCR发现了调控纹状体多巴胺能表达的调节剂ZEB2,与我们筛选基因中发现了ZEB2相一致,ZEB2还参与海马神经元的发育、皮质GABA能神经元、中枢神经系统髓鞘的形成。在ZEB2基因敲除小鼠中发现ZEB2具有调节纹状体多巴胺能轴突的生长 [27] [28]。GAB1基因编码溶酶体葡萄糖脑苷脂酶,当该基因突变丧失功能时会导致溶酶体功能障碍。表达GAB1突变的细胞还表现出了线粒体功能障碍和钙离子稳态失衡,这都极大的促进了PD发生 [29]。

我们联合分析的结果表明这10个与PD发生的主关键基因可能主要通过神经营养蛋白信号通路、轴突导向以及MAPK信号通路等影响着多巴胺能神经元的存活与死亡。已确定的与帕金森病有关的基因如表1所示,然而特定的某个基因与PD的关系我们却知之甚少。PD的发生是一个复杂的过程,我们鉴定出的基因可能是PD诊断和治疗的潜在靶点,这项研究为PD的研究提供了重要信息。

基金项目

河北师范大学重点科研基金项目(L2020Z05)。

NOTES

*通讯作者。

参考文献

[1] Leem, E. and Kim, S.R. (2020) Limited Therapeutic Potential of Astrocyte Elevated Gene-1 Transduction in an Animal Model of Parkinson’s Disease. Neural Regeneration Research, 15, 1850-1851.
https://doi.org/10.4103/1673-5374.280315
[2] Schrag, A. (2018) Testing the MDS Clinical Diagnostic Criteria for Parkinson’s Disease. Movement Disorders, 33, 1518-1520.
https://doi.org/10.1002/mds.27543
[3] Villacé, P., Mella, R.M. and Kortazar, D. (2017) Mitochondria in the Context of Parkinson’s Disease. Neural Regeneration Research, 12, 214-215.
https://doi.org/10.4103/1673-5374.200802
[4] Shen, B., Lin, Y., Bi, C., et al. (2019) Translational Informatics for Parkinson’s Disease: From Big Biomedical Data to Small Actionable Alterations. Genomics Proteomics Bioinformatics, 17, 415-429.
https://doi.org/10.1016/j.gpb.2018.10.007
[5] Raza, C., Anjum, R. and Shakeel, N. (2019) Parkinson’s Disease: Mechanisms, Translational Models and Management Strategies. Life Science, 226, 77-90.
https://doi.org/10.1016/j.lfs.2019.03.057
[6] Roheger, M., Kalbe, E. and Liepelt-Scarfone, I. (2018) Progression of Cognitive Decline in Parkinson’s Disease. Parkinson’s Disease, 8, 183-193.
https://doi.org/10.3233/JPD-181306
[7] Liu, J.Q., Zhao, M., Zhang, Z., et al. (2020) Rg1 Improves LPS-Induced Parkinsonian Symptoms in Mice via Inhibition of NF-κB Signaling and Modulation of M1/M2 Polarization. Acta Phar-macologica Sinica, 41, 523-534.
https://doi.org/10.1038/s41401-020-0358-x
[8] Hertz, N.T., Berthet, A., Sos, M.L., et al. (2013) A Neo-Substrate That Amplifies Catalytic Activity of Parkinson’s—Disease-Related Kinase PINK1. Cell, 154, 737-747.
https://doi.org/10.1016/j.cell.2013.07.030
[9] 王雪晶, 郭纪锋, 江泓, 等. 帕金森病相关蛋白Parkin与PINK1的相互作用研究[J]. 生物化学与生物物理进展, 2010, 37(9): 983-987.
[10] 李婷, 陈靖茹, 陆佳宁, 等. 帕金森病非运动症状研究进展[J]. 新中医, 2019, 51(6): 37-39.
[11] Pablo, M., Anthony, H.V., Stocchi, F., et al. (2007) Prev-alence of Nonmotor Symptoms in Parkinson’s Disease in an International Srtting: Study Using Nonmotor Symptoms Questionnaire in 545 Patients. Movement Disorders, 22, 1623-1629.
https://doi.org/10.1002/mds.21586
[12] Jagger, C., Andersen, K., Breteler, M.M., et al. (2000) Prognosis with Dementia in Europe: A Collaborative Study of Population-Based Cohorts. Neurologic Diseases in the Elderly Research Group. Neurology, 54, S16-S20.
[13] Armstrong, M.J. and Okun, M.S. (2020) Diagnosis and Treatment of Parkinson Disease: A Review. The Journal of the American Medical Association, 323, 548-560.
https://doi.org/10.1001/jama.2019.22360
[14] Dauer, W. and Przedborski, S. (2003) Parkinson’s Disease: Mecha-nisms and Models. Neuron, 39, 889-909.
https://doi.org/10.1016/S0896-6273(03)00568-3
[15] Lu, B., Nagappan, G. and Lu, Y. (2014) BDNF and Synaptic Plasticity, Cognitive Function, and Dysfunction. Handbook of Experimental Pharmacology, 220, 223-250.
https://doi.org/10.1007/978-3-642-45106-5_9
[16] Guidi, M., Muiños-Gimeno, M., Kagerbauer, B., et al. (2010) Overexpression of miR-128 Specifically Inhibits the Truncated Isoform of NTRK3 and Upregulates BCL2 in SH-SY5Y Neuroblastoma Cells. BMC Molecular Biology, 11, 95.
https://doi.org/10.1186/1471-2199-11-95
[17] Beltaifa, S., Webster, M.J., Ligons, D.L., et al. (2005) Discordant Changes in Cortical TrkC mRNA and Protein during the Human Lifespan. European Journal of Neuroscience, 21, 2433-2444.
https://doi.org/10.1111/j.1460-9568.2005.04074.x
[18] Chu, H.Y. (2020) Synaptic and Cellular Plasticity in Par-kinson’s Disease. Acta Pharmacologica Sinica, 41, 447-452.
https://doi.org/10.1038/s41401-020-0371-0
[19] Esteban, P.F., Yoon, H.Y., Becker, J., et al. (2006) A Ki-nase-Deficient TrkC Receptor Isoform Activates Arf6-Rac1 Signaling through the Scaffold Protein Tamalin. Cell Biology, 173, 291-299.
https://doi.org/10.1083/jcb.200512013
[20] Dmitrieva, V.G., Stavchansky, V.V., Povarova, O.V., et al. (2016) Effects of Ischemia on the Expression of Neurotrophins and Their Receptors in Rat Brain Structures outside the Lesion Site, Including on the Opposite Hemisphere. Molecular Biology, 50, 775-784.
https://doi.org/10.1134/S0026893316030067
[21] Brown, D.T., Vickers, J.C., Stuart, K.E., et al. (2020) The BDNF Val66Met Polymorphism Modulates Resilience of Neurological Functioning to Brain Ageing and Dementia: A Narrative Review. Brain Sciences, 10, E195.
https://doi.org/10.3390/brainsci10040195
[22] Bahiraee, A. and Ebrahimi, R. (2018) A Noble Pathological Role for Alpha-Synuclein in Triggering Neurodegeneration of Parkinson’s Disease. Movement Disorders, 33, 404.
https://doi.org/10.1002/mds.27306
[23] Baquet, Z.C., Bickford, P.C. and Jones, K.R. (2005) Brain-Derived Neu-rotrophic Factor Is Required for the Establishment of the Proper Number of Dopaminergic Neurons in the Substantia Nigra Pars Compacta. NeuroSci, 25, 6251- 6259.
https://doi.org/10.1523/JNEUROSCI.4601-04.2005
[24] Ji, R., Smith, M., Niimi, Y., et al. (2019) Focused Ultrasound Enhanced Intranasal Delivery of Brain Derived Neurotrophic Factor Produces Neurorestorative Effects in a Parkinson’s Disease Mouse Model. Scientific Reports, 9, Article No. 19402.
https://doi.org/10.1038/s41598-019-55294-5
[25] Kasanga, E.A., Owens, C.L., Salvatore, M.F., et al. (2019) GFR-α1 Expression in Substantia Nigra Increases Bilaterally Following Unilateral Striatal GDNF in Aged Rats and Attenuates Nigral Tyrosine Hydroxylase Loss Following 6-OHDA Nigrostriatal Lesion. ACS Chemical Neurosci-ence, 10, 4237-4249.
https://doi.org/10.1021/acschemneuro.9b00291
[26] Crowder, R.J., Enomoto, H., Yang, M., et al. (2004) Dok-6, a Novel p62 Dok Family Member, Promotes Ret-Mediated Neurite Outgrowth. Journal of Biological Chemistry, 279, 42072-42081.
https://doi.org/10.1074/jbc.M403726200
[27] Hegarty, S.V., Wyatt, L., Howard, L., et al. (2017) Zeb2 Is a Negative Regulator of Midbrain Dopaminergic Axon Growth and Target Innervation. Scientific Reports, 7, Ar-ticle No. 8568.
https://doi.org/10.1038/s41598-017-08900-3
[28] Stojkovska, I., Krainc, D. and Mazzulli, J.R. (2018) Molecular Mechanisms of α-Synuclein and GBA1 in Parkinson’s Disease. Cell and Tissue Research, 373, 51-60.
https://doi.org/10.1007/s00441-017-2704-y
[29] Aflaki, E., Borger, D.K., Moaven, N., et al. (2016) A New Glu-cocerebrosidase Chaperone Reduces α-Synuclein and Glycolipid Levels in iPSC-Derived Dopaminergic Neurons from Patients with Gaucher Disease and Parkinsonism. NeuroSci, 36, 7441-7452.
https://doi.org/10.1523/JNEUROSCI.0636-16.2016