摘要:
在过去的十几年,随着人类基因组计划的完成,高通量基因组技术,如芯片和新一代测序技术的发展,人们对lncRNA (Long non-coding RNA简称lncRNA)的研究兴趣急剧上升,成为研究热点。特别是遗传“中心法则”确立和mRNA的研究,既往人们一直认为RNA是DNA与蛋白质之间遗传信息传递的中介,但随着人类基因组计划研究的进展,发现在组成人类基因组的30亿个碱基对中,编码蛋白质的核酸序列大约仅占人类基因组序列的1.5%,其他98.5%为非蛋白编码序列。这些不编码蛋白质的基因序列曾一度被认为是基因组进化过程中堆积的无用的“垃圾序列”,随着研究的深入,越来越多证据表明它们可能具有更重要的生物学功能。2012年发布的ENCODE研究发现非蛋白编码序列中占绝大多数为长度大于200个碱基的非编码RNA (Long non-coding RNA简称lncRNA),这些lncRNA通过不同的作用机制,在不同的水平对基因表达进行调控,与人类的生长发育、疾病的发生密切相关。
Abstract:
In the past ten years, with the completion of the human genome project, high-throughput genomic technologies, such as chip and a new generation of sequencing technology development, people’s research interest of lncRNA (hereinafter referred to as the long ncRNA lncRNA) has risen sharply and become research hotspot. Especially for the research to establish the genetic “central dogma” and mRNA, people always think RNA is the genetic information transfer intermediary between DNA and protein, but with the progress of human genome project, it’s found in the composition of the human genome 30 million base pairs, nucleic acid sequences encoding proteins account for only about 1.5% of the human genome sequence, and the other is 98.5 percent non-protein coding sequence. This protein coding gene sequence was once considered to be the genome evolution in the process of accumulation of useless junk sequences. With the in-depth research, more and more evidence has shown that they may have more important biological functions. 2012 released encode found that non-protein coding sequence accounted for the vast majority of length, greater than 200 nucleotides non-coding RNA (hereinafter referred to as the long ncRNA lncRNA). These lncRNAs, through different mechanisms of action and in different levels of gene expression regulation, are closely related to human growth and development, disease occurrence.
1. 引言
长链非编码RNA (Long non-coding RNA, lncRNA)一般指长度大于200个核苷酸,不参与或很少参与编码蛋白质的RNA [1] 。位于细胞核内或细胞质中,其表达具有组织特异性和时空特异性 [2] 。
2. lnRNA的分类
Mercer等 [3] 根据在基因组上与邻近蛋白编码基因的位置和相对方向,将lncRNAs分为5类:1) 同义(sense) lncRNAs:与同义链上另一转录物的一个或多个外显子重叠;2) 反义(antisense) lncRNAs:与反义链上的转录物外显子重叠;3) 双向(bidrectional) lncRNAs:lncRNAs的转录起始位点与其互补链上相邻编码转录物的转录起始点十分靠近;4) 内含子(intron) lncRNAs:完全来源于另一转录物的一个内含子;5) 基因间(1incRNAs) lncRNAs:位于2个编码蛋白基因的间区。
3. lncRNA的功能
lncRNA可以在多个层面上调控基因的表达水平,主要包括:表观遗传学调控、转录调控、转录后调控等。
3.1. 表观遗传学调控
表观遗传学是指DNA序列不发生变化但基因表达却发生了可遗传的改变。这种改变是细胞内除了遗传信息以外的其他可遗传物质发生的改变,即基因型未发生变化而表型却发生了改变,且这种改变在发育和细胞增殖过程中能稳定传递 [4] 。lncRNA通过表观遗传学在生物体的生命活动中发挥着重要的调控作用 [5] ;包括:调节DNA甲基化,调节组蛋白的修饰,调节基因组印记,调节染色质重构,调节microRNA等 [6] 。
3.2. 转录调控
lncRNA能在转录水平上通过多种机制实现对基因表达进行调控,可促进或抑制基因表达,主要作用方式为:1) 影响邻近蛋白质编码靶基因表达;2) 结合转录抑制复制物影响靶基因表达;3) 作为共调控因子发挥作用;4) 调节转录因子的活性,干扰转录起始复合物的形成,影响启动子的选择等 [7] 。
3.3. 转录后调控
lncRNA能在转录后水平通过与其他RNA碱基互补配对形成双链的形式调控基因表达。包括1) 作为小非编码RNA的前体 [8] ;2) 影响其他RNA 选择性剪切、转运、拼接等过程 [9] ;3) 稳定mRNA翻译及辅助降解mRNA [9] ;4) 辅助翻译及抑制翻译 [10] 。
4. lncRNA调控基因表达的分子机制
lncRNAs作为重要的生物大分子参与各种生物学过程 [11] ,根据效应机制,可分为:信号分子、诱饵分子、引导分子、支架分子。
4.1. 信号分子
lncRNA可作为基因时空表达和调控、转录的信号标志物,它们能在特定时间、空间中转录而调节生物生长发育,感知环境、响应刺激,也可用于判断染色体的状态。
4.2. 诱饵分子
lncRNA可作为诱饵分子招募其他RNA结合蛋白质和调节RNA离开其功能位点。
4.3. 引导分子
lncRNA可作为引导者,结合蛋白质或者结合DNA特定区域,引导蛋白质-RNA复合物定位于待定位点来发挥引导作用。
4.4. 支架分子
lncRNA可作为复合物的支架,同时结合多个底物来发挥作用。
4.5. 复合分子
某些lncRNA可有多种分子机制,如既作为信号分子,又有引导分子功能。
5. lncRNA与人类疾病
目前已知功能的lncRNA还不足1%,随着研究的不断进展,越来越多证据表明lncRNA的表达或功能异常与人类多种疾病的发生密切相关,如癌症、神经系统疾病等 [12] 。具体表现为长链非编码RNA在基因序列和空间结构、表达水平、与结合蛋白相互作用的异常等。
5.1. lncRNA与癌症
肿瘤作为人类健康的头号杀手,对lncRNA的研究在肿瘤发生、发展过程中的作用受到充分重视,某些lncRNA在肿瘤中的作用机制已被阐明。特定的lncRNA表达变化不仅具有抑癌或致癌的直接作用,而且可作为特异性的肿瘤标志物。
早在20世纪末,印记基因H19是第一个被发现与癌症有关的lncRNA,它兼具致癌和抑癌双重作用 [13] ,在膀胱癌、肝癌、乳腺癌中发生高表达,可作为膀胱癌进展的标志物 [14] ,也可与甲胎蛋白联合检测提高早期肝癌确诊率 [15] 。研究发现lncRNAs (PRNCR1和PCGEM1)在许多前列腺癌症呈现高水平表达,抑制这两种lncRNAs则可抑制前列腺癌细胞的生长 [16] 。2003年发现的肺腺癌转移相关转录基因1 (MALAT-1)也是一种肿瘤标志物,在前列腺癌、结肠癌、乳腺癌、肝癌、子宫癌等中表达上调,是多种肺癌进程标志物 [17] 。还有在尿液中发现的lncRNA (prostate cancer antigen 3, PCA3),在前列腺癌中高度表达,特别便于临床检测 [18] 。
5.2. lncRNA与神经系统疾病
研究发现lncRNA与许多神经、精神系统疾病密切相关,包括阿尔茨海默症、精神分裂症、Prader-Willi综合症、孤独症、躁动症等 [19] 。lncRNAs在诸多层面参与神经系统疾病的发生发展,广泛参与包括脑发育、神经元分化及功能保持、神经细胞凋亡等过程。通过反义调节的方式,lncRNA能调节相关蛋白编码基因的表达。lncRNA通过调节改变,使一系列相关蛋白的作用模式发生变化,最终导致疾病的发生。lncRNA还参与了多发性硬化的免疫反应、亨廷顿病HD、帕金森、脑膜瘤的发病过程 [20] 。
6. 展望
lncRNA数量众多,功能复杂,目前仅有少量lncRNA的功能和作用机制被发现,对lncRNA的了解尚存在诸多空白,需要开发新的和有效的方法来系统挖掘lncRNA,并进一步探索lncRNA的结构、功能、调控机制。对lncRNA的深入研究有利于加深人类对自身复杂的调控网络的了解与认识,为许多复杂疾病的诊断和治疗提供新的依据和靶点。如某些精神和神经系统疾病目前缺乏特异性的检查和治疗,如果能找到一种有效的标志物,对精神和神经系统疾病的诊断将有很大的作用。对于脑血管动脉瘤、动静脉畸形及神经系统遗传性疾病的起因研究将有极大的帮助。
基金项目
本课题得到以下研究基金资助:福建省自然基金(N: 2011j01196)、福建省创新基金(N: 2011-cx-29)、福建省教育厅科学研究基金(N: ya11141)、福建省卫生厅临床研究基金(N: zlcxn03)、福建省引智项目(N: 20153500016)和两项国家自然科学基金(N: 81403255、N: 81503431)。
*通讯作者。