1. 引言
代谢组学(Metabolomics)的概念最先由英国帝国理工大学的Nicholson教授领导的研究小组于1999年正式提出 [1] 。代谢组学是对细胞、器官、生物体内维持其正常生长和功能的小分子代谢物或化学分子(<1500 Da)同步实时定量分析的一门新学科 [2] 。代谢组学是以组群指标分析为基础,以高通量检测和数据处理为手段,以信息建模与系统整合为目标的系统生物学的一个分支 [3] 。近些年,随着系统生物学的迅速发展,生命科学研究跨入了后基因组时代,代谢组学作为继基因组学和蛋白质组学之后出现的一门新兴学科,已经成为后基因组学时代的一个非常重要的研究领域。
植物代谢组学是代谢组学的一个重要分支,其历史最早可以追溯到上世纪八九十年代 [4] 。在1991年美国化学协会上,作者发表了“Metabolic profiling of plant: A new diagnostic technique”,文章第一次介绍了代谢组学方法在植物非生物胁迫中的应用。植物代谢物种类繁多,结构各异,含量差异也很大。据估计,植物代谢物种类总数达到20万~100万,仅在拟南芥中就检测到超过5000种的初生和次生代谢产物 [5] [6] 。相比之下,动物的代谢物只有2500种左右,而微生物代谢物仅有1500种左右 [7] [8] 。植物代谢物在时间和空间上的高度动态性和复杂性,决定了植物代谢组学的研究更具挑战性。
强大的检测分析工具是植物代谢组学研究的关键。目前在检测技术方面,主要有核磁共振平台和质谱平台 [9] ;在代谢物分析方面,人们已经提出了目标分析、代谢产物轮廓分析、代谢表型分析、代谢组分分析等概念 [10] 。随着检测技术和分析方法的进步和完善,代谢组学在植物领域的研究项目逐年增多,研究领域也在不断拓展。尤其是随着拟南芥、水稻等基因组的测序完成,有力的促进了植物代谢组学的发展,从事植物代谢组学研究的机构和人员也越来越多,国内的研究机构如中国科学院大连化物所、中国科学院植物研究所等近几年在植物代谢组学方面取得了重要的研究进展 [11] 。但是相对于基因组学、转录组学等研究领域的快速发展,植物代谢组学的研究还相对滞后,目前关于代谢组学在植物研究领域中应用的综述也比较缺乏。为此,本文对近几年代谢组学在植物研究中的进展进行了总结、归纳,指出了代谢组学在植物研究中存在的问题,并对其发展进行了展望,以期为植物代谢组学的发展提供事实依据。
2. 代谢组学在植物研究领域中的应用
2.1. 基因功能解析研究
基因功能解析是目前分子生物学领域研究的热点,是揭示生物的遗传背景、发育规律的基础。在传统的基因功能解析中,往往通过表型变化来判断基因表达水平的变化,而对于在表型上无明显变化的则很难通过外界的观察来判断其表达水平的变化。如在拟南芥中,发现有近90%的突变体是沉默型突变体,很难通过表型来判断其基因表达状况 [12] 。代谢组分是基因表达的最终表现产物,基因表达水平极其微小的变化也会导致代谢物种类和含量的改变。Raamsdonk等 [13] 研究发现,突变体PFK26和PFK27与野生型的生长速度及形态上相似,但是代谢产物上存在着明显的差别;突变体中果糖-6-磷酸的含量显著高于野生型,但体内ATP/ADP的比例低于野生型;同样的,Fiehn等 [14] 也发现,在表型上无明显的差异的4种拟南芥基因型材料代谢物差异明显,因此,根据代谢物种类和含量的不同可以将这4个不同基因型的拟南芥进行科学的区分。可见,代谢组学也是一种对物种基因型进行合理分类的方法。Lytovchenko等 [15] 在马铃薯种研究发现,当质体葡萄糖磷酸变位酶(plastidial phosphoglucomutase)基因在其表达水平较低时,马铃薯的表型没有任何变化,但是对其光合作用途径中的中间体和终产物进行分析发现,植物组织中的淀粉、糖和有机酸的含量有一定程度的降低。这说明质体葡萄糖磷酸变位酶基因表达水平的细微变化对马铃薯种几条主要代谢途径都有显著的影响。由此可见,利用代谢组学方法检测代谢物的种类和含量变化则可以判断基因表达水平的细微变化,从而推断基因的功能及其对相关代谢途径的影响。
代谢组学方法常与转录组、蛋白组学等方法相结合来预测功能基因。目前利用各种组学方法结合来挖掘生物学信息并进行基因功能的解析已经成为各种组学研究的一个热点。代谢组是基因表达的最终产物,其种类和含量的变化与转录组、蛋白组等必然存在着一定的联系。以罂粟(Papaver somniferum)为材料,通过对利用靶向代谢组学和转录组数据进行关联分析,成功发现了一个参与吗啡生物合成的基因簇(由分属于5个酶家族的10个基因组成),并利用基因沉默技术鉴定了其中6个基因的功能 [16] ;同样,在甘草(Glycyrrhiza uralensis)中,利用代谢组学数据和转录组学数据进行关联分析,鉴定出了参与甘草甜素(glycyrrhizin)合成的两个细胞色素P450基因 [17] ;在拟南芥中,成功预测到涉及到硫代葡萄糖苷生物合成的基因,如编码磺基转移酶的基因 [18] 、两个MYB转录调节因子 [19] 、侧链延长相关的酶和一个假定的硫代葡萄糖苷转运体基因 [20] 。
2.2. 代谢途径及代谢网络调控机理研究
植物的代谢网络可能是自然界中最为复杂的天然网络结构之一。植物的代谢途径可以分为初生代谢(Primary Metabolism)和次生代谢(Secondary Metabolism)。目前对植物初生代谢途径、代谢产物和调控方式的研究较为深入,而对次生代谢的研究还远远不够。代谢组学数据分析能力强大,能快速的定性和定量某一代谢途径相关的前体、衍生物和降解产物;可以通过对某一代谢途径中代谢组种类和含量的检测,推测其代谢途径,根据其变化趋势来推测代谢网络调控机理。Croteau等 [21] 对薄荷腺毛内的萜类代谢网络与调控网络进行了系统的研究。Rios-Estepa等 [22] 利用动态数学模型,精确模拟了胡椒薄荷中单萜类挥发油组成的积累过程,并随后利用这一模型分析了低光强下分支点化合物胡薄荷酮和薄荷呋喃的积累过程。他们对环境影响下代谢物变化的分析显示,只有当薄荷呋喃对代谢分支点的胡薄荷酮还原酶具有抑制作用时,才能对试验数据进行合理的解释。Tiessen等 [23] 用HPLC对马铃薯块茎进行了代谢组分析,检测了淀粉合成途径中的一系列底物、中间物、酶及产物量的变化,再通过对野生型和含有异源腺苷二磷酸葡萄糖焦磷酸化酶(AGPase)的转基因材料进行对比研究,提出了淀粉合成途径中一种新的调节机制——在离开母体情况下,马铃薯块茎中淀粉合成关键酶AGPase的催化亚基AGPB会发生可逆的氧化还原反应形成二聚体,使AGPase失活,从而抑制淀粉生成。
目前,代谢组学应用于此方面的研究报道还比较欠缺,主要原因是确定代谢途径比测定代谢物更为困难,往往只能通过代谢途径的各个节点和中间产物情况进行间接的定性估计及拼接,同时一个代谢过程还涉及到很多的代谢元 [24] ,而且同一种次生代谢物可能有多个代谢通路,从单个的代谢物到一条完整的代谢途径还有很长的路要走。
2.3. 植物与生物逆境和非生物逆境互作研究
当植物生长环境发生变化(高温、高湿、干旱、病虫害等),植物自身会通过表型、分子、生理生化等一系列的变化来进行自我调节以适应这些逆境。植物在自我调节以适应环境的过程中,自身发生的一系列过程中会产生大量的代谢产物,这些产物主要包含有机酸、氨基酸、信号传导相关因子、生长素等初生和次生代谢物质 [25] 。赵秀琴等 [26] 利用气质联用仪(Gas chromatography-mass spectrometry, GC-MS)技术系统对低温胁迫下幼苗体内代谢物变化特征进行分析,发现草酸、戊糖酸-1,4-内酯、海藻糖及水杨酸参与了水稻低温胁迫早期应激性反应;在低温胁迫过程中,水稻植株主要通过苯丙氨酸、脯氨酸、谷氨酸、丝氨酸、苏氨酸、天门冬氨酸、缬氨酸、木糖醇、尿囊素和鼠李糖等含量的提高维持细胞渗透平衡;同时发现参与低温胁迫反应及胁迫恢复后进程的主要代谢物种类和含量都有显著的差异。很多外界条件的变化自身与代谢物之间存在着一定的相关性。如当外界碳、氮和硫的供给发生改变时,拟南芥中次生代谢物质硫代葡萄糖苷的含量随之发生改变,进一步研究发现硫代葡萄糖苷的改变与氮和硫的比例关系更紧密,而与氮和碳的比例并无显著相关关系 [27] [28] 。
植物受到病原菌的侵染后会产生自身免疫应答反应,代谢物在这种免疫反应中扮演着非常重要的角色。植物识别病原物以后,细胞会进行一系列动员活动,从而激活自身的抗病反应,以抵挡病原菌的入侵。这种抗病反应需要来自初级代谢途径的大量能量、还原力和碳骨架,以实现能量的补充和调度[24]。同时,当植物被病原菌浸染后,植物体内正常的代谢活动被打破,以满足抗病反应所需的能量等。二穗短柄草(Brachypodium distachyon)感染水稻稻瘟病(Magnaporthe grisea)后,利用代谢组学方法对其感病后的代谢途径进行分析,发现在抗病和感染过程中磷脂酰甘油合成均被抑制,这说明短柄草的抗病能力与膜脂中磷脂代谢的变化有关 [29] 。当大麦、水稻和二穗短柄草感染水稻稻瘟病后,通过其代谢物的分析检测发现,在病原体未感染的组织中积累苹果酸和多胺,而感病植株莽草酸途径加强,合成奎尼酸和非聚合类木质素的前体,抑制了病原菌苯丙烷代谢途径;随着病原菌丝的快速增殖,光合同化形成的渗透调节物甘露醇和丙三醇促进了病原菌的生长 [30] 。大量研究表明随着外界条件的改变,植物体内的代谢调节不是一个独立的过程,而是一个相互作用的代谢网络 [31] 。
2.4. 植物与生物逆境和非生物逆境互作研究
作物的产量和品质一直是农业科研工作者的关注重点。近年,植物代谢组学也开始应用于主要农作物(如水稻、玉米等)的产量、品质性状等育种研究领域。在育种工作中,尤其是分子设计育种中,精确定量描述作物的产量和品质性状是筛选育种材料的关键 [32] 。一直以来,育种者多利用分子手段对产量和品质性状进行定位,但是大多数的产量和品质性状不是由单一的基因位点控制,致使育种工作者在筛选育种材料时,耗费大量的人力、物力和财力。大部分代谢物的自然变异受到多个位点控制,相比复杂的农艺性状来说其遗传结构相对简单。为此,科研工作者尝试利用代谢物(或代谢网络)来定量表征产量、品质等农艺性状。通过代谢组学方法筛选与产量、品质相关的标志性代谢物(bio-marker),利用这些bio-marker来进行育种材料的筛选,大大加快了育种进程。生产上已经通过对小麦和大麦不同抗性品种进行非目标性代谢谱分析 [33] ,获得一些与抗病性相关的标志代谢物,这些标志性代谢物在生产实践中起到了辅助育种的作用。
理论上讲,农作物的产量和品质性状主要与植物主生代谢途径网络直接相关。相关研究工作已经表明产量和品质等性状与所含化合物之间不是简单的一一对应的线性关系,而且不同的主生代谢物含量本身就属于数量遗传性状(Quantitative Trait Loci, QTL)。在对马铃薯进行代谢组学和遗传背景关联分析,发现72%的检测化合物有对应的QTL,进一步揭示了代谢物含量与马铃薯品质性状之间存在基因关联和相关的标示代谢物 [34] 。
2.5. 作物营养成分及安全评估
植物代谢物中很多是与人类健康密切相关的营养成分。利用代谢组学方法,可以快速的对作物营养成分进行分析,对其品质进行评价。也可以分析作物储藏保鲜条件对作物营养成分及其品质的影响 [35] 。Aharoni等 [36] 利用高分辨率的FTIR/MS联用仪器对凤梨草莓(Fragaria ananassa)组织进行了分析,依据不同的质荷比找到了5844个不同质量的物质,并根据对化合物中高含量元素的精确质量测定,估计了其中一半以上物质的化学结构式。结果表明,在草莓的不同组织中都含有多种初生代谢物(如氨基酸、脂肪酸和碳水化合物)及次生代谢物(如类黄酮和萜类化合物)。Sun等 [37] 对十字花科蔬菜芥蓝不同发育阶段的芥子油苷含量进行动态监测,发现芥蓝中存在13种芥子油苷,其中脂肪族芥子油苷8种,吲哚族芥子油苷4种,芳香族芥子油苷1种;不同发育阶段、不同品种间芥蓝的芥子油苷含量有明显的变化,其中芥蓝芽苗菜阶段具有抗癌特性的芥子油苷含量最高,其次为茎部,含量最低为叶子中。很多研究者还研究了后熟措施(post-harvest)对作物代谢组成分的影响,对作物的储藏提出了合理的建议 [38] [39] 。中药材是一类特殊的药用植物,在长期的医疗实践中发现,即使是同种药材,由于产地不同、野生与栽培不同都表现出质量和疗效上的差异。因此,中药材的鉴别成为了当前中药界的重要难题。而代谢组学的出现为中药材的鉴定提供给了非常有力的手段。Kim等 [40] 对3种麻黄植物Ephedra进行了核磁氢谱指纹图谱分析,通过主成分分析找到了它们之间的代谢物差异,证明指纹图谱分析是中药材鉴别的一个有力工具,并为其全面质量控制带来了可能。目前,指纹图谱分析技术处在中药材鉴定上应用外,在烟草的分类上也进行了广泛的应用 [41] 。目前烟叶根据其香型,可以分为浓香型,清香型和中间香型,这种分类主要依靠专业评吸人员的感官来进行判断,过程复杂,且易造成误差和误判,人们寄希望通过先进的现代仪器设备来进行精确的分析判断 [42] 。烟叶中影响其香型的物质主要是代谢物质,代谢组学方法就成为了当前烟叶分类研究的热点。席元肖等 [43] 对中国18个产区68个产烟县的初烤烟叶样品的香味物质进行代谢组学分析,发现不同的香型代谢组分差异较大;清香型烤烟的叶黄素、类胡萝卜素、新绿原酸、芸香苷等共13种香味物质的含量显著较高;浓香型烤烟的绿原酸、香叶基丙酮、苯乙醛、苯甲醛、巨豆三烯酮等共7种香味物质的含量显著较高;中间香型烤烟大部分香味物质含量居中。可见,利用代谢组学方法可以有效的对不同香型的烟叶进行分类,且过程简单可靠。
代谢组学在作物的安全评价方面也起到了重要的作用。尤其是转基因技术的兴起,很多消费者担心转基因技术会对食品的安全带来安全隐患。Kim等 [44] 用傅里叶变换红外分光镜(Fourier Transform Infrared Spectroscopy, FTIR)和核磁共振波谱法(Nuclear Magnetic Resonance Spectroscopy, NMR)对转基因马铃薯和非转基因马铃薯做了比较分析,多维数据分析结果显示二者之间并无显著区别。德国的科研小组对转基因马铃薯和非转基因马铃薯中的α-卡茄碱和α-茄碱进行检测,发现二者含量并没有明显的差异;进一步对其指纹进行分析,认为在代谢水平上转基因马铃薯和传统马铃薯具有实质等同性,是安全的。这为转基因食品的安全评估带来了更为简单、快速的方法。需要指出的是,代谢组学手段只是验证转基因植物是否安全的方法之一,是必要而非充分条件。
3. 问题与展望
目前代谢组学在植物各领域中的应用逐年增多,也推动了植物代谢组学的发展。2002年4月在荷兰第一届世界植物代谢组学大会的召开极大的促进了植物代谢组学研究者的交流与合作。在国内,以中国科学院基因组学研究所、中国科学院遗传与发育生物学研究所、中国科学院植物生理生态研究所、中国科学院微生物研究所、中国科学院大连化学物理研究所、军事医学科学院、北京大学、清华大学等为代表的代谢组学研究单位,各自发挥自身的优势,在农作物、树木、药用植物、重要微生物等代谢组学领域都进行了大量的研究,促进了我国植物代谢组学的发展 [45] 。
因植物代谢组本身生物信息的复杂性,目前植物代谢组学的发展主要存在如下问题 [24] :
1) 分析工具及方法的局限性
要全面的反映植物代谢物的种类及含量,分析工具及方法应力求能够检测到植物中的每种代谢产物。由于植物中代谢产物达到20多万种,目前植物代谢组学中常采用的气相色谱–质谱联用仪(Gas Chromatography-Mass Spectrometer, GC-MS)、液相色谱–质谱联用仪(Liquid Chromatography-Mass Spectrometer, LC-MS)、毛细管电泳–质谱联用仪(Capillary Electrophoresis-Mass Spectrometry, CE-MS)等分析手段及方法都有其自身的局限性;而样品提取时间、提取温度、溶剂比例和质量及检测的条件等诸多因素也将影响样品分析的精度。
2) 数据分析方法的局限性
数据的分析和整理是植物代谢组学十分关键的步骤,也是植物代谢组学的难点。植物代谢组学数据、蛋白组学数据、反转录组学数据、表型组学数据之间的关联成为当前研究的一个热点。如何利用统计学、生物信息学方法从海量数据中获得有意义的信息已成为研究能否取得成功的重要环节 [46] 。分析技术和数据处理技术的快速发展将推动植物代谢组学迅猛发展。
3) 数据库的缺乏
相对于蛋白质组学、转录组学等学科,植物代谢组学的研究存在着数据库严重缺乏的问题,而目前大多数代谢组学方面的数据库则多侧重于医学、微生物等,而在植物领域的代谢组学研究则相对较少,且数据比较分散,缺乏统一的标准,不利于通过数据的整合进行生物信息的挖掘。因此,期待通过一个国际性的平台制定国际性的数据标准,构建标准化的植物代谢组学数据库,来促进植物代谢组学的更快更好发展。
植物代谢组学作为代谢组学的重要分支,尽管植物代谢组学还面临许多技术上的困难和挑战,如样品制备的自动化、代谢组学数据与其它组学数据整合方法的优化以及代谢物的结构鉴定等,已经在功能基因分析、代谢网络建立、品质分析等方面发挥了不可替代的作用,具有广阔的应用前景。尤其是随着GC-MS、LC-MS、CE-MS等分析技术的发展,以及转录组学、蛋白质组学等海量数据的出现,为通过植物代谢组学与其它组学数据的关联分析来解析生物信息学提供了强大的支持。
基金项目
河南省农业科学院优秀青年科技基金(2013YQ09);河南省农业科学院发展专项资金(20148402);郑州市重点科技攻关项目(131PZDGG315);国家科技支撑计划项目(2014BAD11B02);2015年河南省农业科学院科研发展专项(20157801)。