基于组学技术挖掘植物天然产物合成途径研究进展
The Progress of Research on the Excavation of Plant Biosynthetic Pathways of Natural Products
摘要: 组学技术主要包括基因组、转录组、代谢组和蛋白组,是当前挖掘和解析植物天然产物生物合成途径的重要技术手段。本文主要概述了生物合成基因簇、基因共表达、基因家族和表观共调控在植物天然产物合成途径解析中的应用,并对当前生物合成途径解析的主要进展进行了回顾,以期为植物生物合成途径挖掘和解析提供参考。
Abstract: Omics technologies, which mainly include genomics, transcriptomics, metabolomics, and proteomics, are important technical methods for mining and analyzing the biosynthetic pathways of natural products in plants at present. This review mainly outlines the application of biosynthetic gene clusters, gene co-expression, gene families, and epigenetic co-regulation in the analysis of plant natural product synthesis pathways, and summarize the main progress in the current analysis of biosynthetic pathways, to provide a sight for the mining and analysis of plant biosynthetic pathways.
文章引用:蒋凯. 基于组学技术挖掘植物天然产物合成途径研究进展[J]. 农业科学, 2024, 14(8): 953-962. https://doi.org/10.12677/hjas.2024.148119

1. 引言

植物一般固着生长,不能趋避有害的环境条件。但在漫长的进化过程中,植物演化出“十八般武艺”以适应环境及应对逆境的胁迫。其中,植物产生的特有代谢产物(specialized metabolites),过去常被称作次生代谢产物(secondary metabolites),在适应及抵御逆境胁迫中发挥了非常重要的作用。例如,植物产生的苯丙素、萜类化合物、生物碱和氰基葡萄糖苷等代谢产物具有吸引传粉者[1] [2]抵抗极端温度和对抗食草动物和病原体的作用[3]。上述特有代谢产物不仅能够帮助植物适应和应对逆境的胁迫,同时也是人类重要的医药和食物来源,在人类社会的发展中发挥着重要作用。例如,从南方红豆杉(Taxus chinensis var mairei)中提取的紫杉醇(paclitaxel)是非常重要的抗肿瘤药物[4] [5]。随着人类社会快速发展和人口爆发性增长,从植物中提取天然产物已经无法满足我们日益增长的需求。特别是我们对生物多样性保护的意识逐渐加强,以破坏植物从中获取医药和食物的途径慢慢被舍弃。因此,如何使用更高效更简洁的方法合成这些具有重要价值的植物特有代谢产物成为21世纪非常前沿和重要的研究课题[6]-[8]。过去,化学合成是生产这些重要化合物的主要途径。但是化学合成可能产生有害的副产品和废弃物,破坏环境;并且化学合成需要消耗大量资源和能源[9] [10]。随着基因组学的发展和合成生物学的兴起,生物合成逐渐成为我们获取天然化合物的重要途径。但是,这些特有代谢产物在植物体内由复杂的分子网络合成和调节,并且相关生物合成及调控基因的动态获得和丢失在植物进化中反复发生,阻碍了我们对不同植物特有代谢产物合成和调控机制的认识[11]

在过去几十年中,多组学技术的进步和发展为我们深入认识植物特有代谢产物的生物合成提供了非常重要的视角。特别是近十年来,高通量测序价格平民化、蛋白质组学和代谢组学兴起和表观遗传组学出现,加上计算资源的快速部署,促进了代谢产物生物合成途径的挖掘[12]-[14]。至今,已有大量具重要生态和医药价值的植物天然产物的生物合成途径被解析[15]。例如,紫杉醇、可卡因等植物中重要天然产物的合成途径已经被大量研究,已经基本清楚参与合成上述天然产物的基因[15]-[18]。但是,由于植物生物合成和调控的复杂性以及基因功能的多样性,已被解析的天然产物的生物合成途径占比仍非常少[13]。特别是在研究全新植物特有代谢产物合成途径解析中,通路上重要催化酶合成及调控机制的研究难度不言而喻,仍面临很大的挑战。多组学技术整合为全新植物特有代谢产物合成及调控机制的研究提供了一个非常重要的工具[19] [20]

本综述首先探讨了过去生物合成途径挖掘的重要进展,包括生物合成基因簇、共表达网络、基因家族和表观共调控四个方面(图1)。然后总结了已有的多组学方法在生物合成途径挖掘中的应用,最后对多组学技术整合在全新生物合成途径挖掘中的应用进行展望。

Figure 1. Four mainstream methods for the analysis of plant natural product biosynthetic pathways (modified from [23])

1. 植物天然产物合成途径解析的四种主流方法(修改自[23])

2. 生物合成基因簇

生物合成基因簇指在基因组中紧密相连,成簇存在;在功能上相互协同,具有合成特有代谢产物完整途径的一系列基因的集合[21]。生物合成基因簇的概念主要起源于微生物代谢产物的生物合成研究。大量研究发现微生物中负责代谢产物合成的基因在基因组上常位于邻近的区域[22]。在植物中,虽然生物合成基因簇比较少,但近20年来亦有报道。迄今为止,在植物中已有30多条完整的生物合成基因簇被解析出来。植物合成基因簇在基因组上覆盖的区域大约为35 kb到几百kb,并且至少包含3个及以上催化不同类型生物学反应的基因[23] [24]。1997年,在玉米中首次报道了生物合成基因簇在2,4-dihydroxy-7-methoxy-1,4-benzoxazin-3-one (DIMBOA)化合物合成中具有重要作用[25]。在随后的20几年中,在植物中陆续发现了一些重要代谢产物,如thalianol、蜀黍苷(dhurrin)、氰甙(cyanogenic glucoside)、长春胺(vincamine)等的合成都与基因簇有关[13]

基于生物合成基因簇挖掘重要代谢产物的合成途径主要依赖于完整的基因组资源。结合基因组学、生物信息学和多组学数据可以从基因组中综合识别和预测基因簇,从而揭示全新生物合成通路[23]。利用基因预测软件识别基因组序列中的开放读码框(ORFs),并对这些预测的基因进行功能注释。接着,基于同源性搜索,如BLAST软件,找出与其他已知生物合成基因簇相似的序列,同时利用保守域数据库来识别与特定生物合成功能相关的结构域[26]。此外,基于比较基因组学的方法,如共线性分析和系统发育分析,也有助于在不同物种中发现保守的基因簇排列和演化关系[27]。专门的生物信息学工具如“NP. searcher”,“Clust Scan”,“CLUSEAN”,“anti SMASH”,“SMURF”,“MIDDAS-M”,“Cluster Finder”,“CASSIS/SMIPS”and“C-Hunter”,“NRPS predictor”and“SBSPKS”等软件,为识别和分析生物合成基因簇提供了强大的支持[28]。整合转录组和代谢组数据能够进一步揭示基因簇中基因的表达模式和潜在的代谢产物,为基因簇的功能提供了重要线索[29] [30]。最后,近期兴起的机器学习和数据挖掘技术,如模式识别和网络分析,可以揭示基因簇的特征模式和相互作用网络,从而辅助识别可能的生物合成基因簇[31]。通过这些方法的综合应用,研究人员可以有效地识别和预测基因簇,为深入研究其在生物合成途径中的作用奠定坚实的基础。

基因簇是解析生物途径及其调控网络的重要手段。通过天然代谢产物生化特性研究可以确定基因簇中各个基因编码的酶的催化活性和作用底物。这通常涉及体外酶促反应、同位素标记实验和质谱分析等技术,以追踪代谢中间体和最终产物的合成路径[32]。接着,基因功能分析通过基因敲除、过表达或敲入实验来研究特定基因在生物合成途径中的作用。这些实验可以在模式生物或异源表达系统中进行,以观察代谢产物的变化,从而推断基因的功能[33]。此外,结合实验数据和计算模型可以构建生物合成途径的代谢网络图,如使用如KEGG、MetaCyc和SynthDB等数据库和软件工具来实现。在调控网络的研究方面,转录调控分析关注基因簇的表达模式,识别可能的转录调控因子结合位点,以及启动子和增强子区域[9]。转录组测序数据揭示了在特定条件下调控基因簇表达的关键转录因子。表观遗传调控的研究探索了DNA甲基化、组蛋白修饰等机制如何影响基因簇的活性,这些信息可以通过ChIP-seq、MeDIP-seq和ATAC-seq等技术获得[34]。信号传导途径的研究则关注外部信号(如植物激素、环境胁迫信号)如何通过信号传导途径影响基因簇的表达。最后,通过系统生物学方法,如动态网络建模和机器学习算法,来预测和验证基因簇的调控网络,这有助于揭示复杂的调控机制,并为合成生物学应用提供理论基础[35]。通过这些综合性的研究方法,科学家们能够逐步解析基因簇的生物合成途径和调控网络,为合成生物学、代谢工程和新药开发等领域提供重要的知识基础。这些研究成果不仅加深了我们对生物合成途径复杂性的理解,还可能为开发新的生物技术应用提供创新的策略和方法。

3. 基因共表达分析

共表达分析是一种基于大量基因表达数据的生物信息学方法,旨在识别在特定条件下表达模式呈现统计学相关性的基因[36]。这种分析依赖于高通量技术,如mRNA测序或微阵列,来生成详细的基因表达水平数据。通过应用统计学方法,如皮尔逊或斯皮尔曼相关系数,研究人员能够评估基因之间的表达水平是否存在显著的相关性。共表达关系的存在暗示了基因间可能存在生物学联系,包括参与相同生物过程、代谢途径或受相似调控机制的影响[37]。进一步地,这些发现可以用来构建基因共表达网络,其中节点代表基因,边代表共表达关系,揭示了基因间的相互作用和潜在的调控关系。共表达分析不仅涉及传统的统计方法,还包括数据挖掘和机器学习技术,以处理和分析大规模数据集,识别复杂的表达模式和生物学信号[38]。然而,共表达分析的结果需要通过实验验证来确认其生物学意义,这可能包括基因功能的研究、调控因子的鉴定和基因敲除或过表达实验。因此,共表达分析是连接基因表达数据与生物学功能的重要桥梁,为揭示基因如何在细胞内协同作用提供了强有力的工具,对于理解复杂的生物系统和推动生物医学研究具有重要意义。

共表达分析作为一种强大的生物信息学工具,在全新生物合成途径的解析中扮演着关键角色。它通过识别在特定生物学条件下表达模式相似的基因集,揭示了可能参与相同生物合成途径或具有相关功能的功能相关基因。这种分析不仅有助于发现新的生物合成途径,而且能够构建起基因之间的调控网络,从而深入理解生物合成途径的调控机制[39]。此外,共表达分析的结果可以指导实验设计,为基因敲除、过表达或突变体分析等后续实验验证工作提供依据,从而确认候选基因在生物合成途径中的具体作用。通过整合多组学数据,如代谢组学和蛋白质组学数据,共表达分析进一步提供了一个全面的生物合成途径视图,有助于验证和完善途径假设,并揭示代谢物的生物合成途径[20]。跨物种的共表达分析还有助于揭示保守和物种特异性的代谢途径,增进对生物合成途径演化和物种适应性的理解。在合成生物学领域,共表达分析的应用也日益凸显,它为设计和构建新的生物合成途径提供了关键信息,使得生产特定化合物或提高产量成为可能[40]。总之,共表达分析不仅加速了新途径的发现,而且为代谢工程和生物技术的应用提供了坚实的理论基础。

尽管共表达分析在解析全新生物合成途径中发挥着重要作用,但它也存在一些局限性。首先,数据质量和可用性对分析结果至关重要。如果原始数据存在技术偏差或噪声,或者缺乏足够的样本,可能会严重影响共表达基因集的准确。其次,选择合适的统计方法对于识别可靠的共表达关系非常关键,不同的方法可能会产生不同的结果。此外,共表达关系并不总是等同于生物学上的直接关联,两个基因可能因为相似的调控机制而共表达,但它们在生物合成途径中的实际作用可能并不相关。共表达分析主要关注基因在转录水平的表达,可能无法捕捉到后转录调控层面的变化,如RNA编辑、稳定性和翻译效率,这些都可能影响蛋白质的最终表达[41]。此外,基因表达和调控的物种特异性和组织特异性可能限制了共表达分析在不同生物体系中的普适性。尽管共表达分析可以提供有关基因功能和调控的假设,但这些结果需要通过实验方法进行验证,以确保其生物学意义和准确性。最后,处理和分析大规模的基因表达数据需要相应的计算资源,这可能对一些研究者构成挑战。因此,在应用共表达分析时,研究者需要综合考虑这些局限性,并结合其他实验技术和计算方法,以提高解析生物合成途径的准确性和可靠性。通过这种多维度的方法,可以更全面地理解生物合成途径的复杂性,并为进一步的研究提供坚实的基础。

4. 基因家族分析

基因家族是指一组源自共同祖先基因的基因,它们通过基因复制或其他机制在进化过程中分化而来,并在序列、结构域、功能或进化历史上展现出相似性[42]。这些基因在序列层面具有足够的相似性,使得它们可以通过生物信息学工具被有效识别和分类。基因家族成员通常含有相似的结构域,这些结构域决定了它们的生物学功能,如激酶基因家族的所有成员都含有激酶结构域。此外,基因家族的划分还考虑了基因之间的进化关系,通过构建系统发育树可以揭示它们的进化分支和亲缘关系。基因表达模式也是划分基因家族的一个重要依据,家族成员可能在特定的组织或生理条件下表现出相似的表达模式[43]。尽管基因家族成员可能参与多种不同的生物学过程,它们在功能上可能存在一定的冗余或互补性。基因家族的研究对于揭示基因组的结构和功能、理解基因的进化历史、探索生物学途径和调控网络具有重要意义[44]。通过识别和分类基因家族,研究人员能够更深入地理解基因在生物体中的作用,以及它们如何适应和塑造生物体的复杂性。

基因家族分析在全新生物合成途径的解析中发挥着至关重要的作用,它通过多个层面助力研究人员深入理解生物合成途径的组成和调控机制。首先,通过识别基因家族中的关键基因,研究人员可以确定途径中可能的催化酶或调控蛋白,这些基因的识别是解析途径的第一步[45]。其次,基因家族分析揭示了家族成员之间的进化关系,有助于理解生物合成途径在不同物种中的保守性和多样性,以及它们如何适应和演变[46]。此外,基于序列和结构域特征的功能预测,可以为未知功能的基因提供潜在的角色假设,这对于填补知识空白和理解途径的功能至关重要。基因家族分析还能够揭示调控网络,特别是通过识别和分析调控因子如转录因子的互作关系和表达模式,从而揭示它们在生物合成途径中的调控作用。这种分析可以与其他组学数据整合,如转录组、代谢组和蛋白质组数据,为途径提供更全面的视图,并识别关键代谢节点和调控枢纽[47]。此外,基因家族分析的结果对于指导实验设计具有重要价值,它可以帮助研究人员选择合适的基因进行功能验证实验,如基因敲除、过表达或突变体分析,这些实验对于确认基因在途径中的作用至关重要。最后,在合成生物学领域,基因家族分析有助于识别和利用具有特定功能的基因,这对于设计和构建新的生物合成途径、生产有用化合物具有重要意义。综上所述,基因家族分析为全新生物合成途径的解析提供了多维度的洞察,加速了新途径的发现,并为代谢工程和生物技术的应用奠定了坚实的理论基础。

基因家族分析在挖掘全新生物合成途径中虽然发挥着关键作用,但也存在一些局限性。首先,这种分析依赖于识别序列同源性,但基因在长期进化过程中可能发生显著的序列变化,导致一些功能上相关但序列相似性较低的基因可能被忽略。其次,尽管基因家族分析能够提供关于基因功能的重要预测,但这些预测并不总是准确的,特别是对于那些在进化过程中获得新功能或失去原有功能的基因。此外,基因家族内部成员的功能多样性可能导致在途径分析中难以精确区分其具体作用。同时,复杂的基因调控网络可能无法完全通过基因家族分析来捕捉,特别是当考虑到转录因子的调控作用可能受到多种因素的影响时。此外,基因家族分析的准确性和深度受限于可用的数据资源,对于数据缺乏的物种,分析可能受限。进化过程中的基因丢失和复制事件也可能导致对基因家族历史的误解,进而影响途径的解析。最后,尽管基因家族分析能够提供有价值的信息,但其结果仍需通过实验方法进行验证,以确保预测的准确性和生物学意义。因此,在应用基因家族分析时,必须考虑到这些局限性,并结合其他实验和计算方法,以提高解析生物合成途径的全面性和可靠性。通过这种综合性的方法,可以更深入地理解生物合成途径的复杂性,为未来的研究和应用奠定坚实的基础。

5. 表观共调控

表观共调控是指在基因表达调控过程中,多个基因受到相似的表观遗传修饰而表现出协同的表达变化[48]。这种调控机制涵盖了DNA甲基化、组蛋白修饰、染色质构象改变以及非编码RNA等多种表观遗传因素。DNA甲基化,一种常见的表观遗传修饰,通常与基因沉默相关,而在表观共调控中,多个基因可能因为相似的甲基化模式而共同被调控[49]。组蛋白修饰,如乙酰化和甲基化,通过改变染色质的结构和可及性,影响基因的转录活性,导致一组基因的表达受到同步调控[50]。染色质的三维构象变化也对基因表达具有重要影响,基因可能因为相似的开放或闭合状态而共同受到调控。此外,非编码RNA通过多种机制参与基因表达的调控,它们可以与其他表观遗传因子共同作用,导致基因的协同调控[51]。环境因素,包括营养、温度和压力等,也可以影响表观遗传修饰,从而调控多个基因的表达。在生物体的发育过程中以及疾病状态下,表观共调控可能起到关键作用,如发育信号诱导的基因表达变化和疾病相关的基因表达模式改变。表观共调控的概念强调了基因表达调控的复杂性,揭示了基因如何在不同的生物学背景下协同作用,以及它们如何共同影响细胞的行为和功能。通过深入研究表观共调控,我们能够更好地理解基因表达的精细调控网络,为疾病的预防、诊断和治疗提供新的策略和方法[52]

表观共调控通过激活沉默的基因簇、改变代谢产物指纹图谱、揭示生物合成途径、提高生物合成效率以及促进基因表达的精细调控等机制,在挖掘全新生物合成途径中发挥着重要作用[53]。在真菌等微生物中,利用表观遗传策略,例如定向遗传敲除表观遗传调控因子,可以激活沉默的次级代谢产物合成基因簇,从而揭示新的生物合成途径,并导致代谢产物指纹图谱发生显著变化,有助于识别和分离新的天然产物[54]。此外,通过表观遗传学的方法,研究者可以更深入地理解特定代谢产物的生物合成途径,为进一步的生物合成研究提供重要信息。表观共调控还可以通过优化表观遗传调控机制来提高特定代谢产物的生物合成效率,这对于生产具有药用价值的化合物尤为重要。在植物中,表观共调控对植物的生长发育、逆境适应以及次级代谢产物的合成具有重要影响。通过表观转录组编辑技术,可以在作物中引入或去除特定的表观遗传修饰,从而提高作物的产量和抗逆性[18]。因此,表观共调控为挖掘全新生物合成途径提供了新的思路和工具,有助于发现和开发具有重要生物学和医学价值的新化合物。

表观共调控在挖掘全新生物合成途径中虽然展现出巨大潜力,但也存在一些显著的局限性。首先,分析表观遗传修饰的技术相比传统的基因序列分析更为复杂,需要高度专业化的设备和深入的专业知识。此外,表观遗传修饰的动态性和可逆性虽然为调控提供了灵活性,但也增加了研究和应用的难度。同时,表观遗传修饰通常不是独立作用,而是与其他修饰相互作用,形成一个复杂的调控网络,这种复杂性使得理解和预测特定修饰对生物合成途径的具体影响变得困难。环境因素也能显著影响表观遗传修饰的状态,这就要求在研究和应用时必须考虑外部条件的变化。此外,不同的生物合成途径可能对表观遗传调控的敏感性不同,这意味着不能简单地将一种途径的研究结果推广到其他途径。在尝试通过表观共调控来增强或改变生物合成途径时,还必须考虑所引入修饰的长期稳定性和遗传稳定性,以确保生物合成途径的改变是持久和可靠的。最后,使用表观遗传修饰进行生物合成途径的研究和应用可能引发伦理和安全问题,特别是在涉及基因编辑和潜在的遗传改变时。因此,尽管表观共调控为生物合成途径的挖掘提供了新的可能性,但在实际操作中需要克服这些挑战,以实现其在这一领域的广泛应用。

6. 展望

本文深入探讨了多组学技术在生物合成途径挖掘中的应用。在此基础上,我们可以对本文的研究内容和未来发展方向进行展望。

(1) 植物生物合成途径的深入挖掘:植物是生产复杂次级代谢产物的重要生物资源。未来的研究可以利用多组学技术,尤其是整合基因组、转录组、蛋白组和代谢组数据,来揭示更多植物特有的生物合成途径。这将有助于发现新的生物活性化合物,以及通过基因工程手段提高现有化合物的产量和质量。

(2) 植物生长发育的精细调控网络:植物的生长发育是一个精确调控的过程。利用多组学技术,研究者可以揭示基因、蛋白质和代谢物之间的相互作用和调控网络,从而深入理解植物生长发育的分子基础。这对于揭示植物发育过程中的关键调控节点和潜在的调控机制具有重要意义。

(3) 植物表观遗传学的进一步探索:表观遗传学是植物遗传学的一个重要分支,它研究基因表达的非遗传调控机制。通过多组学技术,研究者可以分析DNA甲基化、组蛋白修饰等表观遗传修饰如何影响植物的基因表达和性状。这对于理解植物表型变异、遗传记忆和表观遗传继承等现象具有重要意义。

综上所述,未来的植物学研究将在多组学技术的帮助下,深入探索植物生物合成途径、逆境响应、生长发育调控、表观遗传学、进化和驯化、基因编辑和数据共享等领域,为植物遗传学和植物生物技术的发展提供新的理论和实践基础。

参考文献

[1] Perkins, J., Hayashi, T., Peakall, R., Flematti, G.R. and Bohman, B. (2023) The Volatile Chemistry of Orchid Pollination. Natural Product Reports, 40, 819-839.
https://doi.org/10.1039/d2np00060a
[2] Wong, D.C.J., Pichersky, E. and Peakall, R. (2023) Many Different Flowers Make a Bouquet: Lessons from Specialized Metabolite Diversity in Plant-Pollinator Interactions. Current Opinion in Plant Biology, 73, Article 102332.
https://doi.org/10.1016/j.pbi.2022.102332
[3] Marone, D., Mastrangelo, A.M., Borrelli, G.M., Mores, A., Laidò, G., Russo, M.A., et al. (2022) Specialized Metabolites: Physiological and Biochemical Role in Stress Resistance, Strategies to Improve Their Accumulation, and New Applications in Crop Breeding and Management. Plant Physiology and Biochemistry, 172, 48-55.
https://doi.org/10.1016/j.plaphy.2021.12.037
[4] Lim, P.T., Goh, B.H. and Lee, W. (2022) Taxol: Mechanisms of Action against Cancer, an Update with Current Research. In: Swamy, M.K., Pullaiah, T. and Chen, Z.-S., Eds., Paclitaxel, Academic Press, 47-71.
https://doi.org/10.1016/b978-0-323-90951-8.00007-2
[5] Xiong, X., Gou, J., Liao, Q., Li, Y., Zhou, Q., Bi, G., et al. (2021) The Taxus Genome Provides Insights into Paclitaxel Biosynthesis. Nature Plants, 7, 1026-1036.
https://doi.org/10.1038/s41477-021-00963-5
[6] 张发光, 曲戈, 孙周通, 马军安. 从化学合成到生物合成——天然产物全合成新趋势[J]. 合成生物学, 2021, 2(5): 674-696.
[7] Lai, M.J. and Lan, E.I. (2019) Photoautotrophic Synthesis of Butyrate by Metabolically Engineered Cyanobacteria. Biotechnology and Bioengineering, 116, 893-903.
https://doi.org/10.1002/bit.26903
[8] Voigt, C.A. (2020) Synthetic Biology 2020-2030: Six Commercially-Available Products That Are Changing Our World. Nature Communications, 11, Article No. 6379.
https://doi.org/10.1038/s41467-020-20122-2
[9] Kharissova, O.V., Kharisov, B.I., Oliva González, C.M., Méndez, Y.P. and López, I. (2019) Greener Synthesis of Chemical Compounds and Materials. Royal Society Open Science, 6, Article 191378.
https://doi.org/10.1098/rsos.191378
[10] Wang, J., Liu, J. and Yu, S. (2019) Recycling Valuable Elements from the Chemical Synthesis Process of Nanomaterials: A Sustainable View. ACS Materials Letters, 1, 541-548.
https://doi.org/10.1021/acsmaterialslett.9b00283
[11] Hansen, C.C., Sørensen, M., Bellucci, M., Brandt, W., Olsen, C.E., Goodger, J.Q.D., et al. (2022) Recruitment of Distinct UDP‐Glycosyltransferase Families Demonstrates Dynamic Evolution of Chemical Defense within Eucalyptus L’Hér. New Phytologist, 237, 999-1013.
https://doi.org/10.1111/nph.18581
[12] Scherlach, K. and Hertweck, C. (2021) Mining and Unearthing Hidden Biosynthetic Potential. Nature Communications, 12, Article No. 3864.
https://doi.org/10.1038/s41467-021-24133-5
[13] Singh, K.S., van der Hooft, J.J.J., van Wees, S.C.M. and Medema, M.H. (2022) Integrative Omics Approaches for Biosynthetic Pathway Discovery in Plants. Natural Product Reports, 39, 1876-1896.
https://doi.org/10.1039/d2np00032f
[14] Zhao, K. and Rhee, S.Y. (2022) Omics-Guided Metabolic Pathway Discovery in Plants: Resources, Approaches, and Opportunities. Current Opinion in Plant Biology, 67, Article 102222.
https://doi.org/10.1016/j.pbi.2022.102222
[15] Shen, S., Zhan, C., Yang, C., Fernie, A.R. and Luo, J. (2023) Metabolomics-Centered Mining of Plant Metabolic Diversity and Function: Past Decade and Future Perspectives. Molecular Plant, 16, 43-63.
https://doi.org/10.1016/j.molp.2022.09.007
[16] Jiang, B., Gao, L., Wang, H., Sun, Y., Zhang, X., Ke, H., et al. (2024) Characterization and Heterologous Reconstitution of Taxus Biosynthetic Enzymes Leading to Baccatin III. Science, 383, 622-629.
https://doi.org/10.1126/science.adj3484
[17] Li, J., Mutanda, I., Wang, K., Yang, L., Wang, J. and Wang, Y. (2019) Chloroplastic Metabolic Engineering Coupled with Isoprenoid Pool Enhancement for Committed Taxanes Biosynthesis in Nicotiana benthamiana. Nature Communications, 10, Article No. 4850.
https://doi.org/10.1038/s41467-019-12879-y
[18] Wang, Y., Huang, J., Tian, T., Yan, Y., Chen, Y., Yang, J., et al. (2022) Discovery and Engineering of the Cocaine Biosynthetic Pathway. Journal of the American Chemical Society, 144, 22000-22007.
https://doi.org/10.1021/jacs.2c09091
[19] Wang, S., Liu, L., Mi, X., Zhao, S., An, Y., Xia, X., et al. (2021) Multi‐Omics Analysis to Visualize the Dynamic Roles of Defense Genes in the Response of Tea Plants to Gray Blight. The Plant Journal, 106, 862-875.
https://doi.org/10.1111/tpj.15203
[20] Wang, N. and Huo, Y. (2022) Using Genome and Transcriptome Analysis to Elucidate Biosynthetic Pathways. Current Opinion in Biotechnology, 75, Article 102708.
https://doi.org/10.1016/j.copbio.2022.102708
[21] Polturak, G., Liu, Z. and Osbourn, A. (2022) New and Emerging Concepts in the Evolution and Function of Plant Biosynthetic Gene Clusters. Current Opinion in Green and Sustainable Chemistry, 33, Article 100568.
https://doi.org/10.1016/j.cogsc.2021.100568
[22] Smit, S.J. and Lichman, B.R. (2022) Plant Biosynthetic Gene Clusters in the Context of Metabolic Evolution. Natural Product Reports, 39, 1465-1482.
https://doi.org/10.1039/d2np00005a
[23] Nützmann, H. and Osbourn, A. (2014) Gene Clustering in Plant Specialized Metabolism. Current Opinion in Biotechnology, 26, 91-99.
https://doi.org/10.1016/j.copbio.2013.10.009
[24] Nützmann, H., Huang, A. and Osbourn, A. (2016) Plant Metabolic Clusters—From Genetics to Genomics. New Phytologist, 211, 771-789.
https://doi.org/10.1111/nph.13981
[25] Frey, M., Chomet, P., Glawischnig, E., Stettner, C., Grün, S., Winklmair, A., et al. (1997) Analysis of a Chemical Plant Defense Mechanism in Grasses. Science, 277, 696-699.
https://doi.org/10.1126/science.277.5326.696
[26] Ferruz, N., Schmidt, S. and Höcker, B. (2021) Proteintools: A Toolkit to Analyze Protein Structures. Nucleic Acids Research, 49, W559-W566.
https://doi.org/10.1093/nar/gkab375
[27] Sun, J., Lu, F., Luo, Y., Bie, L., Xu, L. and Wang, Y. (2023) OrthoVenn3: An Integrated Platform for Exploring and Visualizing Orthologous Data across Genomes. Nucleic Acids Research, 51, W397-W403.
https://doi.org/10.1093/nar/gkad313
[28] Chavali, A.K. and Rhee, S.Y. (2017) Bioinformatics Tools for the Identification of Gene Clusters That Biosynthesize Specialized Metabolites. Briefings in Bioinformatics, 19, 1022-1034.
https://doi.org/10.1093/bib/bbx020
[29] Amos, G.C.A., Awakawa, T., Tuttle, R.N., Letzel, A., Kim, M.C., Kudo, Y., et al. (2017) Comparative Transcriptomics as a Guide to Natural Product Discovery and Biosynthetic Gene Cluster Functionality. Proceedings of the National Academy of Sciences, 114, E11121-E11130.
https://doi.org/10.1073/pnas.1714381115
[30] Zhan, C., Shen, S., Yang, C., Liu, Z., Fernie, A.R., Graham, I.A., et al. (2022) Plant Metabolic Gene Clusters in the Multi-Omics Era. Trends in Plant Science, 27, 981-1001.
https://doi.org/10.1016/j.tplants.2022.03.002
[31] Liu, M., Li, Y. and Li, H. (2022) Deep Learning to Predict the Biosynthetic Gene Clusters in Bacterial Genomes. Journal of Molecular Biology, 434, Article 167597.
https://doi.org/10.1016/j.jmb.2022.167597
[32] Zhang, X., Liu, C., Dai, J., Yuan, Y., Gao, C., Feng, Y., et al. (2023) Enabling Technology and Core Theory of Synthetic Biology. Science China Life Sciences, 66, 1742-1785.
https://doi.org/10.1007/s11427-022-2214-2
[33] Depuydt, T., De Rybel, B. and Vandepoele, K. (2023) Charting Plant Gene Functions in the Multi-Omics and Single-Cell Era. Trends in Plant Science, 28, 283-296.
https://doi.org/10.1016/j.tplants.2022.09.008
[34] Hemenway, E.A. and Gehring, M. (2023) Epigenetic Regulation during Plant Development and the Capacity for Epigenetic Memory. Annual Review of Plant Biology, 74, 87-109.
https://doi.org/10.1146/annurev-arplant-070122-025047
[35] Zhang, W., Zeng, Y., Jiao, M., Ye, C., Li, Y., Liu, C., et al. (2023) Integration of High-Throughput Omics Technologies in Medicinal Plant Research: The New Era of Natural Drug Discovery. Frontiers in Plant Science, 14, Article 1073848.
https://doi.org/10.3389/fpls.2023.1073848
[36] Butte, A.J. and Kohane, I.S. (2003) Relevance Networks: A First Step toward Finding Genetic Regulatory Networks within Microarray Data. In: Parmigiani, G., Garrett, E.S., Irizarry, R.A. and Zeger, S.L., Eds., The Analysis of Gene Expression Data, Springer, 428-446.
https://doi.org/10.1007/0-387-21679-0_19
[37] Piya, S., Pantalone, V., Zadegan, S.B., Shipp, S., Lakhssassi, N., Knizia, D., et al. (2023) Soybean Gene Co‐Expression Network Analysis Identifies Two Co‐Regulated Gene Modules Associated with Nodule Formation and Development. Molecular Plant Pathology, 24, 628-636.
https://doi.org/10.1111/mpp.13327
[38] Guo, C., Xie, B. and Liu, Q. (2022) Weighted Gene Co-Expression Network Analysis Combined with Machine Learning Validation to Identify Key Hub Biomarkers in Colorectal Cancer. Functional & Integrative Genomics, 23, Article No. 24.
https://doi.org/10.1007/s10142-022-00949-2
[39] Zhang, A., Zhang, Q., Li, J., Gong, H., Fan, X., Yang, Y., et al. (2020) Transcriptome Co-Expression Network Analysis Identifies Key Genes and Regulators of Ripening Kiwifruit Ester Biosynthesis. BMC Plant Biology, 20, Article No. 103.
https://doi.org/10.1186/s12870-020-2314-9
[40] Alcantar, M.A., English, M.A., Valeri, J.A. and Collins, J.J. (2024) A High-Throughput Synthetic Biology Approach for Studying Combinatorial Chromatin-Based Transcriptional Regulation. Molecular Cell, 84, 2382-2396.E9.
https://doi.org/10.1016/j.molcel.2024.05.025
[41] Farhadian, M., Rafat, S.A., Panahi, B. and Mayack, C. (2021) Weighted Gene Co-Expression Network Analysis Identifies Modules and Functionally Enriched Pathways in the Lactation Process. Scientific Reports, 11, Article No. 2367.
https://doi.org/10.1038/s41598-021-81888-z
[42] Ng, M. and Yanofsky, M.F. (2001) Function and Evolution of the Plant Mads-Box Gene Family. Nature Reviews Genetics, 2, 186-195.
https://doi.org/10.1038/35056041
[43] Bélanger, S., Zhan, J. and Meyers, B.C. (2023) Phylogenetic Analyses of Seven Protein Families Refine the Evolution of Small RNA Pathways in Green Plants. Plant Physiology, 192, 1183-1203.
https://doi.org/10.1093/plphys/kiad141
[44] Blázquez, M.A., Nelson, D.C. and Weijers, D. (2020) Evolution of Plant Hormone Response Pathways. Annual Review of Plant Biology, 71, 327-353.
https://doi.org/10.1146/annurev-arplant-050718-100309
[45] Waite, J.M. and Dardick, C. (2021) The Roles of the IGT Gene Family in Plant Architecture: Past, Present, and Future. Current Opinion in Plant Biology, 59, Article 101983.
https://doi.org/10.1016/j.pbi.2020.101983
[46] Zhang, J., Fu, X., Li, R., Zhao, X., Liu, Y., Li, M., et al. (2020) The Hornwort Genome and Early Land Plant Evolution. Nature Plants, 6, 107-118.
https://doi.org/10.1038/s41477-019-0588-4
[47] Man, J., Gallagher, J.P. and Bartlett, M. (2020) Structural Evolution Drives Diversification of the Large LRR‐RLK Gene Family. New Phytologist, 226, 1492-1505.
https://doi.org/10.1111/nph.16455
[48] Jaenisch, R. and Bird, A. (2003) Epigenetic Regulation of Gene Expression: How the Genome Integrates Intrinsic and Environmental Signals. Nature Genetics, 33, 245-254.
https://doi.org/10.1038/ng1089
[49] Moore, L.D., Le, T. and Fan, G. (2012) DNA Methylation and Its Basic Function. Neuropsychopharmacology, 38, 23-38.
https://doi.org/10.1038/npp.2012.112
[50] Bannister, A.J. and Kouzarides, T. (2011) Regulation of Chromatin by Histone Modifications. Cell Research, 21, 381-395.
https://doi.org/10.1038/cr.2011.22
[51] Mattick, J.S., Amaral, P.P., Carninci, P., Carpenter, S., Chang, H.Y., Chen, L., et al. (2023) Long Non-Coding RNAs: Definitions, Functions, Challenges and Recommendations. Nature Reviews Molecular Cell Biology, 24, 430-447.
https://doi.org/10.1038/s41580-022-00566-8
[52] Gibney, E.R. and Nolan, C.M. (2010) Epigenetics and Gene Expression. Heredity, 105, 4-13.
https://doi.org/10.1038/hdy.2010.54
[53] Escrich, A., Cusido, R.M., Bonfill, M., Palazon, J., Sanchez-Muñoz, R. and Moyano, E. (2022) The Epigenetic Regulation in Plant Specialized Metabolism: DNA Methylation Limits Paclitaxel in vitro Biotechnological Production. Frontiers in Plant Science, 13, Article 899444.
https://doi.org/10.3389/fpls.2022.899444
[54] Lin, X., Han, H., Wang, N., Wang, C., Qi, M., Wang, J., et al. (2024) The Gut Microbial Regulation of Epigenetic Modification from a Metabolic Perspective. International Journal of Molecular Sciences, 25, Article 7175.
https://doi.org/10.3390/ijms25137175