棉花WRKY转录因子研究进展
Literature Review of Plant WRKY Transcription Factors
摘要: 植物在生长发育过程中会受到体内转录因子的调控以适应环境的变化,而WRKY家族是植物中数量排名第二的转录因子大家族,该家族每个成员都有一个高度保守的WRKY结构域,能与W盒特异性结合,调控下游目标基因的表达,参与植物的胁迫反应、生长发育等。棉花在我国是仅次于粮食的第二大农作物,随着棉花全基因组测序完成,近年来棉花WRKY转录因子的全基因组分析和基因功能研究得以开展,本文对棉花WRKY转录因子研究进展的综述将对棉花WRKY转录因子的后续研究方向提供新视角。
Abstract: Plants in the process of growth and development will be affected by the regulation of transcription factors in the body to adapt to the changes in the environment. The WRKY family in plants is ranked second transcription factor family, and every member in the family has a highly conserved WRKY domain, which can combine with W box to regulate the expression of downstream target genes and involve in plant stress responses, growth and development. In China, cotton is the second largest crop after food. With the completion of the genome sequencing of cotton, the genome-wide analysis and gene function research of cotton WRKY transcription factor genes have been carried out in recent years. The review of the research progress of cotton WRKY transcription factors in this paper will provide a new perspective for the future research of cotton WRKY transcription factors.
文章引用:刘超, 袁洁, 向浏欣. 棉花WRKY转录因子研究进展[J]. 农业科学, 2020, 10(8): 628-633. https://doi.org/10.12677/HJAS.2020.108094

1. 引言

转录因子是一种具有特殊结构的蛋白质分子,它具有DNA结合域可以与基因5’端上游某些顺式作用元件特异性结合,对基因的转录起抑制或激活作用。一个典型的转录因子结构应当包括:DNA的结合位点,转录激活域/转录抑制域,寡聚合位点以及细胞核定位点等几个功能结构域 [1]。转录因子在所有植物基因组中有相当高的比例,如NAC、WRKY、MYB、bHLH、bZIP等多个转录因子家族,其靶基因广泛参与植物发育和胁迫防御等生理过程 [2]。

WRKY转录因子仅次于NAC转录因子家族,为第二大转录因子家族 [3]。至目前,WRKY转录因子在多种植物中被科学家们研究,如拟南芥、水稻、小麦、葡萄等,发现其参与植物的生长发育、衰老调节、抗病、抗机械损伤、非生物胁迫响应、植物激素反应等。棉花在我国是仅次于粮食的第二大农作物,但我国原棉总量与品级无法满足纺织需求,每年还需大量进口原棉。随着2012年至2015年亚洲棉、雷蒙德氏棉、陆地棉和海岛棉全基因组测序的陆续完成,WRKY转录因子在棉花中的分析和研究近年得到不少成果,如功能研究发现其在棉花生长发育、非生物胁迫和抗病中发挥作用。本文首先总结了WRKY转录因子的起源与结构特征,然后综述了其在棉花中的研究进展,为WRKY转录因子在棉花中的后续研究方向提供新视角和基础。

2. WRKY转录因子的起源与结构

2.1. WRKY转录因子的起源

1994年,科学家们鉴定出第一个WRKY转录因子——SPF1,它在甘薯的根块中表达,可以结合在三个分别编码储藏蛋白和β-淀粉酶的基因启动子上 [4]。后来,科研人员也在其他植物中发现了WRKY转录因子。最初,人们一直认为WRKY转录因子是植物所特有的,直到2005年从单细胞原生生物蓝氏贾第鞭毛虫、粘菌——盘基网柄菌和单细胞绿藻——莱因哈德衣藻中证实也含有可能编码WRKY基因的序列 [5] [6] [7]。因此推测,在真核生物出现以后、蓝氏贾第鞭毛虫存在之前,WRKY基因就已经进化形成了 [5]。

2.2. WRKY转录因子的结构

2.2.1. WRKY转录因子的结构域特征

随着生物信息学的发展和测序技术的成熟,WRKY转录因子在许多植物中被鉴定并进行全基因组分析,在各种植物中的数量都不一样,最新更新的数据显示,在春小麦中鉴定了297个WRKY基因 [8],甜菜中有58个 [9],胡椒中有62个 [10],枣中有54个 [11]。这些WRKY蛋白都约由58~60个氨基酸组成,含有两个明显的结构特征,一个是位于N端的高度保守的WRKYGQK特征结构序列,另一个是位于C端的锌指结构C2H2或者C2HC。靠近N末端的7个保守氨基酸残基WRKYGQK被视为WRKY结构域的核心,它们的变异往往导致DNA的结合活性减弱或者丧失 [12];羧基C末端的锌指类似结构在植物的进化中可能起到重要作用 [13]。WRKY结构域虽然高度保守,但在某些WRKY蛋白中,还是存在许多变异的情况,比如WRKYGEK、WRKYGKK、WRICGQC、WRMCGQK、WKKYGQK、WIKYGQK、WKRYGQK、WSKYEQK、WRKYSEK等 [14]。

2.2.2. WRKY家族的分类

人们根据WRKY结构域的数量和锌指基序的类型,将WRKY转录因子家族主要分为三个组:组I,组II和组III,第I组WRKY蛋白包含两个WRKY结构域,第II组和III组均只包含一个WRKY结构域,第II组的锌指结构基序为C2H2,第III组的锌指结构基序为C2HC,而第II组WRKY蛋白又可根据系统发育分析方法进一步分为5个亚组:IIa、IIb、IIc、IId、IIe [15]。通常在同一种植物中,大多数WRKY转录因子属于第II组,第II组又细分为5个小亚组,所以第II组成员的数量相对较多,而第I组和第III组成员数量要少一些。

2.2.3. WRKY结构域与W-盒

WRKY转录因子能与基因启动子区域内某段特定的碱基序列结合,这段特定的碱基序列被称为W-盒。W-盒的核心序列是TTGACC/T片段,其中TGAC高度保守 [16] [17]。曾报道其中一个核苷酸的突变都将使转录因子与基因的结合活性明显降低甚至完全消失 [18]。说明TGAC这段碱基核心序列对于与WRKY转录因子的特异性结合来说至关重要且必不可少。在植物受到病原菌侵害时,植物体内许多基因表达调控,参与防卫反应,而这些基因的启动子区域内常常含有W-盒。一些防御相关的基因,如PR、NPRl基因,启动子区域都包含w-盒元件 [19] [20]。与此同时,某些WRKY转录因子本身的启动子区域内也含有W-盒,例如研究人员在陆地棉GhWRKY42基因本身就发现有W盒 [21]。

3. 棉花WRKY转录因子研究进展

3.1. 棉花WRKY转录因子全基因组分析

陆地棉与藻类植物(红藻、绿藻)、苔藓植物、单子叶植物(玉米、稻)、和双子叶植物(毛果、拟南芥)等的WRKY结构域一起构建进化树,分组发现II组成员形成三个不同的分支:IIa + IIb组,IIc,IId + IIe组,其中IIa、IIb组密切相关,IId、IIe组紧密联系 [22]。这种组内紧密的关系在雷蒙德氏棉中也发现了,先前研究人员用雷蒙德氏棉的WRKY结构域与拟南芥结构域一起构建进化树,分析发现IIa组和IIb组的基因密切相关,IId组的基因与IIe组聚在一起 [23]。

此外,在陆地棉与藻类、苔藓、单双子叶植物的进化树中还发现IIa + IIb组、IIc组都与IC组紧密相关,同时,IId + IIe组与III组密切相关。有趣的是,藻类,石松植物(lycophyta)和苔藓植物的WRKY结构域主要分为IC、IIc、IIb、IN、IId和III类,没有划入IIa组。这种现象可能表明IIa组可能从IIb组演化而来的,这说明IIb、IIc、IId、III组可能是由I组演化而来 [22]。在水稻中,报道了水稻中的某些II组WRKY基因可能是通过丢失N或C端WRKY结构域而从I组进化而来的 [24]。研究人员将雷蒙德氏棉与亚洲棉的WRKY结构域进行比对支持这一假设,并表明在棉花中,IId和III组WRKY基因可能在丢失N端或C端WRKY结构域后从I组进化而来 [25]。

在雷蒙德氏棉中,基于序列比较和进化树分析,发现IIc组中的基因比其他WRKY组中的基因共享更多的变异(80%),这表明IIc组中的WRKY基因比其他II组中的基因更加活跃和可变 [23]。对雷蒙德氏棉各组进行功能差异分析,以查看各组之间是否存在任何潜在的重要氨基酸残基的功能差异,结果表明,雷蒙德氏棉第III类WRKY基因可能具有不同的功能,在这些组中,与IIc组基因相比,第I组WRKY基因氨基酸变异最少,仅具有一个位点改变的,但是,在IIa组到IIe组中,有许多位点改变导致序列之间的功能差异,例如在IIb和IId之间鉴定出21个位点,在IIa和IIe之间鉴定出13个位点,在IIa-IIe亚组中,检测到的这些功能上重要的氨基酸位点被取代,表明IIa-IIe组基因的功能可能已经独立进化 [25]。

在雷蒙德氏棉与亚洲棉的WRKY基因的蛋白序列构建的进化树中,第III组WRKY基因的数量与拟南芥,可可和葡萄中相似,但在I和IIa-IIe组中含有几乎可可、葡萄两倍的WRKY基因,这主要是因为在棉花进化过程中发生了大规模的复制事件,并促进了WRKY基因的扩增,主要是I和IIa–IIe组中WRKY基因扩增的结果 [25]。亚洲棉的WRKY基因可能由于保守的二倍体A组和D组WRKY蛋白水平较高,从而与G.雷蒙德氏WRKY基因共享相同的亲缘关系 [25]。在二倍体棉花雷蒙德氏棉和亚洲棉之间比较A染色体和D 染色体WRKY基因的基因和蛋白质序列,发现两个二倍体棉种之间存在相似的基因结构。该结果还与以下事实相吻合:在外显子区域中检测到较少的SNP,并且WRKY核心域中的蛋白质氨基酸较少变化。这些结果说明在亚洲棉和G.雷蒙德氏棉中WRKY基因功能较保守的。相比雷蒙德氏棉,亚洲棉的第一类中的一个WRKY结构域显示出许多变化,说明该结构域可能进化出了一种新功能 [25]。

3.2. 棉花WRKY转录因子的功能研究

在棉花中,WRKY转录因子参与植物的生长发育与胁迫反应。在生长发育和衰老方面,研究人员分离并鉴定了来自陆地棉的IId亚组基因GhWRKY42检测到GhWRKY42在病毒诱导的基因沉默(VIGS)植物的茎中表达水平较高,并且增强了GUS活性,降低了植物株高,因此,推测GhWRKY42可能与茎发育有关 [21]。在早衰棉花品种CCRI10和非早衰品种Liao4086的子叶样品中检测到GhWRKY42的表达水平,qRT-PCR的结果显示,在转录水平GhWRKY42在CCRI10品种子叶逐渐衰老过程中增加,并且均显著高于Liao4086品种,因此,GhWRKY42可能参与衰老过程,并可能在叶片衰老过程中发挥积极的调节作用 [21]。对陆地棉IIa组成员进行表达谱分析,在叶片衰老的不同时期检测不同组织中IIa组GhWRKY基因的表达,发现GhWRKY49,GhWRKY168和GhWRKY169在圆环中高度表达,表明在花发育中具有潜在作用 [26]。qRT-PCR结果表明,IIa组GhWRKY17,GhWRKY39和GhWRKY140在花器官和茎中表现出高表达水平,并且在叶片衰老的初期也高表达,因此,推测这三个高表达基因在调节棉花发育和叶片衰老中起重要作用 [26]。分析陆地棉叶片不同衰老时期的基因表达谱,发现第III组的成员GhWRKY27是由叶片衰老诱导的,主要在早衰品种中表达,所以,推测GhWRKY27可能通过与其他基因的相互作用或转录调控来积极调节叶片衰老 [27]。也有研究发现I组的成员(GhWRKY3,83和97)不仅在非生物胁迫和纤维发育阶段表达,而且在叶片衰老、花药发育、根,茎、叶和胚中高表达 [22]。

在非生物胁迫方面,在冷、盐、ABA、干旱和碱条件下发现陆地棉中IID(GhWRKY81),IIC组(GhWRKY15),III组(GhWRKY7,89)和Ⅱa组(GhWRKY71,84和73)成员在这五中不同的胁迫条件下都有响应,并且有超过对照组两倍的表达水平的变化,这表明这些常见的上调的GhWRKY基因可能参与信号通路之间的串扰,以调节这五种压力 [22]。在拟南芥中过表达陆地棉中第III组成员GhWRKY33,用不同浓度的甘露醇处理后发现,与野生型相比,转基因拟南芥的种子发芽率降低,并且根的生长明显被抑制,这表明,GhWRKY33转基因拟南芥植物在种子萌发和幼苗早期生长过程中表现出干旱敏感性。当暴露于干旱中时,GhWRKY33转基因拟南芥的气孔比野生型开放,失水率更高,所以推测GhWRKY33可能通过与干旱相关基因和ABA反应基因的启动子区域中的W-box结合而直接或间接调节干旱相关基因和ABA反应基因的表达,从而响应干旱胁迫和ABA信号传导 [28]。

在抗病防御方面,分析陆地棉IId亚组基因GhWRKY11,发现GhWRKY11基因在通过部分防御信号时表达上调 [29]。此外,GhWRKY11-过表达植物通过SA依赖性信号传导途径显示出对病毒攻击的增强抗性,随后减少了H2O2积累 [29]。因此,研究人员推测GhWRKY11可能在调节植物病原体防御反应中发挥重要作用 [29]。

4. 结论与展望

本文从WRKY转录因子的起源开始,介绍WRKY转录因子的结构特征以及它们家族的分类,然后阐述WRKY转录因子在棉花中的全基因组分析情况和生物学功能。WRKY转录因子最开始在甘薯中鉴定出来,但目前已在越来越多的植物中发现了它的身影,在模式植物拟南芥、水稻中被广泛研究,它在各类其他植物如胡椒、枣、苹果等中行使的某些功能也慢慢被研究人员阐明。经对WRKY转录因子在棉花中的研究总结发现,研究物种具有偏向性,WRKY转录因子在陆地棉和雷蒙德氏棉中的研究较多,而在海岛棉、亚洲棉中的报道较少。可能是因为海岛棉的全基因组测序较晚公开,但海岛棉因为品质优良、纤维柔长,在我国主要用来纺织高支纱,而国内适合纺高支纱的原棉稀缺,原棉总量与品级无法满足纺织需求,每年需大量进口原棉,因此,在这种现状下,研究海岛棉并帮助其提高棉纤维质量就显得非常重要。另外,大量的植物WRKY基因功能研究包括棉花WRKY基因的研究报道是从表达分析总结WRKY基因的功能,严重缺乏功能的深入研究和机制研究,因此,WRKY转录因子基因功能的机制亟待深入研究。本文对WRKY转录因子的起源与结构特征的总结将对棉花WRKY基因功能的机制研究提供帮助,最终促进棉花分子育种,以获得抗病性高、棉纤维质量和产量高的棉花新品种。

NOTES

*通讯作者。

参考文献

[1] Schwechheimer, M.Z. and Bevan, M.W. (1998) Plant Transcription Factor Studies. Annual Review of Plant Physiology and Plant Molecular Biology, 49, 127-150.
https://doi.org/10.1146/annurev.arplant.49.1.127
[2] Jin, J., et al. (2014) PlantTFDB 3.0: A Portal for the Functional and Evolutionary Study of Plant Transcription Factors. Nucleic Acids Research, 42, D1182-D1187.
https://doi.org/10.1093/nar/gkt1016
[3] Guo, Y., Cai, Z. and Gan, S. (2004) Tran-scriptome of Arabidopsis Leaf Senescence. Plant, Cell & Environment, 27, 521-549.
https://doi.org/10.1111/j.1365-3040.2003.01158.x
[4] Ishiguro, S., and Nakamura, K. (1994) Characterization of a cDNA Encoding a Novel DNA-Binding Protein, SPF1, That Recognizes SP8 Sequences in the 5’ Upstream Regions of Genes Coding for Sporamin and β-Amylase from Sweet Potato. Molecular Genetics and Genomics, 244, 563-571.
https://doi.org/10.1007/BF00282746
[5] Wu, K.L., Guo, Z., Wang, H.H. and Li, J. (2005) The WRKY Family of Transcription Factors in Ice and Arabidopsis and Their Origins. DNA Research, 12, 9-26.
https://doi.org/10.1093/dnares/12.1.9
[6] Eulgem, T., Rushton, P.J., Schmelzer, E., et al. (1999) Early Nuclear Events in Plant Defence Signalling: Rapid Gene Activation by WRKY Transcription Factors. Embo Journal, 18, 4689-4699.
https://doi.org/10.1093/emboj/18.17.4689
[7] Ulker, B. and Somssich, I.E. (2004) WRKY Tra-nacipion Factors: From DNA Binding towards Biological, Function. Current Opinion in Plant Biology, 7, 491-498.
https://doi.org/10.1016/j.pbi.2004.07.012
[8] Hassan, S., Lethin, J., Blomberg, R., et al. (2019) In Silico Based Screening of WRKY Genes for Identifying Functional Genes Regulated by WRKY under Salt Stress. Computational Bi-ology and Chemistry, 83, Article ID: 107131.
https://doi.org/10.1016/j.compbiolchem.2019.107131
[9] Wang, W., Sun, Y.Q., Li, G.L., et al. (2019) Ge-nome-Wide Identification, Characterization, and Expression Patterns of the BZR Transcription Factor Family in Sugar Beet (Beta vulgaris L.). BMC Plant Biology, 19, e7817.
https://doi.org/10.1186/s12870-019-1783-1
[10] Zheng, J., Liu, F., Zhu, C., et al. (2019) Identification, Expression, Alternative Splicing and Functional Analysis of Pepper WRKY Gene Family in Response to Biotic and Abiotic Stresses. PLoS ONE, 14, e0219775.
https://doi.org/10.1371/journal.pone.0219775
[11] Xue, C., Li, H., Liu, Z., et al. (2019) Genome-Wide Analysis of the WRKY Gene Family and Their Positive Responses to Phytoplasma Invasion in Chinese Jujube. BMC Genomics, 20, 464.
https://doi.org/10.1186/s12864-019-5789-8
[12] Maeo, K., Hayashi, S., Kojima-Suzuki, H., et al. (2001) Role of Conserved Residues of the WRKY Domain in the DNA-Binding of Tobacco WRKY Family Proteins. Bioscience, Bi-otechnology, and Biochemistry, 65, 2428-2436.
https://doi.org/10.1271/bbb.65.2428
[13] Xie, Z., Zhang, Z.L., Zou, X., et al. (2005) Annotations and Functional Analyses of the Rice WRKY Gene Superfamily Reveal Positive and Negative Regulators of Abscisic Acid Signaling in Aleuronecells. Plant Physiology, 137, 176-189.
https://doi.org/10.1104/pp.104.054312
[14] Zhang, Y.J. and Wang, L.J. (2005) The WRKY Transcription Factor Supertamily: Its Origin in Eukaryotes and Expansion in Plants. BMC Evolutionary Biology, 5, 1-12.
https://doi.org/10.1186/1471-2148-5-1
[15] Thomas Eulgem, P.J.R., Robatzek, S. and Somssich, L.E. (2000) The WRKY Superfamily of Plant Transcription Factors. Rends in Plant Science, 5, 1360-1385.
https://doi.org/10.1016/S1360-1385(00)01600-9
[16] Rushton, P.J., Macdonald, H., Hutly, A.K., Lazarus, C.M. and Hooley, R. (1995) Members of a New Family of DNA- Binding Proteins Bind to a Conserved Cis-Element in the Promoters of a-Amy2 Genes. Plant Molecular Biology, 29, 691-702.
https://doi.org/10.1007/BF00041160
[17] Rushton, P., Somssich, I.E., Ringler, P. and Shen, Q.J. (2010) WRKY Transcription Factors. Trends in Plant Science, 15, 247-258.
https://doi.org/10.1016/j.tplants.2010.02.006
[18] Yu, D., Chen, C. and Chen, Z. (2001) Evidence for an Important Role of WRKY DNA Binding Proteins in the Regulation of NPR1 Gene Expression. The Plant Cell, 13, 1527-1540.
https://doi.org/10.1105/TPC.010115
[19] Turck, F., Zhou, A. and Somssich, I.E. (2004) Stimulus-Dependent, Promoter-Specific Binding of Transcription Factor WRKY1 to Its Native Promoter and the Defense-Related Gene PcPR1-1 in Parsley. The Plant Cell, 16, 2573-2585.
https://doi.org/10.1105/tpc.104.024810
[20] Rocher, A., Dumas, C. and Cock, J.M. (2005) A W-Box Is Required for Full Expression of the SA-Responsive Gene SFR2. Gene, 344, 181-192.
https://doi.org/10.1016/j.gene.2004.09.016
[21] Gu, L., Wei, H., Wang, H., et al. (2018) Characterization and Functional Analysis of GhWRKY42, a Group IId WRKY Gene, in Upland Cotton (Gossypium hirsutum L.). BMC Ge-netics, 19, 48.
https://doi.org/10.1186/s12863-018-0653-4
[22] Dou, L., Zhang, X., Pang, C., et al. (2014) Genome-Wide Analy-sis of the WRKY Gene Family in Cotton. Molecular Genetics and Genomics, 289, 1103-1121.
https://doi.org/10.1007/s00438-014-0872-y
[23] Cai, C.P., et al. (2014) Genome-Wide Analysis of the WRKY Transcription Factor Gene Family in Gossypium raimondii and the Expression of Orthologs in Cultivated Tetraploidcot-ton. The Crop Journal, 2, 87-101.
https://doi.org/10.1016/j.cj.2014.03.001
[24] Dai, X., Wang, Y. and Zhang, W.H. (2015) OsWRKY74, a WRKY Transcription Factor, Modulates Tolerance to Phosphate Starvation in Rice. Journal of Experimental Botany, 67, 947-960.
https://doi.org/10.1093/jxb/erv515
[25] Ding, M., Chen, J., Jiang, Y., et al. (2015) Genome-Wide Investigation and Transcriptome Analysis of the WRKY Gene Family in Gossypium. Molecular Genetics and Genomics, 290, 151-171.
https://doi.org/10.1007/s00438-014-0904-7
[26] Gu, L., Li, L., Wei, H., et al. (2018) Identification of the Group IIa WRKY Subfamily and the Functional Analysis of GhWRKY17 in Upland Cotton (Gossypium hirsutum L.). PLoS ONE, 13, e0191681.
https://doi.org/10.1371/journal.pone.0191681
[27] Gu, L., Dou, L., Guo, Y., et al. (2019) The WRKY Transcrip-tion Factor GhWRKY27 Coordinates the Senescence Regulatory Pathway in Upland Cotton (Gossypium hirsutum L.). BMC Plant Biology, 19, 116.
https://doi.org/10.1186/s12870-019-1688-z
[28] Wang, N.N., Xu, S.W., Sun, Y.L., et al. (2019) The Cotton WRKY Transcription Factor (GhWRKY33) Reduces Transgenic Arabidopsis Resistance to Drought Stress. Scientific Reports, 9, Article No. 724.
https://doi.org/10.1038/s41598-018-37035-2
[29] Sun, J., An, H., Shi, W., et al. (2012) Molecular Cloning and Characterization of GhWRKY11, a Gene Implicated in Pathogen Responses from Cotton. South African Journal of Botany, 81, 113-123.
https://doi.org/10.1016/j.sajb.2012.06.005