1. 引言
【研究意义】小麦(Triticum aestivum)是世界第二大粮食作物,培育抗病、抗倒、节水、抗逆、广适、养分高效的小麦品种尤为重要。加强小麦重要性状功能基因克隆和功能标记开发,能够加快小麦遗传改良进程,缩短育种年限,提高育种效率 [1]。未知功能域蛋白家族DUF642 (Domain of Unknown Function 642, DUF642)是种子植物中特有的未知功能的细胞壁相关蛋白,含有1~2个高度保守的DUF642结构域 [2],它不仅参与细胞壁的形成,影响植物的生长发育 [3],而且在抵御逆境胁迫如干旱、盐和铝毒胁迫,病原微生物侵染等方面发挥着重要的功能,对提高小麦产量具有潜在的应用价值。
【前人研究进展】拟南芥(Arabidopsis thaliana) DUF642基因At4g32460被定位在细胞壁 [4],它参与了果胶甲基酯酶(Pectin methyl esterase, PME)在种子萌发和植株发育中的调控 [5]。拟南芥DUF642蛋白At2g41800在根、柱头和下胚轴中表达,其突变体能够使幼苗的下胚轴长度增加,说明该基因参与下胚轴的伸长 [6]。研究表明,DUF642蛋白家族基因积极响应植物的非生物胁迫。编码籽粒苋(Amaranthus hypochondriacus) DUF642蛋白的基因AhDGR2能够改变细胞壁的结构和组成,在干旱和盐胁迫下表达量发生显著变化,并且可以诱导转基因拟南芥对盐和脱落酸(Abscisic acid, ABA)的高敏感性 [7]。在对水稻(Oryza sativa) DUF642家族基因的研究中发现,OsDUF642基因可能参与ABA介导的非生物逆境响应,例如高温、干旱、盐胁迫等 [8]。在研究玉米(Zea mays) DUF642蛋白家族时,也发现了多个能够强烈响应干旱、盐和铝胁迫的基因 [9]。另外,拟南芥DUF642基因At5g25460和At3g08030可受细菌侵染诱导表达。在接种青枯雷尔氏菌(Ralstonia solanacearum)后At5g25460表达量下调 [10],在接种带化红球菌(Rhodococcus fascians)后At3g08030表达量上调 [11]。在陆地棉(Gossypium hirsutum) DUF642蛋白家族的研究中发现,6个GhDUF642基因受黄萎病菌诱导差异表达,并通过VIGS技术证明陆地棉DUF642基因参与了棉花抗黄萎病过程 [12]。研究从中国葡萄(Vitis. quinquangularis)丹凤2号中克隆的VqDUF642发现,VqDUF642参与植物果实发育及对白粉菌和灰霉菌的防御反应。VqDUF642定位于烟草表皮细胞细胞壁,在转基因番茄植株中过量表达VqDUF642加快植株生长,并且能够降低对灰霉菌的敏感性。过表达VqDUF642的转基因无核葡萄植株对白粉菌和灰霉病菌的抗性增强 [13]。
【本研究的切入点】基于DUF642蛋白家族在植物生命活动中的重要意义,本研究对小麦全基因组DUF642基因家族成员进行了鉴定,并对其进化关系、编码蛋白特征、保守性、染色体位置、启动子和转录组信息进行了分析。【拟解决的关键问题】为进一步研究小麦DUF642基因家族的功能和小麦的遗传改良提供了新的线索。
2. 材料与方法
2.1. TaDUF642基因鉴定和系统发育
首先,从Pfam (https://pfam.xfam.org) [14] 下载Pfam域为PF04862 (DUF642)的 [5] 种子序列,从EnsemblPlants数据库(http://plants.ensembl.org/index.html)下载拟南芥、水稻的DUF642蛋白序列,以上述序列作为查询序列进行BLASTp (E < 10-5)分析,删除不含有PF04862结构域的序列,再删除可变剪切和冗余序列,最终确定小麦DUF642基因家族成员。然后进行ClustalW2 [15] 比对,利用MEGA 7.0最大似然法(maximum likelihood, ML)生成系统发育树(bootstrap = 1000) [16],并使用ITOL工具(http://itol.embl.de)美化系统发育树。
2.2. TaDUF642基因蛋白特性预测
使用蛋白分析工具ExPASy (https://www.expasy.org) [17] 预测TaDUF642基因的蛋白特性,包括氨基酸长度(aa)、分子量(Mw)、等电点(pI)、稳定性和亲水性(GRAVY)。在小麦基因组注释信息GFF3文件中提取TaDUF642基因的染色体位置信息,使用MapInspect进行可视化分析。通过网站Plant-mPLo (http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/) [18] 进行亚细胞定位预测。
2.3. TaDUF642基因基序和基因结构分析
将TaDUF642蛋白序列上传到MEME v5.4.1 (http://meme-suite.org/index.html) [19] 搜索其保守序列,设置搜索Motif值为15,然后用TBtools绘制motif分析图。根据TaDUF642基因注释信息,通过TBtools绘制其基因结构图 [20]。
2.4. TaDUF642基因顺式作用元件鉴定
从小麦数据库提取TaDUF642基因上游序列1500 bp,使用PlantCARE (http://bioinformatics.psb.ugent.be/webtools/plantcare/html/) [21] 搜索启动子序列中的顺式元件,然后用R软件包的“Pheatmap”展示预测结果。
2.5. TaDUF642基因转录组分析
从NCBI的SRA数据库收集小麦多条件转录组分析的原始RNA-seq,并将RNA-seq数据通过Hisat2 比对到小麦参考基因组。基因表达水平通过片段按每百万碱基对外显子每千克碱基数(FPKM)模型进行归一化 [22]。然后利用R软件包的“Pheatmap”绘制热图。
3. 结果与分析
3.1. TaDUF642基因鉴定和系统发育分析
经同源检索,在小麦中鉴定到34个DUF642基因家族成员。构建小麦、拟南芥和水稻的DUF642蛋白家族复合系统进化树(图1),然后根据其亲缘关系的远近进行命名。结果表明,DUF642家族基因可分为5组(group a、group b、group c、group d、group e),TaDUF642在各组中均有分布,其中,group e含有的DUF642基因最多(23个),group c含有的DUF642基因最少(2个)。与拟南芥和水稻相比,小麦DUF642家族基因数目较多,这可能是由于小麦经过两轮全基因组复制形成异源六倍体,从而使不同染色体组间具有了同源基因造成的 [23]。

Figure 1. Phylogenetic relationships of DUF642 proteins in Triticum aestivum, Oryza sativa and Arabidopsis thaliana
图1. 小麦,水稻和拟南芥DUF642蛋白的进化关系
3.2. TaDUF642基因蛋白特性预测
用ExPASy Server 10预测的34个小麦DUF642基因的蛋白特性(表1)显示,TaDUF642的蛋白质平均长度为377 aa (307~432);平均等电点为6.8 (4.54~9.24),大多为酸性蛋白质;不稳定指数值为38.47 (31.1~47.51),蛋白质相对稳定(指数小于40);脂溶性指数值为84.02 (74.3~92.89);亲水性指数为−0.032 (−0.21~0.115),大部分为亲水性蛋白质(指数小于0)。TaDUF642家族基因在A、B和D三个染色体组上均有分布且具有相似性,分布在chr2A、chr2B和chr2D上的数量较多,分别为7、7和6个。亚细胞定位预测结果显示,大多数TaDUF642蛋白位于叶绿体上。

Table 1. Sequence characteristics of the 34 TaDUF642 genes identified
表1. 34个TaDUF642基因的序列特征
3.3. TaDUF642基因保守性分析
将搜索到的15个Motif命名为motif1~motif15,基序的宽度从6到42不等,绘制34个TaDUF642蛋白序列的基序分布(图2)。结果显示,同一亚组的TaDUF642蛋白具有相似的基序组成,例如,TaDUF642-a3-3A、TaDUF642-a2-3B和TaDUF642-a1-3D的氨基酸序列具有高度相似性。另外,除TaDUF642-b1-6D外,在所有的TaDUF642序列中都识别到了motif4。基因结构分析显示,同一亚组的TaDUF642蛋白基因结构也具有相似性,且大部分的TaDUF642序列两端都具有UTR非编码区(图2)。TaDUF642家族保守基序和基因结构具有相似性,说明TaDUF642家族的在进化上较为保守。

Figure 2. Conserved gene sequence and gene structure of TaDUF642 genes. (a) Phylogenetic tree of TaDUF642 family; (b) Motif analysis of TaDUF642 family; (c) Gene structure of TaDUF642 family
图2. TaDUF642基因的保守序列和基因结构。(a) TaDUF642家族系统发育树;(b) TaDUF642家族motif分析;(c) TaDUF642家族基因结构
3.4. TaDUF642基因启动子顺式作用元件鉴定
对PlantCARE预测的顺式元件进行可视化分析(图3),可将鉴定到的791个顺式元分为三类:生长发育、激素应答和生物/非生物胁迫,其数量分别为192 (24.3%)、287 (36.3%)和312 (39.4%)个,相应的调控因子种类分别为14、8和25种。其中,有较多的光反应元件(G-box、Sp1、Box II、GATA-motif、I-box、GT1-motif、Box 4、AE-box、TCCC-motif、ATCT-motif、TCT-motif、GATT-motif、GTGGC-motif、ATC-motifchs-CMA2a、Gap-box、GA-motif、ACE、chs-CMA1a、L-box、MRE)。分布最广的顺式作用元件是光反应元件G-box (88.2%),其次是脱落酸反应元件ABRE (82.3%),茉莉酸甲酯反应元件CGTCA-motif (76.5%)和TGACG-motif (76.5%)分布也较为广泛。启动子分析显示光反应元件广泛分布,这与亚细胞定位预测反映的大多数基因定位在叶绿体相一致。

Figure 3. Cis-element analysis of TaDUF642 genes. (a) Phylogenetic tree of TaDUF642 family; (b) The cis-acting element of TaDUF642 genes; (c) Statistical map of cis-elements of TaDUF642 genes
图3. TaDUF642基因的顺式元件分析。(a) TaDUF642家族系统发育树;(b) TaDUF642基因顺式作用元件;(c) TaDUF642基因顺式作用元件
3.5. TaDUF642基因多条件转录组分析
从NCBI下载的转录组数据分为三类:生长发育、非生物胁迫和生物胁迫。不同组别中的基因表达量明显不同。在生长发育阶段(图4),除TaDUF642-e2-2A、TaDUF642-e6-5B外,其余基因在各时期均有表达,且大多数基因在苗期、三叶期和分蘖期的根中都有表达。TaDUF642-a1-3D、TaDUF642-a2-3B、TaDUF642-a3-3A、TaDUF642-c2-5D、TaDUF642-d1-7B、TaDUF642-d2-7D和TaDUF642-d3-7A基因在苗期、三叶期和分蘖期中高表达。group a和group d中的基因在胚芽鞘、叶片、茎分生组织和根分生组织中的表达量相对更高。

Figure 4. Transcriptome analysis of TaDUF642 genes under growth and development
图4. TaDUF642基因在生长发育阶段的转录组分析
对于非生物胁迫(图5),group d中的基因在多种胁迫处理下有较高的表达量。在PEG6000处理下,group d中三个基因表达良好,与对照组相比,Gemmiza 10品种小麦上调表达,TAM107则下调。在干旱和热胁迫下,与对照组相比,group d中的基因大多下调表达,TaDUF642-e7-5D和TaDUF642-e8-5A基因表达量上调。在寒冷胁迫下,与对照组相比,group d组中三个基因表达量上调,TaDUF642-e4-2D基因表达量下调。在磷饥饿处理下,与对照组相比,group a和group d中的基因表达量相对较高,且有明显差异。

Figure 5. Transcriptome analysis of TaDUF642 genes under abiotic stress
图5. TaDUF642基因在非生物胁迫下的转录组分析
对于生物胁迫(图6),在禾谷镰刀菌处理下,group a和group d中的基因、TaDUF642-b3-6A和TaDUF642-c2-5D表达量较高,且与对照组相比差异明显,说明其功能与禾谷镰刀菌的侵染有关。在条锈菌处理下,group a和group d中的基因和TaDUF642-e4-2D表达良好,且与对照组相比具有一定差异,说明这些基因参与了小麦响应条锈菌侵染过程的调控。在白粉菌处理下,与对照组相比,group a和group d中的基因大多表达量下调,说明其功能可能与白粉菌E09侵染有关。

Figure 6. Transcriptome analysis of TaDUF642 genes under biological stress
图6. TaDUF642基因在生物胁迫下的转录组分析
4. 讨论
通过生物信息学技术鉴定得到34个TaDUF642基因,保守性较高,且大多定位在叶绿体上。在启动子顺式作用元件分析中,TaDUF642-e4-2D基因启动子中含有较多的顺式元件MBS (14个),表明该基因可能与干旱胁迫的调控有着很大关系。另外,干旱诱导元件MBS在玉米DUF642家族基因中也分布广泛,表明TaDUF642基因家族成员可能在小麦响应非生物胁迫中具有潜在功能。
关于TaDUF642基因的表达模式,不同组别的基因表达水平有所差异。在生长发育阶段,group a和group d中的基因在胚芽鞘、叶、茎和根中均有较高的表达量,其功能可能与小麦多个组织器官的生长发育相关。在拟南芥的研究中发现,At4g32460和At5g11420基因编码的DUF642蛋白在植物的生长发育过程中对PME的活性起到调控作用,At4g32460基因对细胞内PME活性起到正向调控租用,可能对种子的萌发有重要影响 [5]。在TaDUF642基因家族中,group d中三个基因与At4g32460和At5g11420有较高的同源性,它们可能与果胶的去甲基化有关。
对group d中的基因在非生物胁迫下的表达量进行分析,该组基因可能参与小麦抵抗干旱、寒冷和磷饥饿等多种功能。在水稻的研究中发现,Os04g0494900可能是野生型水稻参与抗铝毒活动较为重要的基因 [24],并且研究发现玉米DUF642家族中也存在与抗铝毒胁迫相关的基因 [13]。在TaDUF642基因家族中,TaDUF642-e11-2A、TaDUF642-e10-2B和TaDUF642-e9-2D三个基因与Os04g0494900同源性较高,它们可能与小麦抗铝毒胁迫相关。
另外,group a和group d中的基因在禾谷镰刀菌、条锈菌和白粉菌处理下均具有较高的表达量,且与对照组相比存在差异,这些基因在小麦抵御生物胁迫的过程中发挥着重要的影响。在拟南芥的研究中发现,At5g25460和At3g08030基因受细菌侵染和害虫取食诱导表达 [8],而group d中三个基因与At5g25460同源性较高,TaDUF642-c2-5D与At3g08030同源性较高,这些基因在生物胁迫下都表现出对植物较大的影响。At1g80240和At5g25460参与了细胞壁的形成,对细胞生长和植物发育有重要作用 [25],而group d中三个基因与At1g80240和At5g25460同源性较高,这与转录组分析显示group d中三个基因在小麦生长发育多个时期有较高的表达量相一致。
5. 结论
本研究通过生物信息学方法对小麦DUF642基因家族进行全面的研究。共得到34个TaDUF642基因,而且小麦DUF642基因在非生物和生物胁迫中发挥着重要的作用,为进一步挖掘DUF642基因的功能提供了参考依据。
基金项目
中国烟草总公司科技项目(110202102040)和湖北省烟草公司科技项目(027Y2020-006)。