1. 引言
氮素污染是引起水体富营养化的原因之一。生物脱氮被公认为是经济有效的污水脱氮方法之一。硝化作用是污水生物脱氮处理过程中的一个重要环节。传统的硝化作用是由自养型微生物完成的。然而,自养硝化细菌存在着生长缓慢,对高浓度有机物耐受性较差等问题。随着研究的深入,人们发现异养硝化现象广泛地存在于不同的环境中。异养硝化 [1] 作用一般是指异养微生物在好氧条件下将氨/铵或化合价为−3的有机氮化合物转化为羟胺,进而转化为亚硝酸盐和硝酸盐的过程 [2] 。与传统自养硝化微生物相比,异养硝化微生物具有生长快速、适应能力强等特点。异养硝化微生物在高氨氮和高C/N废水处理中有较大的应用前景。
目前对于异养硝化的研究多集中于菌株的分离鉴定、性能测试 [3] [4] [5] 以及异养硝化菌株在反应器中的应用 [6] [7] [8] ,而对于异养硝化过程中关键酶的研究相对较少。异养硝化过程中的关键酶有氨氮加氧酶(AMO)、羟胺氧化酶(HAO) [9] [10] [11] 等。AMO是异养硝化过程中第一个关键酶,起着将
转化为NH2OH的作用,常被用作硝化过程的功能标记基因 [12] 。由于AMO为膜结合型酶 [13] [14] ,其分离纯化难度较大。因此,目前关于AMO酶纯化及三维结晶的报道很少。
本实验室在前期研究中分离纯化出的一株具有异养硝化功能的细菌Alcaligenes faecalis (粪产碱杆菌) NR [15] 。在本研究中,采用PCR技术以及生物信息学方法,对粪产碱杆菌NR的AMO的基础理化性质以及三级结构进行分析,以期为深入了解异养硝化过程中的关键酶提供参考。
2. 材料与方法
2.1. 菌株培养
本研究所使用菌株为实验室分离的粪产碱杆菌NR,NCBI数据库登录号为FJ151629。将储存于4℃条件下的粪产碱杆菌NR接种于灭菌后LB培养基中,于30℃、120 rpm条件下隔夜培养后用于提取基因组DNA。
LB培养基:酵母粉5 g/L,蛋白胨10 g/L,NaCl 5 g/L。
2.2. PCR扩增
取1 mL隔夜培养的粪产碱杆菌NR菌悬液,使用Omega细菌基因组DNA提取试剂盒,按照操作说明提取细菌基因组DNA,作为PCR扩增所用模板。采用DNAMAN 7软件根据NCBI数据库中检索到的Alcaligenes faecalis ZD02氨单加氧酶基因序列(GenBank登录号为NZ-CP013119)设计引物A1 (表1),根据Alcaligenes faecalis ZD02氨单加氧酶基因序列向3’和5’端分别延伸500 bp后所得序列设计引物A2 (表1)。PCR反应采用25μL体系,体系包含以下溶液、试剂:2 × Premix Ex Taq 12.5 μL,正、反向引物各1 μL (10 μmol/L),DNA模板1 μl (40 ng/μL),RNase-free water 9.5 μL。PCR扩增条件如下:94℃预变性5 min,接着进行30循环:94℃变性30 S,退火30 S (引物A1退火温度52℃,A2退火温度55℃),72℃延伸1 min,最后72℃下补充延伸7 min。PCR产物采用1.5%琼脂糖电泳进行分析检测,对符合预期的条带运用Omega胶回收试剂盒回收,并AT克隆测序。
2.3. AMO基因序列分析
对测序得到的基因序列先采用NCBI在线比对工具BLASTN进行比对分析,确认该段序列是否为AMO基因序列。确定为目标基因序列后,使用NCBI在线开放阅读框(ORF)预测工具ORF finder预测该段序列可能编码的AMO氨基酸序列。所得AMO氨基酸序列运用在线软件ProtParam和ProtScale对其等电点、分子量以及亲疏水性进行分析 [16] 。采用在线跨膜分析软件TMHMM-2.0 [17] 对AMO跨膜区进行分析预测。
2.4. AMO高级结构分析
使用在线蛋白质三维结构预测工具Phyre 2 [18] 对AMO的三维结构进行分析预测,并采用3DligandSite [19] 服务器对模型可能存在的结合位点进行预测,运用PDBsum Generation对所得模型进行评估。最后使用Chimera 1.11对模型进行可视化操作。
3. 结果与讨论
3.1. PCR结果
采用Primer BLAST工具以数据库中粪产碱杆菌基因组DNA为模板,对引物A1和A2进行进一步的验证,结果显示两对引物均只有一种特异性产物,且长短与预期相当,这说明引物A1和A2对粪产碱杆菌都具有较好的特异性,可以用于后续PCR扩增实验。然而PCR结果显示(图1),引物A1的产物具有多条条带,且目标条带亮度很低;而A2引物虽然产物条带单一,特异性也好,但是其长度约为1700 bp比预期长500 bp (表1)。然而A2产物单一且特异性良好,可以排除引物错配的可能。经测序该段PCR产物长度为1639 bp。
3.2. 序列分析
经BLAST比对,本研究所得到基因序列为amoA基因。ORF finder预测结果显示(图2),该段基因序列有一长度为1041 bp的阅读框(304-1344 bp)。这个阅读框编码总共编码346个氨基酸,该阅读框包含初始密码和终止密码,并且阅读框5’和3’还余有约300 bp碱基。因此,认为该阅读框所编码的是一条完整的肽链。此外,ExPASy工具预测的蛋白质的理论等电点为9.38,属于碱性蛋白。其分子量大小为36.7 kDa,

Table 1. Primers for amo gene PCR amplification
表1. 氨单加氧酶基因引物序列
注:F为正向引物,R为反向引物。

Figure 1. PCR product agarose electrophoresis figure of amo gene
图1. 氨单加氧酶基因PCR产物琼脂糖电泳图

Figure 2. ORF analysis results of amoA
图2. 氨单加氧酶基因ORF分析结果
比自养硝化菌AmoA大6-8 kDa [20] ,与从异养硝化菌Paracoccus denitrificans胞内分离纯化得到AmoA分子量大小相近(38 kDa) [13] 。
运用ExPASy网站的在线分析工具ProtScale对Amo序列的亲疏水性进行分析,结果显示该段氨基酸序列的最大亲水性指数(hydropath)为2.658,最小亲水性为−0.8,总平均亲水性(GRAVY, Grand average of hydropathicity)为0.972,总平均亲水性的数值越大说明该蛋白疏水性越强。此外,预测结果图显示,AmoA蛋白大部分区域是疏水的(图3)。因此,该蛋白是疏水性蛋白。
在线跨膜预测软件TMHMM-2.0预测显示(图4(a)),AmoA蛋白的氨基酸非跨膜螺旋指数为195.86 ( > 18,当大于18时该蛋白分有可能是跨膜蛋白,或者有信号肽),首端60个氨基酸的跨膜指数为34.98 ( > 10,当大于10时N端存在信号肽)。因此可断定,AmoA的N端可能存在信号肽,且该蛋白为跨膜蛋白,这与Moir [13] 等和Klotz等 [20] 得研究结果一致。如图4(b)所示该蛋白总共存在12个跨膜螺旋区,且该蛋白的N−端和C−端均位于膜外细胞周质一侧。

Figure 3. Curve: system result of standard experiment
图3. 标准试验系统结果曲线

Figure 4. Transmembrane analysis results of AmoA amino acid sequence. (a) Results of TMHMM, the red shades were transmembrane ranges; (b) Results of Phyre 2, black was cell membrane, yellow was transmembrane structure
图4. 氨单加氧酶氨基酸序列跨膜预测结果。(a) TMHMM跨膜预测结果,红色阴影为跨膜区;(b) Phyre 2跨膜预测结果,黑色表示细胞膜,黄色表示跨膜结构

Figure 5. Tertiary structure prediction results of AmoA, (a) ribbon of AMO; (b) hydrophobic surface of AMO, red means hydrophobic, blue means hydrophilic
图5. 氨单加氧酶三级结构预测结果,(a) AMO 三级结构骨架;(b) AMO三级结构亲疏水表面,红色表示疏水,蓝色表示亲水

Figure 6. Ramachandran plot of Amo tertiary structure model
图6. 氨单加氧酶三级结构模型拉氏图
3.3. AMO三级结构
由于PDB数据库中未找到现有的AMO模型,也未找到同源性> 30%的模型。因此,使用Phyre 2采用串线法对AMO的三维结构进行预测。模型以c4n7wA为模板构建,目标序列与模板序列的覆盖率为85%,最终得出的模型的置信度为98.6%。使用Chimera 1.11软件对预测结果进行可视化操作,所得结果如图5所示。如图5(a)所示,AMO绝大部分区域为α螺旋结构,一般而言α螺旋区域也是跨膜区域 [21] 。如图5(b)所示,该蛋白表面大部分为疏水区域(红色为疏水区域,蓝色为亲水区域),特别是中间部分,这与前面跨膜结构预测及亲疏水性分析相吻合。此外,3DLigandSite预测结果显示AMO具有一个镍原子结合位点,然而有报道认为AMO含有的是Cu原子结合位点 [14] 。
拉氏图常用于指明蛋白质或多肽高级结构中允许和不允许的构象,一共分为最佳区域(红色)、次允许区(褐色)、最大允许区域(黄色)和不允许区域(浅黄色)四个区域。当位于最佳区域的氨基酸残基所占比例大于90%,且位于不允许区域的氨基酸比例不超过1%时所得模型的稳定性较好 [21] 。图6为AMO模型所对应拉氏图。如图6所示,所得模型中位于红色区域的残基所占比例为94.9%,余下5.1%位于褐色区域,没有残基位于黄色和浅黄色区域,这说明预测所得AMO模型构象良好。
4. 结论
采用PCR技术成功扩增粪产碱杆菌NR基因组DNA中AMO基因序列,得到长度为1639 bp的DNA序列。经BLAST比对所得基因序列为amoA序列,包含编码AMO活性位点序列。该段序列包含1个完整的开放阅读框(ORF),编码长度为346 aa的多肽链。经比对分析该序列为AMO蛋白质序列。该蛋白序列分子量大小为36.7 kDa,是碱性蛋白(pI = 9.38)也是疏水性蛋白(GRAVY = 0.972)。此外,AMO也是跨膜蛋白,有12个跨膜区,C端和N端均位于膜外细胞周质一侧。成功构建AMO三级结构模型,模型置信度为98.6%,含有一个金属镍原子结合位点。拉氏图表明,AMO模型位于最佳区域的氨基酸残基所占比例为94.9 %,该模型构象良好。
基金项目
中央高校基本科研业务费(106112016CDJXY210007)。