1. 引言
大豆发源地于亚洲,是重要的粮食作物之一,大豆的蛋白质提供了人体蛋白的主要来源。含有20多种自然界普遍存在的氨基酸,营养价值比较高,与动物蛋白相比不含有胆固醇,为很好的保健食品,豆类蛋白还具有降血压,降血脂,减少心脑血管病以及促进营养吸收等功效 [1] 。大豆蛋白质含量性状为数量性状,遗传机制比较复杂,很容易受到如温度、光照和水分等外界环境条件影响,环境因素的变化会导致数量性状基因的表达方式或表达程度发生变化,进而影响蛋白质含量品种在各地点的不一致。因此,将环境因子多元化有助于发掘真正影响大豆蛋白质含量的因素,为大豆品质育种奠定了基础。
目前,基于环境因子与表型的分析研究相对较少,大多数都是研究QTL与环境的互作分析效应,研究多采用QTL与环境互作的分析软件 [2] [3] ,但这些分析软件并不能直观地综合反映区域试验品种(系)的高产稳产性、试验点评价和品种生态区划分情况。1971年,双标图(Biplot)的概念被Gabriel等提出以来 [4] ,很多研究应用双标图进行了品种试验的有效区分 [5] [6] 。
近些年来,GGE-Biplot双标图分析方法应用广泛。在小麦 [7] 、燕麦 [8] 、大豆 [9] 、小豆 [10] 、玉米 [11] 、棉花 [12] 和甘蔗 [13] 等作物都有研究。张勇等 [14] 对我国春麦区10个试点20个品种淀粉糊化特性的峰值粘度进行稳定性分析。罗俊 [15] 等对5个试点中的7个品种的甘蔗产量性状进行稳定性和适应性的分析。杨进文等 [16] 用GGE双标图及隶属函数综合分析山西小麦地方品种抗旱性。张春明等 [17] 也利用该分析方法,对3个年份的10个品种19个试验点的小豆进行高产、稳产性和适应性分析。韩英鹏等在2014年利用GGE-Biplot方法分别对大豆的亚麻酸 [18] 和脂肪酸 [19] 性状表现进行分析。
本研究利用GGE双标图分析软件(GGE biplot)针对以Charleston和东农594为亲本的147个F10-19重组自交系群体,分析其连续10年的蛋白质含量数据。揭示RIL群体147个株系在多环境下的品质性状表现及其稳定性,同时评价环境的区分力与代表性,能够为大豆栽培生产提供指导性依据。
2. 材料和方法
2.1. 试验材料
本研究以美国半矮杆品种Charleston (♀)和东农594 (♂)构建的RIL群体繁殖得到的147个F10-19代重组自交系为试验材料,其中Charleston是高油材料,其油分含量为22.7%;东农594是高蛋白材料,蛋白质含量为44.3%。
2.2. 材料种植
将Charleston (♀)和东农594 (♂)及其147个F10-19代重组自交系材料从2002年到2011年种植于黑龙江省农垦科研育种中心试验地(哈尔滨,126˚38'E,45˚45'N)。2002~2006年间种植两次重复,2007~2011年间种植三次重复,田间管理同常规大田。
2.3. 品质性状及环境因子测定
通过FOSS-1241红外线谷物分析仪对RIL群体147个F10-19代重组自交系进行蛋白含量测定,每个株系随机取5株,保证其在安全含水量范围内测定蛋白质含量,取其均值作为该行的蛋白质含量,三次重复种植的均值作为该环境下蛋白质含量表型值。
平均温度、降水量和日照时数等主要环境因子是影响大豆蛋白含量的主要因素。《中国地面气候资料日值数据集数据格式》统计记录哈尔滨10年(2002年~2011年)的环境因子平均温度、降水量和日照时数等数据。
2.4. 分析方法
采用GGE-Biplot软件 [5] 进行大豆蛋白质含量位于多环境下的GGE-Biplot分析,利用以环境中心化的双标图,分析G与GE的效应,G:表示表型的主效应,GE表示:表型与环境互作的效应,所得的图示化结果用于评价重组自交系群体在试验环境上的表现。
GGE双标图采用平均环境坐标(Average environment coordinate, ACE)法能够使两向数据表中的信息清晰、全面的显示出来。AEC是用圆圈表示的环境平均值,AEC的PC1和PC2得分分别等于所有指标的PC1和PC2的平均得分。AEA (Average-environment axis)即AEC的横轴,通过原点和AEC,AEC的纵轴就是通过原点垂直于AEA的直线。GGE双标图上同时给出蛋白质性状和环境图标,可更直观地进行蛋白质性状品质的分析,AEA表示大豆的平均含油量,箭头方向为正,各株系在AEA上的投影越靠右,其蛋白质品质越高,纵轴代表了株系的稳定性,箭头方向株系的稳定性差,AEA上垂线的长短显示稳定性的大小,长短越短,稳定性越好。
将GGE双标图结果中显示出的各环境最优定点点用直线连接起来,形成一个多边形囊括所有环境。以原点为顶点向各边出发,作各边垂线将图分为若干区域,每个环境自然落于某个区域内,靠近原点的株系对环境变化迟钝,而“顶点”所代表的株系是该区域内在每个环境都表现最优的株系。并解析大豆蛋白质性状品质在哈尔滨10年环境受主要环境因子(平均温度、降水量和日照时数)的影响,找出影响大豆蛋白质含量的最优环境因子。
3. 结果与分析
3.1. 环境因子统计分析
对哈尔滨10年(2002~2011年)间的环境因子数据进行分析,其中,大豆生育期降雨量的变化范围为356.9 mm~529.2 mm,其中2002年的降雨量较高,其余年份近于平稳;生育期日照时数的变化范围为1104 h~1439.5 h,2003年日照时数最少为1104 h。2002和2004年日照时数偏高,在1400 h左右,其余年份稳定在1300 h左右;生育期的平均气温较为平稳,在17℃到18℃之间,变动幅度接近于1℃ (表1)。
3.2. RIL群体的表型统计分析
重组自交系群体蛋白质性状表型分析列于表2中。母本Charleston的蛋白质含量变化范围在38.06%到42.38%之间,父本东农594的蛋白质含量变化范围在41.80%到43.94%之间。群体的均值变化范围在36.24%到42.24%之间。该群体在各年份/环境的变幅较大,适合做QE分析。
3.3. RIL群体蛋白性状在哈尔滨地点10年的品质分析
通过分析哈尔滨10年10个环境得到GGE双标图,其中横坐标为表型值增大的方向,纵向坐标轴

Table 1. Environment factors of Harbin from 2002 to 2011
表1. 哈尔滨2002~2011年环境因子

Table 2. Summary of RIL and parents protein content
表2. 重组自交系群体及亲本蛋白含量总结
为整体数据的均值,群体内多年数据均匀分布。其中AEA代表株系的蛋白质含量均值,以箭头方向表示正方向,所有株系均向AEA轴上投影,各个材料的垂线越靠近箭头方向表示其蛋白质品质含量越高,反之亦然。如图1所示,株系24和株系10都位于AEC纵轴的最右侧,其蛋白含量远大于均值。株系10与株系24相比更接近横坐标,所以株系10的蛋白含量年度间的稳定性更高。
3.4. 环境的最优适应个体
应用环境最适个体模型,将位于边缘的株系标志位点用直线连接起来,形成一个封闭的多边形。从原点出发对各个材料做垂线,所有10个环境分成了4个区域,每个多边形的顶点为最优个体。环境向量与箭头所在向量夹角越大表示环境代表性越弱。应用主成分分析,其中第1主成分解释了37.7%的效应,第2主成分解释了15.3%的效应,PC1和PC2共解释G与GE互作效应的53.0%,推断具有较大的可靠性(图2,图3)。

Figure 1. Protein content of RIL population distribution in HRB 10 environments
图1. RIL群体蛋白性状在HRB 10个环境表型分布图

Figure 2. Group classification of protein content of RIL population in HRB 10 environments
图2. IL群体蛋白性状在HRB 10环境的分组
3.5. 最优环境因子的挖掘
如图4所示,SUNSHINE的向量与目标向量夹角最小,其对蛋白质品质影响最大;RAINFALL的夹角略大于SUNSHINE,说明其对品质影响相对较小;AT对蛋白质的影响最小。对哈尔滨10年的环境来说,环境因子对品质数据的影响顺序为:日照时数 > 降水量 > 平均温度。第1主成分解释了55.8%的效应,第2主成分解释了31%的效应,PC1和PC2共解释环境因子影响效应的86.8%,据此,推断分析的可靠性较大。

Figure 3. Identification and representativeness biplot of protein content of soybean in HRB 10 environments
图3. RIL群体蛋白性状在HRB 10环境的区分力和代表性图
注:SUNSHINE代表大豆生育期内的日照时数,RAINFALL代表大豆生育期内的降水量,AT代表大豆生育期内的平均温度。
Figure 4. Environment factors GGE biplot analysis in HRB
图4. HRB环境的环境因子的GGE-biplot分析
4. 讨论
大豆蛋白质含量是数量性状,外界环境影响因素众多,若利用传统的二维数据,很难解释出性状与各个环境的关系,而GGE双标图法可把各环境因素与性状之间的复杂关系直观的表现出来。对多环境及多品种进行整体性评价,能够清晰鉴别筛选出高品质性状的大豆品系,为目标区域筛选出高产优产的大豆新品种提供参照依据,为推广优质、优质新品种提供指导依据。
作物多点测验(或试验)是农业实验的基础,是最经常使用的实验设计。各个省市的农作物管理部门每年都会组织各育种单位和种子公司进行各种农作物品种试验,为育种提供依据和数据,并通过审定。由于存在品种和环境之间的相互作用(GE),因此多点试验是必要的。双标图法不用关注模型的适应性等问题,可以于直接比较品种的稳定性。考虑到一年内的数据多是平衡的(相同的品种出现在所有试验点),而年际间数据大多不平衡,通常先每年逐一分析,最后整合分析的思路 [20] 。
本研究利用GGE双标图法对连续10年的147个RIL群体的油分含量数据进行分析,筛选出蛋白质含量较高的5个株系是株系5、株系10、株系24、株系80和株系102,其中株系5和株系10的稳定性也较好,这些株系的表型远优于双亲,可以为大豆品种性状遗传育种提供丰富类型的材料,可以进一步挖掘应用。大豆参试环境中的2008HRB的代表性最好,2010HRB代表性最差;2002HRB的鉴别能力最好,2011HRB的鉴别能力最差。环境因子对大豆蛋白质含量品质数据的影响顺序为:日照时数 > 降水量 > 平均温度,针对该蛋白质含量数据来说,各环境因素中日照时数相对最重要,应用同一群体,通过环境的代表性和鉴别能力分析,在连续10年哈尔滨环境下,环境因子对油分含量的影响顺序为:日照时 > 数降水量 > 平均温度,与本文获得的研究结果完全一致 [21] 。另外,王志新等 [22] 研究遮光对大豆种子的影响大小排序是产量 > 蛋白质 > 脂肪 > 蛋质总量,这与本研究的日照对蛋白质的影响较大一致。GGE双标图法能更清晰鉴别和筛选出品质性状好,稳定性高的大豆株系,并综合考虑基因型和基因型与环境互作的总体表现,关注主要环境因子对大豆蛋白质含量的影响,为指导大豆栽培生产提供科学依据和决策支持。
5. 结论
在RIL群体的多年环境品质性状分析中,株系10、23、24与80的蛋白质品质好,株系10具有较高的稳定性。就环境的代表性而言,2008HRB最好,环境的鉴别能力是2002HRB最好。在哈尔滨环境下,环境因子对品质数据的影响顺序为:日照时数 > 降水量 > 平均温度。
NOTES
*通讯作者。