1. 引言
大豆(Glycine max (L.) Merr.)起源于中国,是全世界重要的油料作物和经济作物,同时也是人类食用油、优质蛋白以及动物饲料蛋白的主要来源[1] [2]。近年来,我国大豆供需矛盾日益突出,国内产量无法满足实际市场需求。2025年我国大豆进口量更是突破历史纪录,达到1.12亿吨,较2024年增长6.5%,国内大豆的自给率仅为15.8%。我国大豆长期稳定供应面临严峻考验,因此,提高脂肪含量成为大豆品质育种的重要目标,可以提升国产大豆的市场竞争力,对保障国家粮食安全和改善全民营养健康具有重要的战略意义。
作物产量、品质及农艺性状等大多数性状表现为连续性变异的数量性状,且易受环境因素影响[3]。主基因 + 多基因混合遗传模型分析是利用双亲分离群体数量性状的表型值来分析目标性状的遗传规律,可以初步判断目标性状是否受主基因或多基因控制,并且可以估计基因效应和主基因、多基因遗传率等遗传参数[4]。近年来,主基因 + 多基因混合遗传分析方法已经广泛应用于小麦[5]、谷子[6]、花生[7]、玉米[8]、烟草[9]、大豆[10]等作物的产量、品质、抗性及农艺性状的遗传特性分析。但目前对于多个环境下大豆脂肪含量性状的遗传分析报道相对较少。
本研究以大豆地方品种肥东黄大豆和灌云大四粒杂交构建的重组自交系(RIL)群体为试验材料,在3个环境下测定群体及亲本的脂肪含量,利用主基因 + 多基因遗传混合遗传模型对脂肪含量进行遗传分离分析,明确该性状的最优遗传模型及基因效应,为后续大豆脂肪含量基因定位、杂交育种亲本选配以及品种改良提供理论依据。
2. 材料与方法
2.1. 试验材料
以大豆地方品种肥东黄大豆为母本(P1),以灌云大四粒为父本(P2)配制杂交组合,得到杂交种F1、F1代单株自交获得F2,通过单粒传法连续多代自交获得包含201个家系的RIL群体(FG-RIL)为试验材料。
2.2. 试验方法
2019年、2020年、2021年将FG-RIL群体及其亲本种植于淮安市农业科学研究院科研创新基地,共计3个环境(E1, E2, E3)进行田间试验。采用随机区组设计,3次重复,每个小区1行,行长1 m,每行10个单株,株距10 cm,行距0.5 m,试验区设置保护行消除边际效应,常规田间管理。
选取籽粒完整、大小均匀、无杂质的大豆籽粒90~100 g,利用Perten DA7250近红外分析仪(瑞典波通仪器公司)测定籽粒脂肪含量,每份样品扫描2次,取平均值作为该样品的脂肪含量。以3次重复的平均值作为单个环境下该家系的脂肪含量。脂肪含量以脂肪占大豆籽粒干物质重量的百分数(%)表示。
2.3. 数据分析
使用Microsoft Excel 2021对表型数据进行统计分析,计算最小值、最大值、平均值、标准差、变异系数、偏度、峰度。利用R软件包SEA v2.0.1 (https://cran.r-project.org/web/packages/SEA/index.html)的SEA-G3DH群体遗传模型,对FG-RIL群体及其亲本在3个环境下的脂肪含量进行主基因 + 多基因混合遗传模型分析[4]。计算出赤池信息量准则(Akaike’s Information Criterion, AIC)值,选出AIC值最小及接近最小的几个模型作为备选遗传模型,然后通过均匀性检验(
、
和
)、Smirnov检验(nW2)和Kolmogorov检验(Dn)对备选遗传模型进行适合性检验,最后选择AIC值最小或较小,且适合性检验统计量达到显著水平个数最少的模型作为最优遗传模型[6] [7]。利用SEA软件包计算最优遗传模型的一阶、二阶遗传参数,以及主基因遗传率和多基因遗传率。
3. 结果与分析
3.1. FG-RIL群体脂肪含量的表型变异及频数分布
对E1、E2和E3环境下FG-RIL群体及其亲本的脂肪含量进行统计分析(表1),母本肥东黄大豆的脂肪含量分别为17.08%、16.51%和16.94%,父本灌云大四粒的脂肪含量分别为20.19%、19.32%和19.57%,两个亲本之间存在显著差异,父本的平均值比母本高2.85%。FG-RIL群体在3个环境下脂肪含量的变异范围分别为14.63%~21.88%、14.42%~21.70%和14.62%~21.43%,变异系数分别为7.30%、6.90%和6.64%,表明该群体存在广泛变异和负向与正向超亲分离,群体平均值均介于两个亲本之间,高于低值亲本。偏度和峰度的绝对值小于1.0,符合典型数量性状遗传特点。FG-RIL群体在各个环境脂肪含量的频数分布图表现为连续分布,直观显示近似正态分布(图1),可以进行后续的遗传分析。
Table 1. Descriptive statistics for oil content in the FG-RIL population
表1. FG-RIL群体及其亲本脂肪含量的描述性统计
环境 |
亲本(%) |
FG-RIL群体 |
肥东黄大豆 |
灌云大四粒 |
最小值(%) |
最大值(%) |
平均值 ± 标准差(%) |
变异系数(%) |
偏度 |
峰度 |
E1 |
17.08 |
20.19 |
14.63 |
21.88 |
18.53 ± 1.35 |
7.30 |
−0.10 |
−0.30 |
E2 |
16.51 |
19.32 |
14.42 |
21.70 |
18.50 ± 1.28 |
6.90 |
−0.19 |
−0.12 |
E3 |
16.94 |
19.57 |
14.62 |
21.43 |
18.18 ± 1.21 |
6.64 |
−0.26 |
−0.08 |
3.2. 脂肪含量在不同环境下最优遗传模型选择
应用R包SEA v2.0.1,选择SEA-G3DH群体模型,对3个环境下FG-RIL群体及亲本(P1, P2, RIL)的脂肪含量进行主基因 + 多基因混合遗传分析。通过计算获得各环境下38种遗传模型的AIC值,选取AIC值最小及接近最小的模型作为备选模型,每个环境下各选择5个备选模型,然后对其进行适合性检验(
,
,
, nW2, Dn),确定最优遗传模型,其结果见表2。
Figure 1. Frequency distribution (column), fitted mixed distribution (red line) and component distribution (black line) of oil content in FG-RIL populations grown in different environments
图1. FG-RIL群体在不同环境下脂肪含量的频数分布(柱形)、拟合混合分布(红线)及成分分布(黑线)
Table 2. AIC values and goodness-of-fit tests of candidate models for oil content in the FG-RIL population
表2. FG-RIL群体脂肪含量备选模型的AIC值及适合性检验
环境 |
备选模型 |
AIC值 |
|
P (
) |
|
P (
) |
|
P (
) |
nW2 |
P (nW2) |
Dn |
P (Dn) |
E1 |
3MG-CEA |
2026.938 |
0.001 |
0.981 |
0.002 |
0.961 |
0.081 |
0.776 |
0.037 |
0.946 |
0.020 |
0.968 |
2MG-EA |
2028.752 |
0.023 |
0.879 |
0.026 |
0.873 |
0.002 |
0.961 |
0.036 |
0.952 |
0.019 |
0.988 |
4MG-EEEA |
2029.807 |
0.030 |
0.862 |
0.055 |
0.814 |
0.071 |
0.791 |
0.038 |
0.942 |
0.022 |
0.950 |
4MG-CEA |
2030.049 |
0.024 |
0.878 |
0.091 |
0.763 |
0.374 |
0.541 |
0.050 |
0.878 |
0.024 |
0.880 |
3MG-PEA |
2030.062 |
0.023 |
0.879 |
0.043 |
0.836 |
0.057 |
0.811 |
0.037 |
0.948 |
0.021 |
0.961 |
E2 |
3MG-CEA |
1435.712 |
0.023 |
0.878 |
0.040 |
0.842 |
0.043 |
0.836 |
0.026 |
0.987 |
0.021 |
0.991 |
MX2-DE-A |
1436.625 |
0.016 |
0.900 |
0.023 |
0.879 |
0.016 |
0.901 |
0.029 |
0.980 |
0.021 |
0.991 |
4MG-EEEA |
1436.936 |
0.059 |
0.808 |
0.038 |
0.846 |
0.027 |
0.871 |
0.031 |
0.973 |
0.022 |
0.983 |
MX2-AE-A |
1437.977 |
0.002 |
0.965 |
0.004 |
0.951 |
0.006 |
0.937 |
0.025 |
0.989 |
0.020 |
0.996 |
MX2-IE-A |
1437.992 |
0.031 |
0.861 |
0.057 |
0.811 |
0.077 |
0.781 |
0.032 |
0.971 |
0.026 |
0.942 |
E3 |
3MG-CEA |
1640.426 |
0.000 |
0.985 |
0.006 |
0.939 |
0.054 |
0.817 |
0.022 |
0.994 |
0.020 |
0.984 |
2MG-AE |
1643.498 |
0.001 |
0.981 |
0.000 |
0.995 |
0.004 |
0.949 |
0.025 |
0.991 |
0.019 |
0.992 |
2MG-CE |
1643.521 |
0.007 |
0.932 |
0.003 |
0.956 |
0.011 |
0.916 |
0.028 |
0.984 |
0.020 |
0.988 |
2MG-ER |
1644.436 |
0.001 |
0.981 |
0.003 |
0.956 |
0.017 |
0.896 |
0.026 |
0.988 |
0.019 |
0.994 |
MX2-ER-A |
1645.202 |
0.048 |
0.827 |
0.055 |
0.816 |
0.007 |
0.931 |
0.027 |
0.986 |
0.022 |
0.963 |
FG-RIL群体在E1环境下最小AIC值为2026.938,遗传模型为3MG-CEA (3对主基因等加性),与最小AIC值接近的4个模型分别为2MG-EA (2对主基因等加性)、4MG-EEEA (4对主基因部分等加性2)、4MG-CEA (4对主基因等加性)、3MG-PEA (3对主基因部分等加性)。经适合性检验,这5个备选模型中统计量达到显著水平(p < 0.05)的个数均是0,根据AIC值最小且适合性检验统计量达到显著水平个数最少原则进行筛选,E1环境下最优遗传模型为3MG-CEA模型。
在E2环境下最小AIC值为1435.712,遗传模型为3MG-CEA (3对主基因等加性),与最小AIC值接近的4个模型分别为MX2-DE-A (2对主基因重叠作用 + 多基因加性)、4MG-EEEA (4对主基因部分等加性2)、MX2-AE-A (2对主基因累加作用 + 多基因加性)、MX2-IE-A (2对主基因抑制作用 + 多基因加性)。这5个备选模型的适合性检验统计量均没有达到显著水平(p < 0.05),E2环境下最优遗传模型为具有最小AIC值的3MG-CEA模型。
在E3环境下最小AIC值为1640.426,遗传模型为3MG-CEA (3对主基因等加性),与最小AIC值接近的4个模型分别为2MG-AE (2对主基因累加作用)、2MG-CE (2对主基因互补作用)、2MG-ER (2对主基因隐性上位)、MX2-ER-A (2对主基因隐性上位 + 多基因加性)。这5个备选模型的统计量均没有达到显著水平(p < 0.05),E3环境下最优遗传模型为具有最小AIC值的3MG-CEA模型。
因此,FG-RIL群体在3个环境下最终入选的脂肪含量最优遗传模型为3MG-CEA模型,即3对完全等加性主基因模型,无多基因效应。
3.3. 最优模型遗传参数估计
估算FG-RIL群体在最优遗传模型3MG-CEA下的一阶遗传参数和二阶遗传参数可知(表3),脂肪含量由3对主基因控制,主基因的加性效应相同。在E1、E2、E3环境下,3对主基因的加性效应值相等,分别为−0.62、−0.52和−0.49,均表现为负向遗传效应,脂肪含量的主基因遗传率在3个环境下分别为63.81%、50.38%和51.11%,表明FG-RIL群体脂肪含量主要由主基因控制,且增加脂肪含量的等位基因来源于父本灌云大四粒。
Table 3. Estimates of genetic parameters of the optimal models for oil content in the FG-RIL population
表3. FG-RIL群体脂肪含量备选模型的最优模型遗传参数估计
环境 |
最优遗传模型 |
一阶遗传参数 |
二阶遗传参数 |
m |
da |
db |
dc |
σ2e |
σ2mg |
h2mg (%) |
E1 |
3MG-CEA |
18.51 |
−0.62 |
−0.62 |
−0.62 |
0.66 |
1.17 |
63.81 |
E2 |
3MG-CEA |
18.43 |
−0.52 |
−0.52 |
−0.52 |
0.81 |
0.82 |
50.38 |
E3 |
3MG-CEA |
18.10 |
−0.49 |
−0.49 |
−0.49 |
0.71 |
0.74 |
51.11 |
m:群体均值;da、db、dc:3对主基因的加性效应,正值表示增效等位基因来自母本,负值表示增效等位基因来自父本;σ2e:环境方差;σ2mg:主基因遗传方差;h2mg (%):主基因遗传率。
4. 讨论
脂肪含量是大豆的主要品质性状之一,解析脂肪含量性状的遗传规律是高油大豆品种选育的必要前提。主基因 + 多基因混合遗传模型分析方法,利用表型观测值可以预测目标性状的遗传模型及主基因和多基因遗传率,目前该方法已广泛应用于植物数量性状的遗传基础解析[6] [11] [12]。本研究以大豆地方品种肥东黄大豆为母本和灌云大四粒为父本通过单粒传法构建的FG-RIL群体为材料,采用主基因 + 多基因混合遗传模型分析,发现脂肪含量在3个环境下的最优遗传模型相同,均符合3MG-CEA模型,表现为3对完全等加性主基因模型,且不含多基因效应,主基因遗传率介于50.38%~63.81%,主要由遗传因素控制,同时也受到环境和基因型与环境互作影响。此外,与F2、回交等临时性分离群体不同,本研究使用的重组自交系群体是基因型纯合的永久群体,加性效应可以在上下代遗传,在选择后代中被固定和累加。脂肪含量的遗传率较高,可以在早期世代进行单株和株行定向选择,预测其衍生家系的表现,提高育种效率。
大豆脂肪含量是一个遗传基础复杂的数量性状。郑永战等[10]研究认为,大豆脂肪含量受2对加性互补主基因 + 多基因控制;而姚丹等[13]研究认为,大豆脂肪含量表现为多基因遗传模型,主要受多基因控制。而本研究认为在3个环境下大豆脂肪含量都表现为主基因遗传模型,无多基因效应,与前人研究结果存在差异,这可能与选用的试验材料、分离群体类型、环境条件以及分析方法的不同有关,需要进一步扩展到更多亲本以及不同类型群体进行分析验证。
5. 结论
本研究明确了大豆FG-RIL群体脂肪含量性状在3个环境下的最优遗传模型,均为3MG-CEA模型,表现为3对完全等加性主基因控制,无多基因效应,主基因遗传率为50.38%~63.81%,高油大豆育种时可以在早期世代选择,提升育种效率。
基金项目
江苏省自然科学基金(编号:BK20221278);生物育种钟山实验室项目(ZSBBL-KY2023-03);淮安市农业科学研究院科研发展基金(编号:HNY202223)。
NOTES
*通讯作者。