分离世代多环境下数量性状主基因分离分析方法

doi:10.12677/HJAS.2021.114044

期刊菜单

分离世代多环境下数量性状主基因分离分析方法
Segregation Analysis of Major Genes for Quantitative Traits in Multiple Environments of Segregating Generations

DOI: 10.12677/HJAS.2021.114044, PDF, HTML, XML, 下载: 311 浏览: 1,213 科研立项经费支持
作者: 王建立, 刘志强, 赵景云, 仇永康, 任秀荣：驻马店市农业科学院，河南驻马店
关键词: 大豆；多环境；数量性状；混合分布模型；分离分析；Soybean； Multiple Environments； Quantitative Traits； Mixed Distribution Model； Segregation Analysis

摘要: 通过构建包括各种可能遗传效应的遗传模型及系数矩阵、基于EM算法实现的遗传参数和遗传率的估计、利用Akaike最大熵准则进行最佳模型的筛选等步骤，建立适合不同环境下数量性状分析的“多环境下数量性状主基因分离分析方法”，根据控制数量性状主基因数目不同，构建2大类10种遗传模型。结果表明，随着遗传率和联合世代群体样本容量的增加，各项遗传效应估计值的准确度和精确度随之提高，但比较遗传率和联合世代群体样本容量二者的功效，遗传率的作用明显高于样本容量；杂交组合驻豆03-9 × 中黄13的F₂、BC₁和BC₂群体，主茎节数均符合两对加性–显性–上位性主基因 + 基因型 × 环境互作效应遗传模型(B-1模型)。F₂代主茎节数的广义遗传率较高，说明该性状在F₂分离强度较大。主茎节数的各成分分布方差不等，对于不同表现型个体选择效果有差异。

Abstract: Through the construction of genetic model and coefficient matrix including various possible genetic effects, the estimation of genetic parameters and heritability based on EM algorithm, and the selection of the best model by using Akaike maximum entropy criterion, a quantitative trait analysis model suitable for different environments was established. According to the number of major genes controlling quantitative traits, 10 genetic models of 2 categories were constructed. The results showed that with the increase of heritability and sample size of combined generation population, the accuracy and precision of the estimated genetic effects were improved, but the effect of heritability was significantly higher than that of sample size in comparison of heritability and sample size of combined generation population; the number of main stem nodes of F₂, BC₁ and BC₂ populations of Zhudou 03-9 × Zhonghuang 13 were in accordance with the two additive pairs: The genetic model of interaction effect of sex dominant epistatic major gene and genotype × environment (B-1 model). The broad sense heritability of the number of main stem nodes in F₂ generation was higher, which indicated that the segregation intensity of this trait was higher in F₂ generation. The variance of each component in the number of nodes of main stem was different, and the selection effect was different for different phenotypes.

文章引用：王建立, 刘志强, 赵景云, 仇永康, 任秀荣. 分离世代多环境下数量性状主基因分离分析方法[J]. 农业科学, 2021, 11(4): 297-305. https://doi.org/10.12677/HJAS.2021.114044

1. 引言

在作物育种和遗传学研究过程中，很多时候是将一套遗传材料在不同环境下种植，这时不但要考虑主基因的遗传效应，还要兼顾基因型与环境互作效应对表型数据的影响。对于不同环境下的遗传试验，多数研究方法不能同时考虑主基因遗传效应和主基因与环境互作效应，只有个别研究应用似然比检验方法进行了一对主基因效应的探讨。吴为人 [1] 将主基因 × 环境作为固定效应，应用似然比检验了不同环境下分布平均数的差异，进而推断基因型 × 环境互作效应，该方法的研究结果只适合特定的环境。姜长鉴 [2] [3] [4] 推导了基因型 × 环境互作效应的极大似然估计和似然比测验，但不能够在基因型与环境互作效应同时存在时将二者区分。这些问题主要原因是在建立混合分布模型时，假定这些观测值是来源于同一成分分布，在成分分布中主要考虑固定效应，而对于成分分布中各随机效应作为一个总体，没有将固定效应和随机效应进一步按照其来源进行分解。值得借鉴的是Lou和Zhu [5] [6] 将主基因和多基因均作为随机效应，采用混合模型分析了多亲本交配群体的二倍体和三倍体的主基因和多基因效应及其基因型 × 环境互作效应，该方法适用于主基因已知的情况。虽然该方法没能够解释主基因的数目和效应，但却显示出了通过混合线性模型进行主基因遗传分析的可行性。受此启示，本文将混合线性模型分析方法与混合分布模型相结合，配合了基于EM算法的极大似然估计方法，构建了“基于混合线性模型的混合分布模型中遗传效应估计方法”，突破混合分布模型只能分析固定效应的不足，可以有效降低试验误差，提高基因的检测功效和遗传参数估计的准确度和精确度，还可以显著提高基因的发现能力。该方法不但在本文中能够同时估计各种遗传效应和基因型 × 环境互作效应，还能在其他混合分布模型中应用。因此，该方法可为数量遗传的研究提供理论依据，对于准确选择表现稳定的育种材料，具有指导意义。

2. 材料与方法

2.1. 遗传材料与田间试验

以相对性状差异较大的两个大豆亲本东农驻豆03-9 × 中黄13配制杂交组合，第二年将部分杂交种子(F₁)自交，得到杂种二代(F₂)，将部分杂交种子(F₁)分别与亲本杂交，得到回交世代(BC₁和BC₂)，构建包括P₁、F₁、P2、F₂、BC₁、和BC₂的遗传群体，在2个环境下种植，其中P₁、F₁、P₂各收获30株，F₂各收获270株，BC₁和BC₂各收获120株，收获后测定形态性状主茎节数。

对于所获得的形态性状数据采用本文提出的多环境下数量性状主基因分离分析方法用SAS/IML编写程序进行分析。

2.2. 统计分析方法

2.2.1. 构建各种可能的主基因遗传模式的遗传模型

将各遗传模型汇总如下，见表1。

Table 1. Multi-environment quantitative trait major gene models

表1. 多环境下数量性状主基因遗传模型

以两对加性–显性–上位性主基因 + 基因型 × 环境互作效应遗传模型(B-1)为例说明。

假定某一性状受两对基因位点A-a和B-b控制，若两主基因间不存在连锁，且两对主基因表现为加性–显性–上位性效应，则B-1遗传模型服从两对主基因加性–显性–上位性遗传模型，则对于第l个环境下第i个世代第j个个体该性状上的表型值 $y_{l i j}$ 的模型为

$y_{l i j} = m + a_{A} + a_{b} + d_{A} + d_{B} + i + j_{A B} + j_{B A} + l + a_{A} E_{l} + a_{B} E_{l} + d_{A} E_{l} + d_{B} E_{l} + i E_{l} + j_{A B} E_{l} + j_{B A} E_{l} + l E_{l} + ε_{l i j}$

在以上模型中，m为均值， $a_{A}$ 、 $a_{B}$ 分别为主基因加性效应， $d_{A}$ 、 $d_{B}$ 分别为主基因显性效应，i为两主基因加性与加性互作效应， $j_{A B}$ 为两主基因加性与显性互作效应， $j_{B A}$ 为两主基因显性与加性互作效应，l为两主基因显性与显性互作效应，为固定效应； $a_{A} E$ 、 $a_{B} E$ 分别是两个主基因的加性 × 环境互作效应， $d_{A} E$ 、 $d_{B} E$ 分别为两个主基因的显性 × 环境互作效应向量， $i E$ 是两个主基因加性 × 加性 × 环境互作效应， $j_{A B} E$ 是两个主基因加性 × 显性 × 环境互作效应， $j_{B A} E$ 是两个主基因显性 × 加性 × 环境互作效应， $l E$ 是两个主基因显性 × 显性 × 环境互作效应，为随机效应。

以上模型可表示如下矩阵形式

$y = X b + U V$

其中， $b = {[\begin{matrix} m & a_{A} & a_{B} & d_{A} & d_{B} & i & j_{A B} & j_{B A} & l \end{matrix}]}^{T}$ 为主基因固定效应遗传参数向量，

$V = {[\begin{matrix} σ_{a_{A} E}^{2} & σ_{a_{B} E}^{2} & σ_{d_{A} E}^{2} & σ_{d_{B} E}^{2} & σ_{i E}^{2} & σ_{j_{A B} E}^{2} & σ_{j_{B A} E}^{2} & σ_{l E}^{2} & σ_{ε}^{2} \end{matrix}]}^{T}$ 为主基因与环境互作效应遗传参数向量，X

为主基因遗传参数系数向量。

2.2.2. 遗传效应参数估计

对于第l个环境下第i个世代第j个体，是由9个主基因型按照比例 $p_{t} (\sum_{t} p_{t} = 1)$ 进行混合，具有概

率密度函数

$f (y_{l i j}) = \sum_{t = 1}^{9} p_{l i j t} f_{l i j t}$

其中，

$f_{l i j t} = \frac{1}{\sqrt{2 π U V}} \exp \frac{- {(y_{l i j} - X b)}^{2}}{2 U V}$

$f_{l i j t}$ 为第l个环境下第i个世代群体中第j个个体在t基因型时某性状的观察值的密度函数。试验群体中全部观察值的联合似然函数为

$L = \underset{l}{Π} \underset{i}{Π} \underset{j}{Π} \sum_{t} f_{l i j t} (y_{l i j})$

在以上模型中，待估计参数为m、 $a_{A}$ 、 $a_{B}$ 、 $d_{A}$ 、 $d_{B}$ 、i、 $j_{A B}$ 、 $j_{B A}$ 、l、 $σ_{a_{A} E}^{2}$ 、 $σ_{a_{B} E}^{2}$ 、 $σ_{d_{A} E}^{2}$ 、 $σ_{d_{B} E}^{2}$ 、 $σ_{i E}^{2}$ 、 $σ_{j_{A B} E}^{2}$ 、 $σ_{j_{A B} E}^{2}$ 、 $σ_{l E}^{2}$ 和 $σ_{ε}^{2}$ 。

对L取自然对数，得

$\ln L = \sum_{l} \sum_{i} \sum_{j} \ln \sum_{t} f_{l i j t} (y_{l i j})$

② 遗传参数基于EM算法的极大似然估计的步骤

E-步：

$w_{l i j t} = \frac{p_{l i j t} f_{l i j t}}{\sum_{l} \sum_{i} \sum_{j} \sum_{t} p_{l i j t} f_{l i j t}}$

M-步：

$A = [\begin{matrix} \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} x_{t 0 i j} x_{t 0 i j} R & \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} x_{t 0 i j} x_{t 1 i j} R & \dots & \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} x_{t 0 i j} x_{t 8 i j} R \\ \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} x_{t 1 i j} x_{t 0 i j} R & \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} x_{t 1 i j} x_{t 1 i j} R & \dots & \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} x_{t 1 i j} x_{t 8 i j} R \\ ⋮ & ⋮ & ⋱ & ⋮ \\ \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} x_{t 8 i j} x_{t 0 i j} R & \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} x_{t 8 i j} x_{t 1 i j} R & \dots & \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} x_{t 8 i j} x_{t 8 i j} R \end{matrix}]$

$C = [\begin{matrix} \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} x_{t 0 i j} S \\ \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} x_{t 1 i j} S \\ ⋮ \\ \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t}_{t 8 i j} S \end{matrix}]$

$b = A^{- 1} C$

$H = [\begin{matrix} \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} U_{t 1 i j} U_{t 1 i j} T & \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} U_{t 1 i j} U_{t 2 i j} T & \dots & \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} U_{t 1 i j} U_{t ε i j} T \\ \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} U_{t 2 i j} U_{t 1 i j} T & \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} U_{t 2 i j} U_{t 2 i j} T & \dots & \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} U_{t 2 i j} U_{t ε i j} T \\ ⋮ & ⋮ & ⋱ & ⋮ \\ \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} U_{t ε i j} U_{t 1 i j} T & \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} U_{t ε i j} U_{t 2 i j} T & \dots & \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} U_{t ε i j} U_{t ε i j} T \end{matrix}]$

$I = [\begin{matrix} \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} U_{t 1 i j} O \\ \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} U_{t 2 i j} O \\ ⋮ \\ \sum_{l} \sum_{i} \sum_{j} \sum_{t} w_{l i j t} U_{t ε i j} O \end{matrix}]$

$V = H^{- 1} I$

其中，

$R = \frac{σ_{ε}^{2}}{U V}$

$S = \frac{(y_{l i j} - X b)}{U V} + \frac{{(y_{l i j} - X b)}^{2} (X b) σ_{ε}^{2}}{{(U V)}^{2}}$

$U_{ε} = {(X b)}^{2}$

$T = \frac{1}{{(U V)}^{2}}$

$O = \frac{{(y_{l i j} - X b)}^{2}}{{(U V)}^{2}}$

2.2.3. 最佳模型选择

按照Akaike最大熵准则，具有最小AIC值的模型即为最佳模型 [7]，AIC为 $AIC = - 2 \ln f (y) + 2 h$ ，其中，h为独立参数个数。

当不同模型间的AIC值差异不大时，为进一步鉴别最佳模型，采用适合性检验。检验方法采用均匀性检验、Smirnov检验和Kolmogorov-Smirnov检验。其中，均匀性检验有3个统计量，服从自由度为1的 $χ^{2}$ 分布。

$U_{1}^{2} = \frac{12}{n} {[\sum F (x_{i}) - \frac{n}{2}]}^{2} ~ χ_{d f = 1}^{2}$

$U_{2}^{2} = \frac{45}{4 n} {[\sum F^{2} (x_{i}) - \frac{n}{3}]}^{2} ~ χ_{d f = 1}^{2}$

$U_{3}^{2} = \frac{180}{n} {\sum {[F (x_{i}) - \frac{1}{2}]}^{2} - \frac{n}{2}}^{2} ~ χ_{d f = 1}^{2}$

Smirnov检验统计量为

$W^{2} = \frac{1}{12 n} + \sum {[F_{0} (x_{(r)}) - \frac{r - 0.5}{n}]}^{2}$

当 $n > 3$ 时， $W_{0.05}^{2} = 0.461$ ， $W_{0.01}^{2} = 0.743$

Kolmogorov-Smirnov检验统计量为

$D_{n} = \max_{1 \leq x \leq n} | F_{n}^{*} (x) - F_{0} (x) |$

当 $n > 10$ 时， $D_{n, 0.05} \approx \frac{1.358}{\sqrt{n}}$ ， $D_{n, 0.01} \approx \frac{1.628}{\sqrt{n}}$

3. 结果与分析

3.1. 最优遗传模型

将不同遗传模型下的AIC值列于表2。

Tabie 2. AIC value of different generation

表2. 不同世代AIC值

从表2可以看出，对于F₂、BC₁和BC₂群体主茎节数，B-1模型的AIC值最小，且显著低于其它模型。说明主茎节数受两对等位基因控制，符合两对加性–显性–上位性主基因 + 基因型 × 环境互作效应遗传模型，这与宁海龙的结果相同 [8]。

3.2. 遗传参数估计

应用“基于混合线性模型的混合分布模型中遗传效应估计方法”，估计备选遗传模型的遗传参数。将大豆杂交组合东农L13 × 黑河36的F₂、BC₁和BC₂3个世代群体的各项遗传参数列于表3和表4。

Table 3. Estimation of genetic parameters of major gene

表3. 主基因遗传效应参数估计值

从表3可以看出，F₂、BC₁和BC₂3个世代主茎节数的主基因遗传率分别为0.6508、0.2459和0.5736，以上3个世代中F₂世代的主基因遗传率较高。说明该性状传递给子代的传递能力较强，受环境条件的影响较小，即主基因 × 环境互作遗传率较低；针对大豆主茎节数在F₂世代分离强度较大；杂交早世代主茎节数的广义遗传力与组合配置有关，母本主茎节数多的组合，主茎节数广义遗传力大于母本主茎节数少的组合。

Table 4. Estimation of genetic parameters of distribution of different components

表4. 不同成分分布遗传效应参数估计值

从表4可以看出，F₂、BC₁和BC₂3个分离世代主茎节数的各成分分布方差不等，说明对于不同表现型个体选择效果有差异。

4. 讨论

本文提出利用多环境下数量性状主基因分离分析方法，通过大量的模拟研究发现，对于分离世代，随着遗传率和分离世代样本容量的增加，遗传参数估计的准确度和精确度随之提高，但比较二者的功效，遗传率的作用明显高于样本容量。这与黄蛟龙 [9]、肖静 [10] 的结果相同。此结果表明，通过表型分析通常只能发现效应较大的主基因，对于效应较小的主基因，即使样本容量很大也难以被检测到。此时为了提高主基因的发现能力，一是可以借助其他遗传信息，如分子标记基因型信息；二是可以通过多环境下测定多个遗传世代的一些性状进行本研究的联合分析。

在对大豆主茎节数实例分析中发现，F₂世代的主基因遗传率显著高于回交世代。因此，在对大豆主茎节数进行选择时，采用主茎节数少的品种回交不利于后代群体平均节数的增加，有利于回交后代群体分离强度保持在较高水平，扩大选择空间；而采用主茎节数多的品种回交虽有利于后代群体平均节数的增加，但回交后代群体分离强度偏低,选择空间缩小。这与曹永强 [11] 的结果相同。

本文对分离世代群体多环境下数量性状主基因分离分析方法进行了详细论述，并对该方法进行了模拟研究和实例分析。结果表明，本方法明显提高了遗传效应估计值的精确度和准确度，但目前该方法只对分离世代进行了联合分析，且只考虑了受主基因控制的情况，该方法仍有待于完善。1) 提出可以分析多环境下主基因 + 多基因分离分析方法，以进一步提高本研究方法对遗传参数估计的准确度和精确度。2) 在该方法的基础上，重新推导各种可能遗传模型的系数矩阵，加入家系世代F_2:3、BC_1:2、BC_2:2和不分离世代DH、RIL等群体进行联合分析，提高本方法的应用范围。

5. 结论

本文提出了基于混合线性模型的混合分布模型中遗传效应估计方法；构建适合不同世代遗传群体分析的“多环境下数量性状主基因分离分析方法”，根据不同主基因数目，构建2大类10个遗传模型；利用本文提出多环境下数量性状主基因分离分析方法进行遗传效应估计，可以增加主基因效应和剩余变异估计值的准确度和精确度，随着遗传率和联合世代群体样本容量的增加，各项遗传效应估计值的准确度和精确度随之提高，而对于遗传力和样本容量两个影响主基因检测效能的关键因素来说，其作用效果是遗传力明显高于样本容量；对于大豆杂交组合驻豆03-9 × 中黄13的F₂、BC₁和BC₂群体，主茎节数均符合两对加性–显性–上位性主基因 + 基因型 × 环境互作效应遗传模型(B-1模型)。F₂代主茎节数的广义遗传率高于回交世代，该性状在F₂世代分离强度较大，选择效果较好。主茎节数的各成分分布方差不等，对于不同表现型个体选择效果有差异。

基金项目

河南省甘薯杂粮产业技术体系(Z2020-14-02)；河南省科技攻关(212102110307)。

参考文献

[1]	吴为人. 多环境试验中质量–数量性状的遗传分析[J]. 作物学报, 1999, 25(6): 723-726.
[2]	姜长鉴. 数量性状主要基因随机效应的分析[J]. 生物数学学报, 1995, 10(1): 39-44.
[3]	姜长鉴, 莫惠栋. 质量–数量性状的遗传分析IV.极大似然法的应用[J]. 作物学报, 1995, 21(6): 641-648.
[4]	姜长鉴, 刘学峰. 纯系间数量性状主基因差异的遗传分析[J]. 遗传学报, 1995, 22(1): 59-64.
[5]	Lou, X.Y. and Zhu, J. (2002) Analysis of Genetic Effects of Major Genes and Polygenes on Quantitative Traits I. Genetic Model for Diploid Plants and Animals. Theoretical and Applied Genetics, 104, 414-421. https://doi.org/10.1007/s001220100692
[6]	Lou, X.Y. and Zhu, J. (2002) Analysis of Genetic Effects of Major Genes and Polygenes on Quantitative Traits. II. Genetic Models for Seed Traits of Crops. Theoretical and Applied Ge-netics, 105, 964-971. https://doi.org/10.1007/s00122-002-0958-5
[7]	Akaike, H. (1997) On Entropy Maximum Principle. In: Krishnai-ah, P.R., ed., Applications of Statistics. North-Holland Publishing Company, Amsterdam, 27-41.
[8]	宁海龙, 梁世鑫, 蒋红鑫, 等. 应用极大似然法分析大豆四向重组自交系群体株高与主茎节数的主基因遗传效应[J]. 大豆科学, 2013, 32(4): 438-444.
[9]	黄蛟龙, 曹致琦, 马海燕, 等. 极大似然法探测主基因的效能[J]. 作物学报, 2003, 29(1): 133-137.
[10]	肖静, 胡治球, 汤在祥, 等. 多个相关数量性状主基因的联合分析方法[J]. 中国农业科学, 2005, 38(9): 1717-1724.
[11]	曹永强, 董丽杰, 吕桂兰, 等. 大豆不同亲本正、反交F2、F3、BC1、F2主茎节数遗传规律研究[J]. 大豆科技, 2009(1): 18-21.

为你推荐

友情链接