Waldmann 2006 REML VS. Bayesian 多性状

  1. Waldmann P, Ericsson ÆT, Ericsson T. Comparison of REML and Gibbs sampling estimates of multi-trait genetic parameters in Scots pine. Theor. Appl. Genet. 2006;112:1441–51.

摘要
多性状(协)方差估计是植物和动物育种的重要课题。在这项研究中,我们比较了从限制最大似然(REML)和贝叶斯Gibbs抽样的模拟数据和三个性状(直径,高度和分支角度)从26年的部分双列子代测试的苏格兰松(樟子松L.)。基于模拟数据的结果,我们可以得出结论,REML估计是准确的,但是吉布斯采样的后验分布的模式可以高估,取决于遗传力的水平。后代的平均值和中位数显着高于遗传力的预期值。用Δ法计算的置信区间向下偏移。最高概率密度(HPD)间隔提供更好的间隔估计,但可以在较低水平上稍微偏置。对于苏格兰松数据,发现REML和吉布斯样本估计之间存在类似的差异。我们得出结论,需要进一步的模拟研究,以评估不同先验对遗传个体模型中(共)方差分量的影响。


介绍
在最佳效益的育种中,通常存在受到最大关注的主要关键性状。然而,还有其他经常值得考虑的特征,因为它们在关键特征或其特性受到影响的情况下对最终或未来结果做出贡献。实例是家畜的健康性状和木材生产树的树干质量性状,其中数量生产能力通常是育种的主要特征。具有一定重要性的所有性状的有利发展需要用于同时评估的方法,例如长期以来在育种工业中已经使用的多特征限制最大似然(REML)协方差估计(例如Meyer和Thompson 1986; Meyer 1991 )。主要目的是揭示相互关系是有利还是不利于未来选择(即,根据研究的目的评估性状是正相关还是负相关)。多特征“动物(或树或个体)模型”由Henderson和Quaas(1976)在定量遗传学中引入。基于个体模型的技术在估计方差分量和预测育种值方面比传统的基于家庭的方法更好,因为它们可以使用来自谱系的所有信息,并且对通过选择引入的偏差较不敏感(Sorensen和Kennedy 1984; Henderson 1986; Borralho 1995)。
历史上,大多数分析在定量遗传学已经用古典(也称为频率)ANOVA方法进行。概率在这里从在相同条件下假设地重复实验大量次的框架下观察。现在,ANOVA方法已经在很大程度上被REML方法取代,用于估计(共)方差分量和使用(近似)最佳线性无偏预测器(BLUP)预测育种值。最初由Patterson和Thompson(1971)描述的用于非平衡混合模型的REML方法已经广泛用于动物育种。然而,REML方法需要一种迭代技术,通常倾向于在计算上非常苛刻,特别是对于多变量数据集,因此已经投入了大量的努力来开发更有效的算法。已经开发了用于多特征模型中的REML估计的各种计算程序,例如, (Meyer 1991),期望最大化(EM)方法(Misztal和Perez-Encisco 1993)和平均信息(AI)方法(Jensen等人,1996)。通常,这些REML方法使用迭代算法来找到似然的最大值。遗憾的是,尽管很容易获得所得参数估计值(方差分量)的估计值,但是要计算这些参数函数的可靠置信区间要困难得多(Harville和Fenech,1985; Burch和Iyer 1997; Soria等人1998)。
计算能力的当前进步实际上导致了在遗传学中统计方法的发展中的贝叶斯革命(Shoemaker等人1999; Sorensen和Gianola 2002; Xu 2003; Beaumont和Rannala 2004)。在贝叶斯范式中,概率可以被理解为对不确定性或信念程度的度量。贝叶斯方法在复杂情况下特别有用,并且通常比普通频率方法更容易解释。鉴于许多遗传问题的复杂性,很明显贝叶斯方法可以大大有助于改进分析。贝叶斯马尔科夫链蒙特卡罗(MCMC)方法在1990年代上半年在定量遗传学中被引入(Wang等人1993; Sorensen等人1994),通过吉布斯采样程序的发展促进(Geman和Geman 1984; Gelfand和Smith 1990)。吉布斯采样器连续地从模型中的所有参数的条件分布中采样,以便产生边际后验分布的随机样本,其是贝叶斯推理的目标。吉布斯取样已经在动物育种中广泛实施,并且已经开发了用于多特征评价的不同算法(例如Jensen等人1994; van Tassel和Van Vleck 1996)。然而,在植物应用中的吉布斯取样仍然很少(例如Soria等人1998; Gwaze和Woolliams 2001; Zeng等人2004; Waldmann等人2005)。
这项研究的主要目标是比较REML和吉布斯抽样估计的遗传参数从多个性状个别树模型。这些方法适用于来自瑞典北部的苏格兰松(Pinus sylvestris L.)二年级后代试验的模拟数据和数据,测量三种性状(博尔直径,树高和分枝角)。我们将分析限制为加性模型,因为加性组分最容易应用于基于有性繁殖群体的轮回选择的实际育种。

你可能感兴趣的:(Waldmann 2006 REML VS. Bayesian 多性状)