Hallander 2016贝叶斯 遗传参数 多变量

  1. Hallander J, Waldmann P, Wang C, Sillanpää MJ. Bayesian inference of genetic parameters based on conditional decompositions of multivariate normal distributions. Genetics [Internet]. 2010 [cited 2016 Nov 14];185:645–54. Available from: http://www.genetics.org/cgi/doi/10.1534/genetics.110.114249

人们广泛认识到,混合线性模型是用于在复杂谱系的分析中的参数估计的重要工具,其包括谱系和基因组信息,并且其中相互依赖的遗传因子通常假定遵循高维的多变量正态分布。我们已经开发了一种基于多变量正态分布的条件单变量分布产物的贝叶斯统计方法。这个过程允许在用户友好的计算机软件包WinBUGS内对复杂谱系的计算要求的遗传评价。为了证明和评价该方法的灵活性,我们分析了两个示例性家系:包括加性和显性多基因关系的苏格兰松(Pinus sylvestris L.)的大的非种系谱系和模拟的系谱,其中基于计算的基因组关系密集标记图。分析表明,我们的方法是快速的,并提供准确的估计,因此它应该是一个有用的工具,用于快速,可靠地估计复杂谱系的遗传参数。


遗传学的大量努力一直致力于揭示定量或复杂性状的基础遗传结构。传统上,多态模型已广泛用于估计天然和繁殖种群的遗传变异和育种值,其中无数的基因被假定为用于感兴趣的性状(Bulmer 1971; Falconer和Mackay 1996)。数量性状的遗传方差可以分解为对应于单个等位基因的影响的加性部分和由于等位基因之间的相互作用而是非加性的部分注意力一般集中在加性遗传方差(和遗传力)的估计,因为加性变异与通过育种者方程选择的反应成正比(FalconerandMackay1996,第11章)。然而,为了准确地估计加性遗传变异和遗传力,在遗传评价中识别潜在的非加性来源可能是重要的(Misztal 1997; Ovaskainenet al。2008; Waldmannet al。2008),特别是如果被分析的谱系包含大比例的全同胞和克隆(LynchandWalsh1998,第145页)。使用谱系和表型信息(即动物模型(Henderson 1984))的多源模型是用于估计遗传参数的选择模型在育种和自然种群中(Abney等人2000; Sorensen和Gianola 2002; O9Hara等人2008)。
分子技术的最近突破使得有可能创建全基因组单核苷酸多态性(SNP)图。这些图谱已经帮助揭示了大量的负责性状表达的新基因座,并且提供了关于数量性状的遗传结构的一般见解(例如,Valdar等人2006; Visscher 2008; Flint和Mackay 2009)。这些见解有助于在计算人类的疾病风险时,尝试提高育种计划的产量,以及在评估保护计划的相关性时。例如,在小鼠(Valdar等人2006),鸡(Muir等人2008)和奶牛(VanRaden等人2008)中,可以快速且相对便宜地对对科学和农业重要的许多物种的高密度SNP进行评分等人2009)。
在繁殖种群的分析中,包含密集标记数据与模拟中的传统表型模型相比,提高了遗传评价的预测能力(即可靠性)(Meuwissen等人2001; Calus等人2008 ; Hayes等人2009)和当使用真实数据时(Legarra等人2008; VanRaden等人2009; Gonza'lez-Recio等人2009).Meuwissen等人(2001)建议所有标记的影响应首先估计,然后相加,以获得基因组估计育种值(GEBV)。还提出了一种替代方法,其中所有标记物用于计算基因组关系矩阵(代替加性多基​​因关系矩阵)(例如,Villanueva等人2005; VanRaden 2008; Hayes等人2009);然后将该矩阵结合到统计分析中以估计GEBV。两种方法的比较(VanRaden 2008)在个体等位基因的作用小的情况下产生类似的GEBV估计。此外,如果不是所有谱系成员都具有标记信息,则可以计算来自基因型和未基因型个体的组合关系矩阵;这已显示增加GEBV的准确性(Legarra等人2009; Misztal等人2009)纳入标记信息的另一个合理的选择是在家族中使用低密度SNP板,并追踪来自高密度基因型祖先的SNP的影响,如Habier等人所建议的。 (2009)和Weigel et al。 (2009)。然而,需要快速和强大的计算机算法,其可以在数量性状的分析中尽可能有效地使用标记信息,以从全基因组标记数据获得精确的GEBV
本研究描述了一种将一般关系纳入遗传评价程序的高效贝叶斯方法的开发。该方法基于将多变量正态分布表示为一维正态分布的乘积,每个正则分布都取决于下降变量 - bles。当评价自然和繁殖种群的遗传参数时,高维分布通常用作各种遗传效应的先验分布,如加性多基因效应(Wang等,1993),多变量加性多基因效应Tassell和Van Vleck 1996),以及通过同样矩阵的数量性状基因座(QTL)效应(Yi和Xu 2000)。采用贝叶斯框架来获得所有未知参数的后验分布,通过使用软件包WinBUGS中的马尔科夫链蒙特卡罗(MCMC)采样算法来估计。(Lunn等人,2000,2009)。通过执行先前的计算的简单单变量条件分布的因式分解产物,MCMC估计程序的计算时间大大减少。这个特征允许对多基因模型和基因组关系模型的快速干扰。此外,分解允许不同程度的近交,因为正确的遗传协方差结构可以推断到分析中。在本文中,我们测试了两个以前发表的谱系数据集的方法:来自Scots pine的大型谱系的表型数据,加入和优势遗传关系的信息(Waldmann等人2008);和从模拟动物群体的全基因组扫描获得的基因组信息(Lund等人2009)。

你可能感兴趣的:(Hallander 2016贝叶斯 遗传参数 多变量)