Blonk2010 分子关系 系谱重建

Blonk R J W, Komen H, Kamstra A, et al. 2010. Estimating breeding values with molecular relatedness and reconstructed pedigrees in natural mating populations of common sole, Solea Solea. Genetics, 184(1): 213–219.

摘要

群体中天然交配用于获得后代的捕食群体通常产生不平衡的种群结构,具有高度偏倚的亲本贡献和未知的家系。因此,对于遗传参数估计,需要使用DNA标记数据重建或估计关系。对于亲本未知和自然交配群体,常用的谱系重建方法不准确,导致数据丢失。然而,相关性估计量推断了所有采样动物之间的关系。在这项研究中,我们比较了谱系相关性方法和相关性估计(“分子相关性”)方法,使用估计的育种值的准确性。使用普通鞋底,Solea鞋底的商业数据集,其中有51名父母和1953名后代(“完整数据集”)。由于缺少父母,对于1338个后代,可以用10个微卫星标记(“缩减数据集”)重建谱系。使用减少的数据集的两种方法的交叉验证显示了谱系重建的估计育种值为0.54的准确度,而分子相关性为0.55。当对整个数据集应用分子相关性时,估计育种值的准确性提高到0.60。我们的研究结果表明,血统重建和分子相关性在对家庭贡献偏差的人群中同样良好地预测了育种价值。这可能是由于少数大型全同胞家庭的存在。然而,不同于谱系重建的方法,分子相关性方法确保所有基因型候选者的可用性,这导致育种值估计的准确性更高

估计遗传参数,个体之间的加性遗传关系从已知的谱系推断(Falconer和Mackay 1996; Lynch和Walsh 1997)。然而,在自然种群(Ritland 2000; Thomas et al。2002)和用群体中自然交配用于获得后代的圈养物种(Brown等,2005; Fessehaye et al。2006; Blonk et al。,2009)家系是重建。在这些人群中,不能控制交配结构,并且通常获得具有高度偏倚的亲本贡献的不平衡的群体结构(Bekkevold等人2002; Brown等人2005; Fessehaye等人2006; Blonk等人,2009)。为了重建家系,常常使用父母分配方法(Marshall等人1998; Avise等人2002; Duchesne等人2002)。这些方法要求所有的父母都知道。对于父母信息不可用的情况,已经开发了许多基于DNA标记的估计分子相关性的方法(Lynch 1988; Queller and Goodnight 1989; Ritland 2000; Toro et al.2002)。

这些相关性估计量确定个体之间的关系值连续规模。在植物和动物的真实和模拟数据中评估相关性估计量(例如,参见Van de Casteele等人2001; Milligan 2003; Oliehoek等人2006; Rodr磇guez-Ramilo等人2007; Bink等人2008 )一般侧重于估计遗传变异或相关性值的偏差和抽样误差。他们对育种价值估算的效率相对较少。

目前有两种类型的相关性估计器:方法矩估计器和最大似然估计器。方法矩估计(例如,Queller and Goodnight 1989; Li et al.1993; Ritland 1996; Lynch and Ritland 1999; Toro et al.2002)在不同方式计算对之间的等位基因共享时确定关系。方法矩估计的一个变体是使用“显性谱系重建”(Ferna磏dez和Toro 2006)或阈值(Rodr磇guez-Ramilo等人,2007)将连续相关性值转换为分类系谱关系。然而,转化的同事与已知的家系共同体的相关性较低(Rodr磇guez-Ramilo等人,2007)。几项研究比较了不同的方法估计量,但没有一个显示出单一的最佳估计量(Van de Casteele et al.2001; Oliehoek et al。2006; Rodr磇guez-Ramilo et al。2007; Bink et al。2008)。

最大可能性(ML)方法将动物分类为有限数量的关系类别(Mousseau et al。1998; Thomas et al。2002; Wang 2004; Herbinger et al。2006; Anderson and Weir 2007)。对于每一对,鉴于其基因型和表型,计算出可能陷入可能的相关性级别(例如,全同胞与不相关)。 ML技术结合马尔可夫链蒙特卡罗方法联合重建具有特定关系的群体,因此比其他ML方法更有效。为了最小化标准误差,所有讨论的ML方法都需要平衡的人口结构,大的兄弟组和相关性的大的差异(Thomas et al。2002; Wang 2004; Anderson and Weir 2007)。因此,这些方法可能不适合天然配对系统。

与父母分配方法不同,相关性估计者的好处在于,即使缺少父母,基本上所有选择候选人都被保留用于育种价值估算。然而,问题是,这种相关性估计量是否也能给出准确的育种值来进行选择。

在本研究中,我们测试了一个相关性估计器的适应性,以获得通过自然交配获得的普通唯一Solea sole(n?1953)群体的育种价值。首先,我们使用动物的系谱相关性估计育种值,可以重建谱系(使用父母分配)。这个数据集(n?1338)被进一步称为“简化数据集”。我们使用简单而鲁棒的方法矩相关性估计器将结果与估计的育种值进行比较:“分子相关性”(Toro et等,2002,2003)。接下来,我们使用全数据集(n?1953)中的分子相关性来估计育种值。结果表明,用分子相关性和谱系相关性得到的估计育种值的准确度是可比的。当在完整数据集中估计具有分子相关性的育种值时,精度增加。这意味着可以使用分子相关性估计来估计自然交配群体中的育种价值。

分子相关性与重建血统关系的比较:

在相关性值之间以及从分子相关性和重建系谱获得的育种值之间计算Pearson相关性。为了评估两种方法将模型拟合到数据中,使用每种方法的交叉验证来计算预测表型的准确性。对于交叉验证,数据集被随机分为100个相等大小的子集。遗传模型的遗传分析随后在所有子集上进行100次,同时一次省略1个亚型的表型记录。在每个分析中,对于省略观察到的表型的子集,根据其他子集中可用的观察表型预测表型。
对遗传分析的观察和预测表型进行了固定效应的校正(称为“校正表型”)。估计育种值(rHI)的准确度计算为

其中rP ^ P是预测的校正表型与从交叉验证观察到的观察到的校正表型之间的Pearson相关系数,使用血统重建估计健康。所有计算使用R(R Development Core Team 2008)进行。

你可能感兴趣的:(Blonk2010 分子关系 系谱重建)