Vidal2015 系谱重建 多系杂交

Vidal M, Plomion C, Harvengt L, et al (2015) Paternity recovery in two maritime pine polycross mating designs and consequences for breeding. Tree Genet Genomes. doi: 10.1007/s11295-015-0932-4

多系杂交交配系统广泛用于林木育种以进行基因测试。基于多交叉测试的向后选择假设等同的男性生殖成功和真正的半同胞子代。本研究的主要目的是,首先,调查海洋松树多环试验中偏离这些假设,其次,评估遗传力和育种价值估计的后果。来自98个半同胞家族的总共984个后代用单核苷酸多态性标记进行基因分型以恢复完全系谱。在99%的置信水平上,89%的后代成功地分配了父亲。我们因此得出结论,存在11%的花粉污染率,假设当没有来自多聚组合物的基因型可被鉴定为父亲的污染时。父亲对子代的贡献在男性中有所不同,但是从半同胞假设的偏离是中度的,因为家族中的平均遗传相关性为0.26。使用具有部分或全部谱系信息的个体树混合模型估计乳房高度和茎干扫描的围长的遗传力和育种值。结果突出显示遗传性估计中的一个轻微的偏差,由于未知的父亲,以及部分和完全家系模型之间的估计育种值的高相关性,表明用于向后选择的父母代的遗传优点是充分预测使用部分谱系模型。最后,还从前向选择的角度讨论了谱系恢复。


介绍
树繁殖一般遵循经典的轮回选择方案,其特征是繁殖,测试和选择的重复循环(White 1987; Zobel和Talbert 1984)。在针叶树中,对于进一步育种或包括在生产种群(种子园)中的最佳个体的选择通常基于加性遗传值进行,因为自花授粉种子果园通常用于部署。基因型的育种值定义为其基因的平均效应的总和,并且在此估计其后代的性能。因此,建立了大量的多交叉试验来评估育种值,并对女性父母进行排序以进行反向选择(Burdon和Shelbourne,1971)。通过混合来自几个雄性的花粉并将所得的混合物施用于分离的雌花来进行多瘤交配。由于每个个体后代的雄性亲本是未知的,遗传参数和育种值的估计基于一个女性的所有后代都是真正半同胞的假设(Squillace 1974),并且男性父母的平等贡献发生(Moriguchi等人2009)离开这些假设可能导致高估加性遗传变异和遗传增益的预测,因为相关性将被低估
由于可行的可靠的DNA标记,加上强大的谱系重建方法,不完全谱系试验可以转换成完整的谱系试验。大多数系谱回收研究表明,受控多环试验中的父系贡献是不等的(Moriguchi et al。2009);这已经证实了Pseudotsuga menziesii(Nakamura和Wheeler 1992),桦树(Pasonen等人1999),云杉粉(Aronen等人2002),杨树属(Wheeler等人2006),辐射松(Kumar等人2007)和云杉(Picea rubens Sarg)(Doerksen和Herbinger 2008)。在Pinus taeda(Wiselogel和Vanbuijtenen 1988)的多育种(有9个花粉供体)的后代中发现了同等的父系贡献。男性之间的差异性生产成功不一定导致同一家族中子代之间的遗传相关性的显着增加(Doerksen和Herbinger2010; Hansen和Nielsen2010)或过度估计加性遗传方差(Doerksen和Herbinger 2010; Hallingback和Jansson 2013)。最近的研究通过对来自开放授粉种子园的后代进行基因分型,研究了不平等父亲贡献和/或自交对遗传参数和估计育种值(EBV)的影响(El-Kassaby等人2011; Gaspar等人2009 ; Hallingback和Jansson 2013; Hansenand McKinney 2010; Hansen和Nielsen 2010; Klapste等人2014; Korecky等人2013)或来自多环交配设计(Doerksen和Herbinger 2010; Kumar等人2007)。这些作者观察到,与其各自的估计,包括父子信息相比,没有父子信息的个体遗传力可能更大或更小
在法国沿海松(Pinus pinaster Ait。)育种程序中,一方面基于多克隆测试(反向选择)来选择生产种群,另一方面,基于全同胞选择下面的育种代家庭测试(前向选择)。对于这个物种,代表在法国最常见的种植的林木,大型基因组资源最近公布,包括单基因集(Canales等人2014)和单核苷酸多态性(SNP)标记的目录(Chancerel et al。 2013)。这些分子标记物构成了在多环试验中恢复父系身份的可靠工具。在这种情况下,本研究的主要目的是在海洋松树中首次调查偏离基于多交叉试验的向后选择的假设。为此,我们首先回收970个成功基因型后代(从984后代样品中)获得的父亲身份,使用SNP标记从两种不同的多聚体(PMX)获得,然后我们评估花粉污染率(即不属于PMX组成),研究偏离相等的父亲贡献,并测试女性父母的春天是否是真正的半同胞;最后,我们研究了遗传性和育种价值的估计由于未知的父亲身份的偏差。

结果

SNP基因分型

四百八十九个后代(子集A)和它们各自的91G1亲本用65个SNP标记基因分型,并且495个后代(Subset_B)和它们各自的82G1亲本用80个SNP标记基因分型。当在Sequenom输出数据中显示测定失败的个体的比例大于30%时,SNP标记被认为是不可靠的(因此被排除在进一步分析之外)。总体上,分别为子集A和子集B最终保留56和63个SNP。他们在海洋松树连锁图上的位置来自Chancerel et al。 (2013)作为补充信息提供。当考虑所有基因座时,两组标记物的组合排除功率高于0.99.此外,用于对Subset_B进行基因分型的优化标记物组的63个SNP之间的LD非常低(r2平均值= 2.5×10-3 ,min = 1.9×10 -9,max = 0.24)。应当注意,最后(984个中的970个)后代用至少42个SNP进行基因分型。低于该阈值的14 G2树被简单地从进一步分析中去除(表1)。类似地,所有G1个亲本(除了来自PMX_A的一个花粉供体,其在克隆档案中不可获得的)成功地用至少42个SNP进行基因分型。雄性(90个花粉供体中的62个)的分娩基因分型两次来自两个克隆档案的不同分株),并进行比较:确认所有的身份。

父亲恢复

母亲身份是我们检查的第一个。总共41个后代(分析的970个)不符合他们的名义种子供体基因型。强调了两种类型的谱系错误:(i)当错误仅与给定家族中的一个G2子代相关时,可能是在错误的基因型上收集了该后代的针(这是11个后代的情况); (ii)当错误与某个家庭的所有后代相关时,错误的母系身份很可能(3个种子亲本及其10个子代的情况)。鉴定为母体错配的所有这41个后代被排除在亲子分析之外,因此,在剩余的929个子代(子集A中为460,子集B中为469,参见表1)中进行父亲恢复。对于828个后代成功地恢复了父亲:87和91.3%分别被分配给子集A和子集B中的PMX的花粉供体成员(置信度为0.99)。

花粉污染率在polymix交配

在这项研究中,我们考虑了花粉污染率作为不能归属于PMX的已知花粉亲本的统计支持> 99%的后代的比例。总体上,60(13%)和41(8.7%)后代子集A和子集B分别被外部花粉清楚地产生(表1)。因此,整个抽样的平均花粉污染率为10.9%。污染率从0至70%变化,取决于家族(每个家族基因分型为9至12个)。在子集A中,17个家庭没有受到外国父母的污染,25个家庭有1或2个外来父母的子女,6个家庭出现了3个或更多的外来父母的后代。在子集-B中,18个家庭没有受到外来花粉污染,28个家庭展示了由外来花粉父母播种的1或2个晚春,只有1个家庭有3个外来花粉父母播种的后代。

花粉父母的生殖成功

所有基因型花粉捐赠者都代表在进展池(除了没有基因型的单个花粉供体属于PMX_A),虽然他们的贡献是可变的。使用卡方检验(仅考虑来自PMX的花粉供体所产生的后代,用于测试相等的男性贡献的零假设)测试所有女性中与预期相等的男性生殖成功的偏差。通过用正确分配的后代的数目除以每个PMX中的花粉亲本的数目获得预期频率。 。如图1所示,每个花粉供体的父本贡献代表两种PMX,并且预期的相等贡献由连续的暗线指示。在子集A(图1a)中,父母贡献从1到26(0.3到6.5%),跨越所有女性父母,而预期父系平等贡献为8.5(2.1%)。在子集B(图1b)中,父亲贡献从1到24(0.23到5.61%)不同,而预期的父亲平等贡献为9.95(2.33%)。因此,在子集A(χ2= 149; p = 8.6e-13)和Subset_B(χ2= 121; p = 1.2e-09)中拒绝每个花粉供体对种子产生同等贡献的零假设。然而,应当注意,仅有少数花粉供体在图1中的虚线所示的置信区间(概率为95%)之外。 1.四个花粉供者的授粉超过两个子集的预期,而子集A和子集B中的9和8分别贡献低于预期。因此,大多数花粉供体落入预期的变异范围内。
此外,父系贡献的不平衡不会导致遗传变异性的重要降低。实际上,观察到的和期望的(如果相等贡献)男性的有效数量(Nem)之间的比率对于PMX_A是0.81,对于PMX_B是0.84。因此,观察到的差异再现性成功并不导致有效数量的男性(Nem)的显着减少。

亲戚的比例和后代的coancestry

这个父亲恢复实验的主要产出是完全交配设计的重建。在子集A的400个后代中,可以鉴定352个不同的杂交(图2a):313,34和5个杂交分别由1, 2,和多达6个后代。在子集B(图2b)中,在428个分析的弹簧中鉴定了378个不同的杂交:分别由1,2和3个后代表示331,44和3个杂交。因此,在两个子集中,PMX家族(大小:9-12个后代)包含0-6个全同胞:32个家族仅由半同胞组成,而只有8个家族包含超过3个全同胞。此外,自交率非常低,尽管4个和10个花粉供体分别在PMX_A和PMX_B,这也对应于种子。只有两个子集,属于子集A,是从相同基因型的自体受精发出的。因此,对于所研究的大多数HS家族,家族中后代的估计共同体与预期的相加关系系数2 = 0.25没有大的不同。事实上,在具有完全家谱信息的家族家族中,后代的平均意义是0.260(根据家族,从0.250到0.365不等)。具有最高平均国籍的家庭(2 = 0.365)包含两个后代,其加性关系系数等于1,因为它们都是由同一母亲的自交产生的。此外,由于一些G1亲本相关,一些家族之间的后代的一些关系被发现(图3)。例如,在部分谱系模型中,一些个体具有一个共同的祖父母(2 = 0.0625),并且一些个体具有共同的两个祖父母(2 = 0.125)。父亲恢复带来了更多的复杂性:父母之间的相关性增加了家庭内部和子女之间的共生。

遗传参数估计

用具有确认的种子供体的929G2基因型树的部分系谱(PP)模型和完全系谱(FP)模型估计遗传参数。子集A和子集B因此在这些分析中一起考虑。在表2中给出了每个模型的年龄为12岁和8岁时的围度的加性方差和遗传力估计。使用PP模型计算的遗传率估计低于使用FP模型计算的两个性状的遗传力估计分析。 PP模型倾向于高估遗传性,特别是对sweep。然而,用PP和FP模型估计的遗传力之间的差异对于两种性状不显着,如95%概率下的重叠置信区间所示。当使用FP模型时,相关的标准误差稍小

父母人口的估计育种值

使用PP和FP模型预测的育种值之间的相关性对于用作种子供体的G1树的两种性状是高的(图4)。皮尔逊相关系数为sweep0.97和周长0.96。这些高相关性表明,对于大多数个体,使用PP模型充分预测了雌性育种值。此外,通过FP或PP模型预测的EBV之间的Spearman秩相关性的高值(sweep0.97和周长0.96)揭示种子供体的排名与两个模型相似,表明向后选择将是相似的,无论什么模型(PP或FP)。然而,对于少数种子供体,当添加父本信息时,育种值的估计显着变化,并且这不能与后代(种子供体,其中家族内平均相关性2,大于0.27在图4中用实心圆表示)。对于两种模型,用作种子供体的G1树的平均EBV的准确度(雌性EBV)是相似的(表2)。因此,父亲恢复并没有提高种子供体的EBVs的准确性。然而,父亲恢复为用作男性的基因型的遗传评估提供了信息,这意味着男性也可以包括在后向选择库中。然而,PMX中的特征的平均准确度(扫掠r = 0.68,扫掠r = 0.61)略低于种子供体(r = 0.70,扫掠r = 0.63)。此外,EBVaccuracy基本上用作男性的基因型之间变化:范围从0.32到0.85sweep和从0.27到0.80的周长,取决于每个男性的后代的数量。

讨论

开发一种具有成本效益的基因分型技术,用于海滨松树的系谱回收根据Glaubitz et al。 (2003),当一个亲本已知时,需要至少32个独立分离的SNP(每个具有较小的等位基因频率为0.2或更大)以实现大于0.99的排除概率。在我们的研究中,密度分析基于42个SNP或更多(MAF> 0.45)。因此,我们的标记集具有非常强的辨别能力(排斥的概率接近1)。这导致我们考虑99%的置信水平来确定用作父亲分配标准的delta得分。这种置信水平高于大多数其他谱系恢复研究中常用的水平(95%的高或Bstrict ^信度和80%的良好或Brelaxed ^信心常被使用)(Doerksen和Herbinger 2008; Doerksen和Herbinger 2010; El-Kassaby等人2011; Funda等人2014; Grattapaglia等人2014; Hansen和McKinney 2010; Hansen和Nielsen 2010; Klapste等人2014; Lai等人2010)。此外,因为花粉供体在PMX_B中不相关并且在PMX_A中不相关(在PMX_A中为0.036,在PMX_B中为0),因此增强了辨别力。总而言之,本研究为海洋松开发的63SNPs的优化集为谱系恢复提供了可靠的基因分型工具,至少对于Landes起源。使用Sequenomtechnology的基因分型成本小于€7每个人。这套标记物现在常规用于法国海洋生物育种程序:例如,检查种系或树的身份或评估种子果园中的污染率。

高花粉污染率

我们认为花粉污染率是在PMX组合物中没有鉴别到父亲的子代的比例。在本研究中,13.0%和8.7%的进展分别由子集A和子集B中的外部花粉产生。然而,在子集A中,这种污染率被高估了,因为一个花粉供体因为PMX_A没有被基因分型(基因型不可获得)。然而,如果我们将预期后代(即8.5后代)的平均数分配给该花粉供体,则Subset_A的污染率仅降低到11.2%。根据家庭的考虑,污染率差异很大。它高于文献中多环节试验中通常报道的污染率:在红云杉中为4.1%(Doerksen和Herbinger 2008),在杨树中为5%(Wheeler等人,2006),在辐射松中为13%(Kumar等人2007 ),并且在日本杉木中没有污染,除了一个家庭的污染率为22%(Moriguchi等人2009)。许多假设可以解释这种高比例的混杂。对于高度污染的家庭(例如,属于子集A的1个家庭的污染率为70%),可能存在花隔离的问题。其他可能性包括在父母身上收集具有错误身份的花粉在克隆档案中。事实上,错误的花粉或错误标记的花粉供体的身份是可能的,一些外来花粉可能偶然被引入PMX,有助于增加污染。一些研究已经报告了克隆档案,种子园和试验中的标记错误。在美国的针叶树改良计划中使用同分异构体的详细研究中,Adams等人(1988)发现,花旗松和火炬松中约30%的对照杂交具有至少两个不同于预期的后代。在各种现场操作期间对个体的错误标记是这种差异的可能解释。在红色云杉多交叉试验中,检测到三种类型的谱系错误(Doerksen和Herbinger 2008):志愿者(与种系无关的Bwild树被检测为单独的子代与其假定的母亲在多于两个基因座处不匹配)误操作和外国男性授粉。 Kumar和Richardson(2005)报道,新西兰辐射松群体中约5%的文献记载的关系(例如全同胞,亲本 - 后代等)被鉴定为分子标记的错误。在黑胡桃子代测试中,Zhao et al。 (2013)表明,20%的基因定型幼苗没有分配到他们的理论家庭,这些错误认识对家庭的等级和个人的潜在选择有显着的影响。他们建议在试验建立后不久对子代进行基因分型,或至少对所有选择进行基因分型以验证其身份和谱系,以避免将错误延续到后代并混淆育种计划。最后,重要的是要注意,在本研究中,分析的G2个体构成了法国海洋松树育种计划的第三代。因此,在三个选择周期期间,在各种田间操作期间的错误,如花粉收获,克隆档案中的移植或受控杂交,导致不同类型的错误标记。这种错误标记假说被不符合他们的名义种子供体基因型的41基因型后代加强。

低男性生殖成功率偏低

两个子集来自两个不同的PMX,但是父系贡献的分布在两种情况下是相似的(图1)。即使父系贡献假设在两个子集中被拒绝,也观察到接近预期平均值的同质贡献,并且只有少数男性贡献比预期更多或更少。这一结果符合大多数谱系恢复研究,证明在受控多环试验中父系贡献是不等的(Moriguchi等人2009)。 Wheeler等人(2006)研究了16个亲本花粉的多毛混合物对于杨属的雄性生殖成功:50%的花粉供体贡献了83%的子代,并且每个父亲的贡献从1%变化到13%。 Doerksen和Herbinger(2008)报道,在多环红色云杉后代试验中,构成多聚体的21个花粉供体具有不相等的繁殖成功:虽然预期的父本平等贡献为4.8%,但每个花粉供体对后代贡献1.4-11% 。一个父亲贡献了预期的两倍多;三个父亲的捐款额不及预期的两倍。因此,我们的结果与这些研究一致:在子集A和子集B中,2和1花粉供体贡献超过预期,并且10和8花粉供体贡献少于预期。已经在大量物种中研究了不等花粉贡献的原因。 Aronen et al。 (2002),Snow and Spira(1996),和Pasonen et al。 (1999)报道,花粉管生长速率分别影响P. abies,芙蓉属moscheutos和B. pendula中的父系贡献。此外,Parantainen和Pasonen(2004)在樟子松中使用花粉混合物的人工杂交实验中发现了花粉 - 花粉交互作用。 Nakamura和Wheeler(1992)报道,男性和女性配子体之间的遗传不相容性影响P. menziesii中的父亲贡献。此外,Moriguchi等人(2009)发现,每个花粉供体在多环的贡献与其发芽率有关,但Wheeler等人(2006)报告称,母亲的成长似乎与花粉活力无关。此外,已知构成花粉组合的雄性的数量对差异再生成功(DRS)有影响(Kumar等人2007; Moriguchi等人2009)。因此,使用大量的花粉供体是一般性建议,以减少父亲贡献水平的变化。在辐射松中,例如,Kumar et al。 (2007)建议至少使用15名男性。最后,DRS也可以通过遗传不相容性(前和/或后合子生殖屏障)解释。但在我们的研究中,抽样不包含每个家庭足够的子代,而潜在的花粉亲本的数量来解决这个问题。同样重要的是注意到,由于通常在后代试验中仅种植健康和有力的幼苗,并且通常不是所有幼苗通过选择年龄存活,花粉亲本的相对贡献可以偏离在声音种子阶段观察到的那些(Kumar等2007)。谱系重建显示,大量的交叉实际上是与多交配交配设计实现的,即使几个人可用于每个交叉。分析的828个子代表730种不同的杂交,其中88%实现一次(即独特的子代/杂交)。尽管花粉亲本的DRS,HS家庭假设没有偏离零假设,只有几个家庭包含几个全同胞。最后,自交率非常低:只有两个后代从自交配发出,而有获得自交后代的重大可能性(PMX_A和PMX_B中分别有4和10个花粉管也出现在种子供体中列表)。这并不令人惊讶,因为自体受精导致了针叶树的近亲繁殖抑制,与早期的高幼苗死亡率相关,并降低了植物的活力(Chancerel等人,2013)。在海洋松中,在种子形成和发芽期间以及在第一个生长季节期间可能消除最致命或亚致死等位基因,使得自交后代的比例预期在成熟群体中非常低(Gonzalez-Martinez et al。 2003)。 Durel et al。 (1996),但是,注意到,在苗圃中的第一个生长季节之后的海洋松树存活率是相似的,独立于近亲水平,并且还观察到近亲繁殖抑制在相同水平的近交系中存在大的差异。在我们的研究中,基因分型的后代在系谱恢复时为16岁,因此在我们的分析(种子发育,发芽,种植等)之前可能发生了几个选择步骤,可能导致较低的自交速率比种子阶段。值得注意的是,在我们的研究中,每个家族仅有10个后代被基因分型,所以后代的数量低于潜在花粉亲本的数量。因此,我们的抽样不是真正适合研究自交率,并且如果每个家族的更多的后代已经被基因分型,则HS家族假设可能更偏离无效假设。

由于未知的父亲性,遗传性和EBV的低偏倚

在大多数林木育种计划中,遗传参数估计依赖于开放授粉或多交叉测试计划。为了评价所选亲本的育种价值,可以通过从所需的亲本收集种子并建立HS后代试验来进行,其中特定亲本育种值被计算为其后代平均值与遗传性加权的群体平均值的偏差这些估计假设真正的HS家庭和男性父母的平等贡献。在这里,我们研究遗传参数估计的偏差通过比较遗传性估计计算有和没有父亲信息,并通过计算一个模型或其他估计的女性EBV之间的相关性。尽管花粉亲本的不平等贡献,家庭中的平均相关性为0.26(略高于半同胞的预期的附加关系系数0.25),并且遗传力的估计没有显着高估周长和sweep。这些趋势已经在文献中报道。例如,Doerksen和Herbinger(2010)的结论是,在一个红色云杉PMX试验中,遗传力估计在添加​​谱系信息时略有增加,主要是由于捕获了雄性之间的遗传变异(而不是由于家族遗传的校正相关系数)其他研究发现由于包含全同胞信息,遗传力估计没有显着偏差(Hansen和Nielsen 2010),或遗传估计的过高估计(El-Kassaby等人2011; Gauzere等人2013; Hansen和Nielsen 2010; Korecky等人2013),当父亲信息是未知的。应该指出,抽样效应,种群规模,考虑的性状和所涉及的父母数量都对遗传力估计具有重要影响。此外,我们表明,估计有和无花粉亲本身份的育种值是高度相关的。我们还注意到,全同胞在家庭内的存在并不一致导致对育种价值的有偏估计。因此,从多交叉设计(没有父亲恢复)获得的排名(例如在本研究中)将满足实现有效的后向选择,只要构成PMX的花粉亲本的数量很大。 Doerksen和Herbinger(2010)报告,在红色云杉PMX设计中,通过部分和全部模型模型估计的女性EBV之间的相关性接近1。开放授粉家庭的其他研究(Hallingback和Jansson 2013; Hansen和Nielsen 2010; Klapste等人2014; Korecky等人2013)得出结论,基于从部分和全部系谱模型估计的EBV的女性排名非常类似。在许多树种育种计划中,使用多态性指数仅限于估计雌性EBV,因为缺乏关于雄性亲本的信息强烈限制了任何先进世代选择。 Lambeth et al。 (2001)提出使用分子标记鉴定正向选择的男性父母,允许多交叉设计的增强应用。他们提出了在多交叉设计中使用分子标记鉴定男性亲本的实用方法。成功实施polymix育种和测试系统需要精确的谱系重建,雄性生殖成功的低差异,低花粉污染率(因为只有当完全谱系已知时才进行选择)和低自交率。这项研究表明,我们的polycross后代试验符合大多数这些要求。基于这些结果,在不久的将来将研究在马铃薯育苗计划中实施多重混合育种策略。总而言之,我们开发了一个价格合理的SNPmarker技术,为海洋松树提供准确的系谱恢复。我们显示花粉污染率相当高(11%),并且多聚体中使用的花粉亲本的差异繁殖成功是显着的,花粉捐赠者贡献多于或少于预期。我们还表明,遗传力和育种价值估计在这个polycross后代试验没有偏见时,花粉供体身份是未知的。最后,尽管恢复了父亲身份,但这并没有导致后向选择的显着改善;新的血统信息使得海洋松树育种计划中的后代能够被选择,并为未来的育种策略开辟了新的视角。

你可能感兴趣的:(Vidal2015 系谱重建 多系杂交)