Dieters MJ, White TL, Hodge GR. Genetic parameter estimates for volume from fuil-sib tests of slash pine (Pinus elliottii). Canadian Journal of Forest Research, 1995, 25(8): 1397–1408. DOI: 10.1139/x95-152.
湿地松(Pinus elliottii)全同胞试验材积的遗传参数估计
摘要:
使用在4至15年的多个年龄测量的对湿地松(Pinuselliottii Engelm.var.elliottii)的171个全同胞测试的数据来获得方差分量的受限最大似然(REML)估计。这些测试包括来自700多名第一代父母超过2100个全同胞家庭,约有17株。对每个测试进行分析,并使用标准化数据,完成所有可能的连接测试对(有五个或更多共同父母的测试)。根据REML方差分量估计估计遗传力,优势方差比例,B型遗传相关性(检查基因型×环境相互作用)和年龄 - 年龄遗传相关性。 5年时体积平均遗传率为0.07,在11岁和14岁时增加到0.12。这些遗传力估计值与先前通过开放授粉测试获得的估计值相似,但略微小于此值。在5岁时,加性方差大约是优势方差的1.6倍,在11岁或更多年龄时增加到2倍以上。尽管树木体积中优势度方差的相对重要性随着年龄的增长而明显下降,但优势度方差的存在可能会使当前的育种策略发生一些变化。 B型遗传相关性的估计值从5年时的0.6左右增加到14年时的0.8以上,因此基因型×环境相互作用的重要性随着年龄的增长而下降。这些B类遗传相关性的估计以及年龄 - 遗传相关性的估计与开放授粉测试的估计相似。
介绍
在森林树木的遗传改良中,投入了大量精力来准确估计遗传参数,例如遗传力,遗传相关性和基因型X环境相互作用。这些参数在整个育种周期中使用(White 1987),并且是确定育种,繁殖和部署策略的关键要素。这种参数估计在树木改良中的重要性是由于这种估计的广泛效用和大多数森林树种的长代间隔(通常为10年或更长)。这一长度的生成间隔需要有关遗传参数的高质量信息,以帮助确保每单位时间遗传增益最大化。
对于湿地松(Pinus elliottii Engelm.var.elliottii)生长性状的遗传参数估计已经从开放授粉(half-sib)后代测试中获得(Hodge和White 1992)。半同胞测试允许估计一般组合能力(GCA),但是不能从这样的测试估计特定的组合能力(SCA;归因于优势)。对松树林中优势度的公布估计很少,这些基于少量试验(例如,Cotterill等,1987,一次试验; Kraus 1973,一次试验; Pswarayi 1993,三次试验)。
优势方差的估计需要系统交配设计,全同胞和半同胞后代群。在许多森林树种中,这种测试难以确定,昂贵且耗时,因此建立时间可能比半同胞后代测试长达10年。缺乏关于优势度方差的充分信息已导致育种者忽视其育种计划中的这种变异因素。然而,育种计划可能已经放弃了显着的额外遗传增益,因为它们的策略不允许捕获和利用由优势产生的遗传变异。在大规模的集约化种植计划中,即使规模较小,这种额外收益也可能具有重要的经济价值。
合作森林遗传研究计划(CFGRP)在美国东南部开展,自20世纪50年代初期以来一直为削减松树进行密集的育种工作,并为大约公顷的种植园提供基因改良材料。这项工作的一个组成部分是建立了第一代父母的许多全同胞后代测试(总共265次测试(Hodge等,1991))。这些全同胞测试提供了一个广泛的数据集,可用于(1)用于验证先前从开放授粉测试开发的茎体积的遗传参数估计(Hodge和White 1992),(2)提供对该体积的第一个可靠估计。松树优势度差异的重要性,以及(3)允许研究场地和试验特征对遗传参数估计的影响。
材料和方法
全同胞后代测试数据
在1956年至1963年期间,天然林中的大规模选择确定了2500多种第一代湿地松树,其中大部分随后被移植到多克隆种子园中(White等,1986)。到了20世纪70年代早期,很明显,相对较少的原始第一代父母对抗梭形锈病感染,)和550个新的第一代没有梭形锈病的树木(White et al.1987)在10到20岁之间的林分中被选中,其中平均锈病感染水平超过70%(Hendrickson 1976)。
由CFGRP建立的全同胞测试包括两个单独的测试系列。第一个系列建立于1966年至1973年之间,在最初的2500个第一代选择(总共78个测试)中使用了析因交配方案。第二系列测试建立于1975年至1989年之间(共计187次测试),利用(i)更好的第一代父母在双列或阶乘或(ii)无锈选择(作为男性父母),并且首先是更好的在阶乘交配设计中的代父母(作为女性)。在除两种情况之外的所有情况中,其中五个测试在一个地点连续定位,每个测试都在一个单独的地点上进行。
1994年4月,为了本研究的目的,分析了171种不同的全同胞测试的数据(表1)。为了促进模型的开发,并防止引入偏倚,研究中包括所有可用的单个树体积(4或更多年龄)的测试。此外,初步调查显示没有理由消除高度感染梭形锈病的小型试验或试验。测试包括主要在佛罗里达州,佐治亚州和阿拉巴马州,但在密西西比州和南卡罗来纳州进行了一些测试。所有171个测试均在随机完整区组设计中建立,具有3-12个区块(平均5.4个区块)。在每个区块中,全同胞家族由5-10棵树(平均6.9棵树)的一个小区表示,其排列为行图或非邻接图。在任何一项测试中,有6到86个全同胞家族(平均30.6个家庭),这些家庭来自6到47个父母(平均18.2个父母)的杂交,排列在最多4个断开的集合中。总共测试包括来自700多个父母(165个无生锈的父母)的后代,由超过2100个不同的全家庭家庭(550个家庭涉及无生锈的父母)和大约17万个单独树木代表。
在每个测量年龄(种植后标称5,8和12个生长季节),评估所有树木的胸径(4.5英尺或1.37米)直径,高度以及是否存在锈病感染。根据这些测量结果,计算出单个树木的体积(Goddard和Strickland,1968; Rockwood,1981),每棵树都有一个锈迹,表明树是否被感染(0,没有生锈; 100,感染了锈)。为便于分析,将数据分为四个年龄组,分别为5年,8年,11年和14年(表1)。
每个测试的地点指数使用最大43.5%的树木的平均高度(按直径排列)估算,以估计主导高度(Bailey和Brooks 1994)。然后根据Pienaar等人开发的公式,使用该显性高度来估计位点指数。 (1990)。分析显示,8岁以下的数据高估了地点指数,而8岁以上的数据提供的地点指数估计值与8年数据得出的估计值没有显着差异。 (请注意,除非另有说明,否则此处及其他地方的术语显着且非常重要,分别指0.05和0.01的p值。)因此,对于小于8岁的测试,使用模型来调整位置指数估计消除这种潜在的偏见来源。使用此调整后的地点指数(在基准年龄为25岁时预测),将测试分配到地点指数类别:低,中和高。低等级和高等级分别由较低的(地点指数范围13.1-19.3 m)和较高的(23.2-31.0 m)四分位数组成,而中等级(19.5-23.0 m)由中间的两个四分位数组成。
方差分量估计
全同胞后代测试之间存在相当大的不平衡:
- (1)对于任何一个测试的后代贡献的后代数为6到47;
- (2)任何一对连接测试之间的父母共同数量在1到45之间;和
- (3)在任何给定的测试或一对测试中,每个父母的杂交数量通常不相等。
- 在测试生命期间由于死亡率导致的图谱水平还存在进一步的不平衡(表1)。
因此,传统的基于ANOVA的方差分量估计,如亨德森方法III,在这里使用效率低(Searle等,1992)。
GAREML是一种利用Giesbrecht(1983)算法提供方差分量的REML(限制最大似然)估计(Patterson和Thompson 1971)的计算机程序,已被证明可以在应用于具有级别和类型的数据集时提供具有所需属性的估计。森林遗传学测试中常见的不平衡现象(Huber 1993,p.82)。
还已知REML估计对违反基本正态假设的相对稳健(Banks等,1985; Westfall,1987)。在这些研究结果的基础上,选择使用单个树木数据作为观测单位和程序GAREML的REML估计来估计这些湿地松的全同胞试验中的方差分量。使用单个树观察的REML估计在数值上是强烈的并且计算上昂贵,使得必须将方差分量估计的问题分解为更小,更易管理的单元。为此,
首先分别对每个全同胞测试进行分析。
然后,为了去除尺度效应,通过将每个观察值除以从该测试估计的图内方差(CTW)的平方根来标准化单个树体积。
使用标准化数据,在汇总分析中使用GAREML分析具有至少五个共同亲本的所有测试对。通过这些测试中使用的交配设计,这通常导致在两个测试中至少约三分之一的家庭被代表。在这些汇总分析中,标准化数据的小区内方差等于1.00。以这种方式分析所有可能的连接测试对和测量年龄的所有组合(超过3000个单独的配对分析)。对总是根据在不同测试中收集的数据构建,并且在不同年龄测量的相同树从未在配对分析中使用。因此,在这些分析中避免了由于单个地点内的环境相关而导致的误差项(Hodge和White 1992)缺乏独立性的潜在问题。
当两个测试具有相同的年龄时,REML估计是方差分量,但是当这对测试具有不同年龄时,估计被认为是不同年龄的体积之间的协方差分量。该方法迫使协方差分量估计具有与方差分量相同的属性,即,是非负的。之前对半同胞湿地松树试验中体积的加性遗传相关性的估计在这里研究的年龄范围内均为强阳性(Hodge和White 1992),因此这种假设似乎是合乎逻辑的。
线性模型
使用的最复杂模型是对于析因测试的配对地点分析,而所有其他模型可以被认为是该模型的子集。 这个模型是
在该模型中,假设模型中的随机效应之间没有协方差,由于女性和男性效应引起的差异是相等的,并且女性X环境和男性X环境相互作用是相同的。通过汇总男性和女性父母的估计,GAREML产生了一个和一个估计值。还要注意,(i)在配对地点分析中包括不同的测试测量值时,【不理解这个协方差是怎么处理的】上面定义的所有方差组件被视为协方差组分,(ii)在存在不连续set的情况下,所有在模型中遵循设定项的项嵌套在集合中。
在双列测试的情况下,个体父母在交配中被用作男性和女性。通过假设不存在任何正反交影响(即,父母是用作男性还是女性无关紧要),可以估计GCA和GCA X测试位置的方差分量(Griffing 1956)。因此,在上述线性模型中,、、和分别被、、和替换,对于第个(或)亲本的一般组合能力(和GCA X测试地点),并且由替换为特定的组合能力。最后,当进行单点分析时,用于阶乘和双列实验的模型如上所述,除了所有涉及由于第次测试引起的主要和交互效应的术语都从模型中删除。