Durban2001 竞争

Durban M, Currie ID, Kempton RA (2001) Adjusting for fertility and competition in variety trials. J Agric Sci 136:129–140. doi: 10.1017/S0021859601008541

描述了响应于生育趋势和插图间竞争的绘图产量的联合模型。该模型将三次平滑样条的混合模型表示与模型生育率以及具有自回归项的模型竞争的回归模型相结合。估计是基于残差最大似然的泛化。将这些方法应用于由英国剑桥的植物育种研究所进行的一系列70个甜菜试验,并且结果总结。


介绍
育种者或管理机构对植物性能的评价通常涉及在小块地带具有大量品种的试验设计。然而,这种试验中品种产量之间的比较通常倾向于由于两个扭曲因素的影响:生育趋势和插槽竞争。有大量关于实验设计的文献,通过将试验区域划分为更小,更均匀的块并以平衡的方式将块分配给块来减少土壤异质性的影响(Mead 1997)。特别地,α设计(Patterson等人,1978)现在广泛用于全世界的植物育种试验中。调整生育率的一个更新的方法是明确地模拟空间变异(Green和Silverman 1994; Gleeson 1997; Gilmour等人1997)。对一系列品种试验的分析(Cullis和Gleeson 1989; Kempton等人1994)已经表明,空间分析通常比常规不完全块分析在减少曲线变化方面更有效。小地块品种的产量也可能受到相邻地块品种竞争的影响。竞争可以通过保护行显着减少,或者等效地,通过仅收获图的内部行。然而,这通常是不切实际的;实际上,在种子有限的早期生成试验中,地块可以仅由单排植物组成。 David et al。 (1996)提出使用修饰的alpha设计,其中品种的随机化受到限制,从而具有非常不同的竞争能力的品种从不出现在相邻的图中。

然而,这种方法需要提前知道品种的竞争能力。通过设计控制竞争的替代方案是在分析阶段调整竞争效应。对于谷物作物,发现插图间竞争与邻近品种的植物高度差异最密切相关(Talbot等人,1995),并且这些差异在统计分析中由协变量调节。对于根作物,几个作者观察到与邻近地块的根产量相关的插图间竞争:在甜菜(Kempton 1982),土豆(Connolly等人1993)和swedes(Bradshaw 1989)。具有自回归项的回归模型已经用于调整竞争的品种产量(Kempton 1982; Besag&Kempton 1986),但是这些模型忽略了块内的生育趋势,因为同时建模两种类型的局部相关性的问题。本文提出了可用于根茎作物产量试验的生育力和竞争的联合模型。该模型将用于生育的平滑样条(Green&Silverman 1994)的混合模型表示与用于竞争的Besag&Kempton(1986)模型组合。该模型允许我们采用似然法来估计竞争和趋势的参数,并给出调整的品种产量估计。该模型应用于一系列用于单行地块的糖用甜菜的植物育种试验,并且之前已经发现其显示插图间竞争的证据(Kempton 1982)。在对试验进行描述之后,依次考虑三个模型:(i)生育趋势模型,(ii)竞争模型和(iii)联合生育趋势和竞争的组合模型。将组合模型与来自70个甜菜试验的根产量拟合的结果被汇总以量化试验中的生育趋势和竞争效应的程度。由于模型的效率增益和对品种产量和排名的调整与标准完全块分析进行比较。
一系列早产儿甜菜试验
这些数据源于20世纪70年代和80年代初英国剑桥植物育种研究所的甜菜育种计划。用于产量评估的第一条目(以下称为变体)在单行图中生长,12m长并且在行之间以0〜5μm间隔开。每个试验由36个品种的三个重复块组成,每个块由在每个块的末端具有保护行的线性阵列的阵列组成。典型的现场计划的示例如图1所示。从这些试验中的70个(来自1977年的33个,1978年的34个和1979年的3个)获得了根产量,并且来自1979年试验的数据将用于说明我们的分析的阶段(表1)。在1979年的试验中,测量了卫兵排的产量,但是这两年前没有做到。这里讨论的所有试验都使用完全块设计;直到后来才引入使用较小的不完全块来减少生育力中的块内变化。 Arnold&Kempton(1979)描述了生育趋势和行间竞争如何在这些试验中偏差品种比较。他们还指出,拖拉机轮子造成的土壤压实会严重影响排产量。对于本文讨论的试验,轮子在第1行和第2行之间通过,每组六行的行和第5行和第6行,在一个6行图中,中心行产生平均23%的产量优势为了减少使用单行图的试验中的随之而来的偏差,将每个品种随机分配一次到每个行对(1,6),(2,5),(3, 4),跨越三个重复。

植物育种者传统上使用经典设计,例如随机完全块或不完全块设计,以在试验中调整对生育趋势的多样性影响。虽然随机化理论表明,对品种随机化的完整集合的品种效应的估计的期望将是不偏不倚的,但是来自具有显着的生育趋势的单一试验的结果可能产生大量偏差的估计,特别是如果块大且重复的数量小。在这系列甜菜试验中,有36个品种,只有3个重复,因此在一些试验中可能出现由于生育趋势的偏差。处理块内生育力变化的一种技术是使用平滑数学函数来建模生育力。假设数据(xi,yi) 1,...,n可用;在本上下文中,xi表示块内的绘图位置,yi表示产量。 Green&Silverman(1994)认为平滑是一个惩罚最小二乘问题,其中平滑函数g(x)被选择为最小化
其中λ是确定函数g(x)的平滑度的参数。最小化问题(1)的解是三次平滑样条,并且可以通过最小化例如广义交叉验证分数来选择平滑参数λ(Green和Silverman 1994)。平滑参数λ的较大值导致更平滑的拟合曲线。一个简单的例子说明平滑样条的拟合和平滑参数λ的作用。令yi?(xi≤5)(xi≤15)(xi≤25)? 1000?εi,其中xi?1,...,36和εi是独立的(0,1)变量。图2示出了对于xi以及两个拟合的样条的yi的实现;更平滑的函数产生于λ≥74≤75,而λ≤10≤75给出更粗糙的函数。两种特殊情况也值得一提:λ≥0给出了内插数据点yi的函数,而λ?给出数据的线性拟合。下面讨论λ的选择。拟合三次平滑样条的另一种方法是使用混合模型表示法(Verbyla et al。1999)。这个数学设备使我们能够通过最大似然选择λ,或者更适当地通过剩余最大似然(REML)选择λ;参见例如Genstat 5(1993)参考手册,第10章,关于REML算法的讨论。这种方法的吸引力之一是三次样条的混合模型可以扩展到具有多种效应和块内不同生育率的模型。该模型还可以扩展到包括竞争效应,从而给出一种统一的方法来建模品种效应,生育力和竞争。在附录中,显示了在REML样式框架中如何适应各种具有平滑生育趋势和竞争效应的多样性效应的模型。本文的主要部分集中在描述模型和从拟合这些模型到实际作物数据的结论。
混合模型为单个三次样条
假设已经获得了来自均匀性试验中的单个线性阵列的图的产量。考虑一个解释性向量变量(绘图位置)x ?? (1,...,n)与相关的生育向量y ?? (y4,...,yn)。在完整的块分析中,每个图中的生育水平通过块内平均yi n来估计。然而,假设yi对xi的图表示yi中的平滑趋势。在矩阵符号中,yi中趋势的混合模型可以写为
其中xs≠x≠xE,xE是等于Σxi≠n的元素的向量。响应y由三部分组成:第一,固定效应,这里是平均值μ(广义固定块和品种效应);第二,生育趋势f(x)?βsxs?Nsus,它被划分为沿块长度的固定线性趋势(βsxs)和随机非线性趋势(Nsus),其中us是一组相关随机法线偏差为零均值和基本方差σ5s;第三,残余变量ε,其以通常方式通过具有零均值和方差σ5的独立的,相同分布的正态变量建模。 (关于Ns和us的定义,参见附录方程式(8)到(11))。现在可以估计该混合模型中的参数,即固定效应μ和βs以及方差分量σ5和σ5s。混合模型和三次平滑样条之间的连接是平滑参数等于方差分量的比率,即λ?σ5?σ5s(Verbyla等人1999)。来自混合模型的拟合值与由具有相同平滑参数λ值的平滑样条给出的拟合值完全一致。在这个简单的例子中,固定效应的估计是μ5ΔyD,趋势f(x)的估计是Sy,其中S ?S(λ)是在附录(12)中定义的平滑矩阵。平滑样条被定义为平滑参数λ的函数。平滑量的替代测量是平滑矩阵S的迹(由tr(S)表示),并且许多统计包指定此平滑样条替代方法。 λ的值等于0(数据的内插)或? (线性趋势)分别对应于等于n≥1或至1的tr(S)。因此λ和tr(S)是拟合曲线的平滑度的反向量度。混合模型方法有助于通过残差最大似然(REML)估计平滑参数λ(参见附录公式(15))。在我们的简单例子中,λ5≈74≤75,相当于tr(S)? 4和32,以及拟合的样条( - ),如图4所示。 2,是对潜在生育力的估计。为了比较,还示出了λ≤10≤75或tr(S)≤7的样条( - - - )。没有多样性效应的单个块的简单模型已经在一些细节中讨论,因为这个模型可以以直接的方式被推广到用于完整块设计中的多样性试验的模型。现在将考虑用于区块内的建模趋势的两种选择:(i)当每个块中的趋势由公共值λ指定时,以及(ii)当每个块具有其自己的λ值时。
完整块的混合模型
在t个品种的单独完整块中的多样性试验的混合模型表示是(2)的泛化,

同样,响应y由三部分组成:第一,固定效应Xβ,其中X是各种设计矩阵,β是多样性和块效应的向量;第二,生育趋势Xsβs?Nsus,包括跨块的固定线性趋势(Xsβs)和随机非线性趋势Nsus的和;第三,残差ε。有关Xs,Ns和us的定义,请参见附录。对于单块模型,可以通过REML估计平滑参数λ(或者如果为每个块拟合单独的平滑参数,则为λ4,...,λp)。然后通过调整生育力的品种效应的估计

并且基本生育力的估计是S(y≤Xβ5)。将该模型拟合于表1中的甜菜试验数据,以说明通过在块内拟合平滑样条来调整生育力的多样性方法的估计的影响。在产量模型中考虑了拖拉机轮的附加效果,通过拟合每个块的36个图的行效应的系统模式1 2 3 3 2 1 1 2 3 3 2 1。这些行效应在本试验中不显着,并且从说明性分析中省略,但是在下面报道的所有70个试验的分析中,这些效应常规地包括在固定效应的载体β中(也参见讨论)。图3( - )是估计的生育率趋势S(y≤Xβ5)的图,其中β5是从(4)计算的,λ5≈222是λ(公共的跨块)的REML估计。显然,在块2中存在强的非线性生育趋势。图3( - - )也给出了当残差似然性在λ2(λ4,λ5,λ6)上最大化时的估计的生育趋势的图, 。 (486,48,?),其中λ56?对应于块3中的线性生育趋势。共同和分离λ的拟合生育趋势非常相似。形式上,近似似然比测试可用于比较H3:λ4? λ5λ6其中H4:λ4λ5λ6其中,测试统计量Λ^ 2(73〜74),以及73和74分别是H3和H4下的残余对数似然的最大值。计算出的Λ为2〜60。在10%水平上不显着。这表明对于该数据集,具有不同λi的模型是不必要的,并且可能导致标准误差的低估。因此,对于该数据集,modelH3看起来比H4更合适。建模生育率趋势影响品种均值和其标准误差。 。 3,每个块中品种8和36的位置已标记;在方块1和2中,品种8在较高的生育力地区,而品种36在较低的生育力地区。表2显示了在有和没有生育趋势调整的情况下这些品种的估计平均产量。显然,未能消除趋势会导致显着的偏见。去除σ5的估计从15°2°到10°9°的趋势也减少了残余图变化,导致了一个共同的λ(10°±5°,具有不同的λ),并且随后减少了10%的标准误差(表2)。差异的平均标准误差也减少了约25%。因此,除了减少偏差,调整生育趋势也提高了品种比较的精度。然而,趋势的存在只是这些试验中的一种偏倚来源。插板间竞争已经被证明是甜菜试验的一个特征,在下一节中,考虑了调整邻居竞争对甜菜产量的影响。

你可能感兴趣的:(Durban2001 竞争)