- Kruuk LEB (2004) Estimating genetic parameters in natural populations using the “animal model.” Philos Trans R Soc London 359(1446):873–890.
使用动物模型估计自然种群中的遗传参数
Loeske E. B. Kruuk
爱丁堡大学细胞,动物和人口生物学研究所,爱丁堡EH9 3JT,英国
([email protected])
估计数量性状的遗传基础对于自然环境中的野生种群可能是棘手的,因为环境变异常常掩盖潜在的进化模式。我回顾了最近应用限制最大似然模糊模型到来自天然群体的多代数据,并显示如何使用这些方法的方差分量的估计和育种值的预测提供了一个强大的手段来解决环境中的潜在混杂效应 - 以及产生大量新的调查领域。
关键词:动物模型;限制最大似然; BLUP育种值;遗传性;
微观演化
1.引言
进化生物学旨在解释多样性。在群体中,如果个体具有不同的表型,这是因为他们有不同的基因型,因为他们经历了不同的环境,或者因为两者的组合?如果是因为它们具有不同的基因型,这些差异是否偶然出现,或者当前的基因型是否受到前几代自然选择的青睐?此外,持续性悖论破坏了达尔文自然选择的直觉吸引力。选择一直倾向于某些基因型而牺牲他人,为什么我们观察到任何变异?这些问题构成了进化生物学研究的基础,虽然我们对其中一些问题有坚定而确定的答案,但是对其他方面的答案,例如最后一个答案,更加避而不谈(Barton&Turelli 1989; Roff 1997; Barton&Keightley 2002)。对于任何有用的科学调查,我们需要对相关因素的准确量化测量(Lynch&Walsh 1998)。在本次审查中,我认为一个领域的进化研究,重点是测量生物多样性的决定因素,定量遗传学,并显示最近应用复杂的分析技术对自然人口的研究促进了更有力的核心分析问题,以及开放一系列新的假设进行测试。
表型特征如形态或生命史特征可能受大量基因的影响(Falconer&Mackay 1996; Lynch&Walsh 1998),其遗传基础可以通过基于亲缘关系的相似性的统计推断来间接定量在人口。定量遗传学,作为主题是已知的,在植物和动物育种中有长期和成功的应用。对于在自然环境中的群体的进化研究,估计数量性状的遗传基础背后的动机最终能够预测对性状的自然或性选择是否将产生永久表型改变,因为性状必须是可遗传的进化。结合对遗传变异的性质的理解,群体中自然选择和微观演化的模式的解剖可以提供宝贵的洞察宏观扩张和物种形态的模式(Hendry&Kinnison 1999)。最近的研究表明,定向选择特别可能是表型多样化背后的驱动力(Schluter 2000; Hendry&Kinnison 2001; Rieseberg et al。2002)。进化研究的结果也可能有助于确定管理和保护野生种群的最佳策略(Stockwell et al.2003; Coltman et al。2003)。因此,定量遗传学解决了与自适应和进化研究所提出的问题有关的问题(Lynch&Walsh 1998)。
自然选择通过除去产生较少拟合表型的等位基因来工作,因此应减少基因变异。根据FisherĄŻs自然选择的基本定理,群体适应度的变化率等于适合度的加性遗传变异(Fisher 1958),因此在平衡时群体中的适应度不应有加性遗传变异Kimura 1958; Charlesworth 1987)。根据推论,与适应度密切相关的性状,而不是适应度本身,在平衡时,也应该没有或没有加性遗传方差,所有其他的都是相等的(Robertson 1955; Charlesworth 1987; Falconer&Mackay 1996)。然而,基本水平的加性遗传变异一致地报道了已知在选择下的潜在表型性状(Mousseau&Roff 1987; Roff&Mousseau 1987; Pomiankowski&Müller1995; Falconer&Mackay 1996; Lynch&Walsh 1998;MerilaĄ& Sheldon 1999,2001; Stirling等人2002)。此外,人工选择经常显示出对选择的持续反应,再次表明有利的等位基因不能在群体中快速固定(Hill&Caballero 1992; Barton&Keightley 2002)。在选择下的数量性状的多基因变异的丰度构成了进化生物学的中心悖论,其不能通过继续的突变输入的解释来充分解决(Barton和Turelli 1989; Roff 1997; Barton&Keightley 2002)。
此外,对可遗传性状的选择应该在性状的表型分布中产生进化响应,其确切性质将由选择的规模和形式以及性状的遗传性决定(Falconer&Mackay 1996)。动物和植物育种中人工选择的持续成功证明了这些预测的鲁棒性。然而,再次令人惊讶的是,在生活在自然环境中的野生种群的定向选择下的几种可遗传性状的强化研究中,几乎没有人证明了通过定量遗传学理论(MerilaĄ等人,2001c)预测的选择的微观演化反应。
因此,我们面临着理论定量遗传学与来自自然群体的经验观察之间的大量不匹配。这种不匹配可能归因于两种情况之一:
(i)关键参数的测量错误; (ii)理论预期太简单化。我认为这两个潜在的陷阱(可能不是排他性的)在一定程度上可以通过使用更复杂的统计技术,而不是大多数野生人口的研究中使用的传统方法来避免。 (i)背后的假设是,我们高估了基因性状的遗传变异的数量或作用于它的选择,使得我们对自然选择的跨代效应的期望膨胀。关于点(ii),上述简单的预测假设每个性状遵循孤立轨迹,独立于其他相关性状,也可能在选择下,在恒定的环境条件下演变。在这两种情况下,仔细分析多变量分析中环境异质性的潜在影响可以提供更准确的了解野生种群中表型性状进化动力学。
最近在自然种群定量遗传学研究中的一个主要变化是使用混合模型,特别是混合模型的形式,称为模型模型,用于估计方差分量(Lynch&Walsh 1998)。与通常用于估计迄今为止野生种群研究中的简单技术(例如亲代后代回归或同胞分析)相反,这些模型结合了来自复杂谱系的多代信息,并允许估计一系列方差的因果成分。此外,** 它们不受没有分类交配,近亲繁殖或选择的假设的约束,并且允许不平衡数据集。该动物模型在植物和动物育种的定量遗传学中具有良好的历史,基于Henderson的一系列关键文献(1950,1975,1984),并且通过应用最大似然技术显着提高Thompson 1973; Shaw 1987)。在他们的关于定量遗传学的教科书的序言中,林奇和沃尔什引用这种形式的分析作为主题的三个主要的最新发展之一(Lynch&Walsh 1998,p。xiv)。然而,没有明显的理由,除了植物和动物育种之外的研究只是最近,仍然相当有限。 Konigsberg&Cheverud(1992)拟合了动物模型,但是没有将其称为自由范围猕猴群体的数据(参见Cheverud&Dittus 1992)和Knott等人(1995)将动物模型应用于来自实验室的bruchid甲虫群体的数据。在此之后,据我所知,在分析来自自由放养动物的数据的分析中,使用动物模型的下一个研究是三个有蹄动物群体(大羚羊(Re?ale等人1999);红鹿(Kruuk等人2000 );和Soay羊(Milner等人,2000)),因为其中还有少数其他种群被添加到列表中(见下文)。动物模型在野生动物进化遗传学研究中的迟到相对于其在植物和动物育种中的普遍存在是特别令人满意的,因为它的一些最强的优点在于处理典型的自然形式的数据特别是由异质环境条件产生的复杂性。
本文的目的是介绍动物模型背后的理由,并回顾一些使用它们的野生种群的研究。特别是,我希望说明他们对进化生态学家的潜在价值,他们的能力,首先,提供一系列不同的因果成分的表型方差,第二,个人的基因价值或育种价值的预测。这两种形式的信息可以对自然人口的进化生态学产生重要的见解**。
2.方法
(a)动物模型
动物模型是混合模型的一种形式,用于描述线性回归,其中解释变量由“固定”和“随机”效应两部分组成。固定效应是影响分布均值的未知常数。随机效应用于描述从一组可能值中采样的多水平因子。对随机效应的分析提供的是效应方差的估计而不是每个因子水平的参数。因此,随机效应影响性状的方差。
在动物模型的情况下,感兴趣的随机效应是个体动物的加性遗传值。对于最简单的动物模型,个体i的表型y写作:
y_i=\mu+a_i+e_i
\mu是群体均值,a_i是个体i的加性遗传价值,e_i是随机残差;模型中只有一个固定效应\mu。“动物模型”这个术语产生的原因仅仅是因为模型是在个体动物的水平上定义的——相反,比如父系模型中,则是在父本水平根据其子代记录进行评估的。与所有混合模型一样,假设每个随机效应源自具有零均值和未知方差的特定分布:随机效应a_i的方差定义为\sigma_A^2,残差方差为\sigma_R^2,表型方差为二者之和\sigma_A^2+\sigma_R^2。因此,通过在线性模型框架中拟合相应的随机效应来直接估计方差分量,而非通过亲属间协方差的间接解释(Meyer 1989a)。
的更一般的矩阵形式的混合模型如下:
y = X\beta + Zu + e
具体解释见线性混合模型LMM-董八七。
将G定义为向量u的方差-协方差矩阵,然后可以从加性遗传效应中亲属之间的协方差的期望得出。对于任何一对个体i,j,它们之间的加性遗传协方差是2\Theta_{ij}\sigma_A^2,其中\Theta_{ij}是共祖系数,是从个体i和个体j随机抽取的等位基因IBD的概率(比如亲子间是0.25,因此父母和后代之间的加性遗传协方差是1/2\sigma_A^2)。因此,方差-协方差矩阵G=A\sigma_A^2,其中A是具有单个元素A_{ij} = 2\Theta_{ij}的加性遗传关系矩阵。 大多数模型假设误差是独立的,在这种情况下,向量e相应的协方差矩阵只是R = I\sigma_R^2(其中I是单位矩阵)。
分析动物模型有两个阶段:估计方差分量和预测加性遗传效应(以及任何其他随机效应)。 我将局限于更常见的情况,其中使用限制性最大似然(REML)方法(或偶尔,ML:Cheverud&Dittus 1992; Konigsberg&Cheverud 1992)估计方差分量,但请注意其他方法也是可能的。 特别是,可以使用贝叶斯框架(Gianola&Fernando 1986; Hoschele et al.1987; Sorensen et al.1994)估计方差分量,这在某些情况下可能具有优势(Blasco 2001); 到目前为止,我还没有发现使用贝叶斯动物模型的自由放养群体的任何分析。 我概述了分析单一特征的框架,但这种模型的一大优势是它们可以很容易地扩展到多个特征的多变量分析(Lynch&Walsh 1998)。
(b)估计方差分量
最大似然估计(ML)基于简单但强大的逻辑,可应用于任何形式的统计推断。 对于定义统计模型的给定参数集,其可能性(likelihood)被定义为如果那些参数估计为真,则观察手中的实际数据的概率:具有低可能性的参数估计因此是观察实际数据将是罕见事件,等等。 概率是基于关于数据的统计概率分布的假设来计算的,通常是多变量正态分布。 然后,ML分析简单地识别最大化观察实际数据的可能性的参数集(Fisher 1921; Edwards 1972)。
为了估计方程(2.2)中模型的可能性,假设加性遗传效应和残差都是正态分布的,因此特征y也是正态分布的(实际上,REML估计量对于这个假设是相当稳健的 ; Shaw(1987),Lynch&Walsh(1998))。 向量y有均值X\beta和方差V,其由加性遗传效应(即G)和残差(即R)的方差确定:V = ZGZ^T+R。 然后分析将确定G和R的ML估计。
方程(2.2)中的模型的可能性是根据正态分布下的数据y的概率密度函数计算的。 计算上更容易最大化其自然对数,即对数似然,由下式给出:
L=c-\frac{1}{2}ln|V|-\frac{1}{2}(y-X\beta)^TV^{-1}(y-X\beta)
其中c是一个常数,在查找最大值时可以忽略和|V|是矩阵V的决定因素。 然后,该表达式通过对每个参数进行微分并求零以得到ML估计,然后用于找到\beta和V的值(或者,在最简单的情况下,\sigma_A^2和\sigma_R^2)。 实际上,需要迭代求解过程,这可以使计算过程高度集约。
所有ML估计都具有统计偏差的不良特性,因为它们无法解释估计固定效应时损失的自由度(Patterson&Thompson 1971; Shaw 1987)。 即使只有平均值一个固定效应也会产生偏差,因此对于更大数量的固定效应偏差可能相当大(Meyer 1989a)。 因此,ML方法将低估残差方差。REML可以避免偏差,它仅考虑随机效应的部分数据的可能性(Patterson&Thompson 1971)。 为了获得REML估计量而不是用于等式(2.2)中的模型的ML,最大化变换后向量y*的似然,其中y*包含由特定变换矩阵K校正的数据(因此y\* = Ky),并且K取决于设计矩阵X使得KX = 0。因此等式(2.2)变为
y^*=KZu+Ke
REML估计本质上是这些变换变量的ML估计。请注意,因为K完全由X确定,所以不再考虑\beta而仅考虑方差分量的估计。
对于等式(2.3)中的简单模型,REML分析将提供\sigma_A^2和\sigma_R^2的估计值,从中可以估计遗传力为h^2 = \sigma_A^2 /(\sigma_A^2 + \sigma_R^2)。由动物模型提供的方差分量的估计是针对基础群体【是这样吗?加性遗传方差应该还含有子代育种值的方差部分啊】,群体中的所有其他个体都是从该群体获得的。然而,由于整个谱系中的信息很少可追溯到真正的基础群体,通常的假设是具有数据的第一代动物构成基础群体。动物模型的一个重要优势在于它可以纠正后代中遗传信息的流动,所以方差分量的估计不受有限种群大小、分类交配、选择或近交的任何效应的影响。
首先,等式(2.3)中的简单模型很容易扩展到包括其他固定效应:例如,可能需要校正个体的年龄、性别、采样日期等。 其次,还可以结合额外的随机效应以解释残留表型之间的相关性,同时校正加性遗传效应:例如,我在下面更详细讨论的母体或共同环境效应将产生个体组之间的相关性。 每个案例都涉及各自\beta的扩展和额外Z_iu_i的引入,如
y=X\beta+Z_1u+Z_2c+Z_3m+e
3.野生群体研究
(a)数据集
我在这里查看动物模型在分析野生动物种群研究数据时的使用,其中自由范围的动物在自然环境中测量。这种研究通常包括对标记个体的强烈长期监测,为解剖在自然环境中表达的定量性状的遗传基础提供了独特的机会。我将在这里特别讨论的是对野生有蹄类动物和雀形目鸟类群体的研究:苏格兰西北部兰姆岛北块(Clutton-Brock等,1982)的红鹿(鹿鹿) (Ficedula albicollis)群体在瑞典Gotland岛上(Gustafsson 1986;MerilaĄ§等人2001b; Sheldon等人2003)。除了上述的游离猕猴群体(Konigsberg&Cheverud 1992),已经使用或正在进行动物模型分析的其它野生种群包括在Hirta岛上的Village Bay的Soay绵羊(Ovis aries)种群,St Kilda,Scotland,Scotland(Milner et al.2000; Coltman et al.2001);在加拿大阿尔伯塔省Ram山的大角羊(Ovis canadensis)种群(Re?ale等人1999; Coltman等人2003);加拿大西南育空地区的红松鼠(Tamiasciurus hudsonicus)种群(McAdam et al.2002; Re?ale et al。2003a,b);一个伟大的山雀(帕鲁斯主要)人口在Wytham Woods,牛津,英国(McCleery等人2004年);荷兰Vlieland岛上的大山雀种群(E. Postma和A.van Noord-wijk,未发表的数据);位于英国谢菲尔德的Rivelin Valley的长尾山雀(Aegithalos caudatus)群体(MacColl&Hatchwell 2003);在法国南部和科西嘉岛的三个蓝山雀(Parus caeruleus)种群(Charmantier等人2004a,b);在挪威北部的岛屿上的五个房屋柱(传球手);(Jensen et al。2003);和加拿大魁北克省Sainte-Marguerite河移植的大西洋鲑鱼(Salmo salar)(Garant等人,2003)。
这些研究群体中有许多共同的特点。个体动物可以通过出生后不久分配的人工标记(标签或环)或通过自然标记来识别。鸟类种群是通常使用巢箱的雀形鸟类;小鸡在巢上敲响,并且伴随的成年人被捕获在巢箱中或通过薄雾网。野生有蹄类动物可以在出生时被捕获,标记和测量(红鹿:Clutton-Brock等人,1982)或被向上舍入(Soay sheep:Clutton-Brock&Pemberton 2003)或被诱捕入陷阱(大角羊:Festa-Bianchet et al.2000)。在大多数情况下,在所有育种尝试中,从出生到死亡对个体进行监测,并且除了生命历史数据之外还收集形态和行为数据,尽管这种方法根据定义仅在某些情况下可行。作为这些单独监测群体的一个例外,在大西洋鲑鱼的研究中,成年人在释放到新地点的时间点取样,并在随后的几年中对后代进行取样(Garant等人,2003)。基于父母身份的信息建立家谱,详情如下。
这些研究中考虑的许多群体在某种程度上是人工的。这可能是由于使用巢箱;因为他们是一个家庭品种的野生种群(在圣基尔达的Soay绵羊);因为他们最近只是通过淘汰(Rum上的红鹿群,Ram大米大角羊群)而被释放;或由于人工引入一个新的栖息地,以监测(圣玛格丽特河大西洋鲑鱼)。然而,如果它们包括生活在自然环境中的个体,其中出生和死亡是自然调节的,则它们对于生活在野生条件下的完全野生种群的研究尽可能接近。
(b)建立谱系
构建一个种系或家系树,用于人口(可以计算不同对个体之间的相关性)需要知道每个个体在种群中的亲缘关系。父母身份可以通过两种方式之一建立:通过在现场进行的观察或通过遗传数据。前者被应用于许多鸟的研究,其中参加巢的一对鸟被认为是巢中的小鸡的父母。如果存在额外配对的亲子关系或不太常见的种内寄生寄生,这可能明显产生错误(参见Ąě7)。现场观察也可以用于根据哺乳观察结果确定哺乳动物群体的产妇。在哺乳动物群体的极少数情况下,交配季节期间的行为观察也可用于识别个体的父亲,通常基于从观察的出生日期到估计的受孕日期的反向计算;这在一些交配系统中产生可靠的父系(Pemberton等人,1992),而不是其他人(Coltman等人,1999a)。然而,在许多哺乳动物研究中,父系通常使用分子数据更可靠地分配,例如在多个微卫星基因座处的基因型。分子数据也是在不可能分配亲本的系统中谱系构建的先决条件
从观察的性别,如野生鱼类种群的研究(Garant等人2003; Wilson等人2003a)。
已经开发了许多不同的分析技术和软件,用于使用分子数据分配亲本(参见Jones&Ardren 2003中的综述)。例如,软件包Cervus(Marshall等人1998)使用ML方法来识别一组候选男性中最有可能的父亲,并且如果且仅当他显着更可能的时候,给该男性分配亲子比任何敌对的男性。或者,在父母双方都不知道的情况下,可以通过联合分配父母而不是单独分配父母关系,根据它们产生给定育种基因型的联合可能性(例如Duchesne等人,2002),或通过确定兄弟姐妹(例如Thomas&Hill 2000)。分子数据可能不总是适用于人口中的所有个人,或者可能不够强大,无法区分替代候选人。然而,REML估计的优点之一是具有例如未知父亲的个体仍然可以包括在分析中。例如,在朗姆红鹿和圣基尔达苏群岛的家系中,母亲链接分别比2.7(Kruuk等人2002b)和1.2(Coltman等人2001)的因子超过了父系链接,并且Re et al。 (1999)提出了Ram山羊大角羊群体仅基于母亲链接的动物模型分析。
血统数据还可用于提供个体适应度的估计,并因此提供对表型性状的选择,如通过性状和适应性之间的关联确定的(Robertson 1966; Lande&Arnold 1983; Arnold&Wade 1984)。通常的做法是将适应度定义为个体产生的后代的总数,或者仅考虑生命期繁殖成功的单一成分,例如成年存活或成年繁殖力(参见Kingsolver等人(2001)for表示文献中提出的健身成分范围)。然而,考虑人口随机性和跨代效应的更复杂的措施可能最终提供对个体遗传对后代的遗传贡献的更好的估计,并且因此对不同表型性状的选择(参见Grafen 1988; Charlesworth 1994; van Tiendren 2000; Wolf&Wade 2001; Brommer et al.2002; Coulson et al.2004)。
4.原型变异的原因部分
(a)共同的环境影响
动物模型的线性模型框架提供了一种直接的方法来估计表型性状方差的附加到遗传方差上的一系列因素。例如,如果局部环境条件影响表型,则共享相同环境的个体将具有相似的表型,违反了残差误差不相关的标准加性模型的假设(Lynch&Walsh 1998)。特别是,如果亲戚比非亲戚更有可能分享当地环境,常见的环境影响将偏倚遗传力估计。
通过包括识别特定共同环境(例如,巢箱编号或出生年份或领域)的术语作为额外的随机效应,在动物模型中拟合常见的环境影响。一些研究现在已经显示出实质的差异组成部分,由于在同一巢中的小鸡共同的共同环境的影响。例如,在合作繁殖长尾山雀中,父母喂养行为具有0.43的遗传性,而巢之间的差异又占表型方差的43%(MacColl&Hatchwell 2003)。在抓捕的捕蝇器小鸡中,巢箱之间的差异占身体状况方差的49%(MerilaĄ§等人2001b)和踝骨长度方差的30%(Kruuk等人,2001)。类似地,在蓝鳍雀鸡中分别高达56%和25%的体重和us骨长度的变化可以归因于巢箱效应(Charmantier等人2004a)。
常见环境影响的确切时间有时可以通过拟合适当的随机效应来确定。对于圈套捕蝇器形态测量数据,通过考虑已经通过实验交叉的雏鸡,常见的环境影响可以进一步分为:(i)在2日龄交叉繁殖之前通过拟合原点巢作为随机效应;和(ii)通过将饲养作为随机效应嵌套而在2天和14天测量之间作用的作用。对于t骨长度,原始巢和饲养巢解释了大致相等的方差比例(Kruuk等人,2001),而对于身体状况,原点效应的巢是可以忽略的,几乎所有的常见环境是由饲养巢图1;MerilaĄ§等人2001b)。因此,身体状况似乎对最近的环境条件更敏感,而t骨长度,骨骼尺寸的量度,受到原产地产生的更持久的差异的影响。后者可能是由于预先投资于卵大小(参见Potti(1999),母亲效应的例子,下面更详细讨论)。或者,由原始效应巢代表的全同胞之间增加的协方差也可以指示优势遗传方差,因为us长度显示相同群体中的显着的近交繁殖抑制(Kruuk等人,2002a)。此外,根据上述对比,在这个群体中没有近亲繁殖抑郁症的证据(Kruuk等人,2002a)。
如果没有考虑到由共享环境产生的兄弟姐妹之间的协方差增加,则遗传估计膨胀:例如,在没有适应共同环境影响的情况下运行相同的模型,而将亲缘关系的估计值从0.35提高到0.67 (LEB Kruuk,BC Sheldon和J.Merila,未发表的数据)为t us长度和从0.30至0.76。对于使用动物模型估计的遗传度通常低于来自母体后代回归或全同胞分析的估计(表1)的观察结果,这种影响可能是负责的。然而,注意,即使使用动物模型,完全分离加性遗传效应和早期共同环境或亲本效应可能是不可行的。例如,对于圈养的捕蝇器小鸡,t骨长度和身体状况的遗传率的估计值低于非交叉培养的个体(Kruuk等人2001;MerilaĄ§等人2001b,2004)。
(b)产妇影响
母亲的影响发生在母亲的表型影响她的后代的表型时,除了她所经过的基因的加性效应以外(Mousseau&Fox 1998)。母体效应可以在遗传上或环境上确定:例如,在哺乳动物中,泌乳对后代生长速率和性能具有关键作用,并且可以通过母亲基因型和其环境来确定。母体效应传统上被视为一个棘手的统计问题,有可能偏差加性遗传方差估计(例如Falconer&Mackay 1996)。然而,它们越来越被认为是自身权利的表型变异的有趣和重要来源,因为它们在动物育种(Simm 1998)和适应性进化现象(Mousseau&Fox 1998; Wolf et al.1998 ;QvarnstroĄ§m&Price 2001)。理论工作表明,它们对选择的反应可能具有重大的,甚至违反直觉的影响,使得理解它们的影响对于任何准确表示性状的进化动力学是重要的(Kirkpatrick和Lande 1989; Wolf et al。 1998)。
在拟合动物模型的上下文中,量化母体效应差异的最简单的方法是简单地将母亲身份包括为额外的随机效应。这估计了由于不同母亲的后代(除了累加遗传效应)之间的焦点性状差异造成的方差分量,无论这些差异是由于遗传或环境母体效应。因此,该模型没有明确地确定母亲表型的相关方面,而是将多个母体影响整合到一个单一的母亲性行为特征,按照Wilham的方法(1963,1972)。
以这种方式估计的母体效应可以贡献显着比例的表型方差。在St Kilda的Soay绵羊的野生群体中,母亲身份解释了后腿长度方差的10%和21%之间的差异(Milner等人2000; Coltman等人2001),和6%至9%通过胃肠线虫卵的粪便计数测量的寄生虫抗性的变化(Coltman等人,2001)。类似地,对一系列在马鹿中的表型性状的研究发现对几种生命历史和形态性状的显着的母体效应,例如占男性和女性出生体重变异的28%和20%(Kruuk等人2000 )。然而,与这些结果相反,没有证据表明对大西洋鲑的后代大小产生显着的影响(Garant等人,2003)。
对于常见的环境影响,母体效应的存在意味着来自简单动物模型的残留误差不再是不相关的。因此,省略模型的母体效应可以严重地夸大遗传力的估计,模拟研究清楚地说明了在存在母体效应的情况下指定正确模型的重要性(Clement等人,2001)。 Milner et al。 (2000)比较了具有母体效应和没有母体效应的Soay绵羊的后腿长度,体重和切牙宽度的模型,发现遗传力估计值从0%到46%之间的任何变化, ,在母体效应方差分量的大小和遗传力估计的变化之间没有明显的关系(相关性≥0.09,n≥6)。对于红鹿,从出生体重模型中排除母体身份,将雄性的遗传度从男性的0.17增加到0.54,对女性的从0.28增加到0.48(L.Kruuk,未发表的数据;这些值与Kruuk等人(2000),因为正在使用扩展数据集,并且模型包括更多的固定效应)。因此,与上面讨论的常见环境效应一样,母体效应具有产生兄弟姐妹之间协方差的能力,可能被误认为是加性遗传变异,除非明确建模,并且可能推测遗传力估计中的一些差异产生的动物模型和父母的后代回归(表1)。上述例子没有解决母亲之间的差异在遗传上而不是环境上决定的程度。量化由于母体遗传效应引起的方差需要基于来自两代以上的信息的更复杂的分析。从概念上讲,母体遗传效应可以通过比较一个给定的公牛的大后代的性能来检测,分为由他的父亲产生的后代,这将受到生长和母体效应所带来的基因的影响,由他的儿子生产,这将只受他的成长的基因的影响。因此,如果平均来说,来自父亲的大后代比来自儿子的大后代更重,那么这个特定的父亲可能带有高母性表现的基因(Simm 1998)。更一般地,母体遗传效应可以拟合为动物模型框架内的附加随机效应,具有由加性遗传相关性矩阵确定的相关方差-C协方差矩阵,正如加性遗传效应一样(Mrode 1996; Lynch &Walsh 1998)。动物育种文献显示了家庭有蹄类动物的大量母体遗传变异的广泛证据,但是它们的流行仍然需要为野生种群探索。从包含母体遗传效应的模型,也可以估计它与直接遗传效应(即两种不同的随机效应之间)之间的协方差。这种直接母体遗传协方差在确定在存在显着母体效应时选择的进化轨迹中至关重要(Kirkpatrick&Lande 1989; Wolf et al.1998)。然而,这种分析只应当提供具有足够质量和信息的数据和谱系;见Clement等人。 (2001)用于使用不同复杂性的模拟数据比较不同的母体遗传模型。
由于母体效应会对一组同胞产生共同的环境影响,母体效应和上一节讨论的共同环境效应之间显然存在重大的重叠。例如,在捕蝇器小鸡形态模型中,将母系身份替换为母系和父系身份占了方差的相似比例(Kruuk et al。2001;MerilaĄ§et al。2001b)。还值得强调的是,将母体效应(即使是最简单的环境形式)与加性遗传效应分开通常需要在谱系中存在父系链接,没有它们,母系效应可以作为加性遗传方差出现(参见Re ?le等人。1999,2003a,b)。 (或者,可以通过使用交叉培养实验来估计母体效应而没有父系信息:McAdam等人(2002),McAdam&Boutin(2003a)。)
最后,请注意,使用这种标准的定量遗传学方法,母体效应只是作为不同母亲的后代之间的给定特征的变量而显而易见:因此,假设不同的母亲为其后代提供一致的不同水平的母亲护理。因此,该方法将不检测与父母的后代之间的差异投资相关联的母体效应(例如Lessells 2002; Badyaev等人2003),这将在母体同胞组中产生方差而不是产生方差。除非明确建模(例如,在两性之间的一致性差异的情况下),这种方差将被分配给残差方差分量,并且不应该改变任何其他方差分量的估计。 Wilham模型也不试图确定哪些母体特征负责对后代的母体效应(参见Kirkpatrick和Lande(1989)关于这种方法的优点和局限性的讨论)。 这与将母亲投资或表现的显性测量作为感兴趣的表型性状的分析(例如分娩日期或后代存活率; Re ?le和Festa-Bianchet(2000); McAdam等人(2002) ))。
(c)重复措施或永久环境效应
对个体监测的动物的长期研究经常涉及在其一生中对同一个体的重复测量,产生另一种情况,其中标准动物模型中的残留误差是相关的。然而,通过包括定义同一个体的所有观察共有的永久环境的另一个随机效应,可以容易地在动物模型框架内容纳重复的措施(Lynch&Walsh 1998)。这意味着,首先,可以利用所有可用的测量,而不是对每个动物使用单个平均值。更令人感兴趣的是,它允许估计另一个方差分量:不同个体的测量组可用于量化永久个体差异,超过由于加性遗传效应引起的差异。例如,个体在其早期发展过程中经历的环境可能产生持续的整个成年期的影响(Kruuk等人1999;Lindstro¨1999; Lummaa&Clutton-Brock 2002),以及其他因素,例如个人的家范围或领域。通过多次观察,个体之间的这些永久性差异可以从残差中分割出来,然后残差仅代表个体内方差。
在长寿物种中,可以从不同年份的个体的多次观察中获得重复的措施。使用这些数据,Re?ale et al。 (1999)发现,常年环境影响分别占大角羊成虫体重的35%和26%的变异。 Coltman et al。 (2001)在他们对Soay羊的夏季寄生虫负担的分析中拟合了永久环境影响,发现它们占女性方差的11%,但只有男性方差的4%。通过对马鹿鹿年生长的鹿角尺寸的分析显示,总质量方差的24%是由于永久环境影响(图2; Kruuk等人2002b),高达26%的波动方差不对称(Kruuk et al。2003)。然而,没有证据表明对红松鼠的产仔数或分娩日期有任何永久的环境影响(McAdam等人,2002),表明当前环境条件对该系统的影响更大。
尽管其名称,永久环境效应也将纳入任何非附加的遗传效应,如由于优势或上位性,因为这些也将有助于个人之间的永久性差异。因此,考虑到先前的证据表明对这种性状有显着的支配作用(Coltman et al。1999b),优势方差可能导致在Soay绵羊中观察到的寄生虫抗性的永久环境方差分量(Coltman et al。2001) 。再次,永久性环境影响可能与母体效应重叠:如果母体效应不适合模型,母体效应产生的任何变化可能在重复测量的分析中显示为永久环境影响,因此需要注意不过度指定模型。性状的重复性可以从遗传力的总和加上由于永久环境影响引起的变异的比例加上任何其他随机效应,例如对于给定个体不改变的共同环境或母体效应来计算例如Milner等人2000)。然而,参见Dohm(2002)考虑的异常情况,其中重复性可能不设定遗传力的上限。
最后,通过随机回归模型(Meyer&Hill 1997; Meyer 2000),对个体动物在其一生中的重复测量可用于探索生长轨迹的定量生成。随机回归模型将描述个体在年龄方面的变化的参数与随机效应(适用于标准混合模型,参见Pinheiro&Bates(2000))拟合。然后可以以与加性遗传效应相同的方式指定这些随机回归效应的方差结构,以给出生长率的加性遗传方差的估计。据我所知,动物模型随机回归还没有应用于来自自由环境中的自由范围的人口的数据,但将是描述年龄相关的表型性状变异的有用工具,例如确定生长轨迹的可遗传基础或衰老。
(d))使用动物模型来鉴定定量
性状基因座
动物模型的进一步使用是在数量性状基因座(QTL)的鉴定中。 George et al。 (2000)开发了一种拟合QTL效应作为动物模型框架内的额外随机效应的方法,除了ai在公式(2.1)中描述的多基因效应。然后通过同位 - 下降矩阵确定QTL效应的协方差矩阵,其中每个元素是基于谱系结构的一对等位基因通过下降是相同的概率。这种基于REML的分析具有动物模型的所有优点,与处理不平衡数据集和复杂谱系结构相比,用于QTL鉴定的替代方法,例如半同胞之间的线性回归间隔映射(George et al。2000) 。
在野生种群中鉴定QTL的一个罕见例子中,Slate et al。 (2002)使用方差分量方法来识别对朗姆鹿群体出生体重有显着影响的位点。他们的分析表明在两个连锁群上分离QTL,其中一个在全基因组水平上是显着的,线性回归分析识别第三个(Slate等人,2002)。
表1包含来自不同研究群体的一系列表型性状的遗传力估计的比较,使用亲代后代回归或全同胞分析估计,与动物模型相比。出现两个一般问题。首先,如上所述,动物模型分析的可能性估计一般低于父母 - 后代回归或全同胞分析,可能是由于其他来源的方差在简单技术中没有考虑到。第二,标准误差的估计也始终较低(见下文)。
5.育种价值的分析
使用动物模型来量化个体生殖价值或育种价值(Lynch&Walsh 1998)代表了与以前在进化生态学中使用的定量遗传学方法的显着不同。 REML方差分量估计本质上是一种更有效和强大的替代方法来估计遗传力,而在提供育种值的估计时,动物模型为新分析产生了丰富的机会。个体育种价值的预测可以与个体表型相同的方式进行分析,以量化时间趋势或选择压力。这些允许在基因型和表型水平的趋势和关联之间的显式比较,正如下面所讨论的例子可以提供对群体的进化动力学的宝贵的见解。
(a)检测遗传趋势
进化涉及人口的遗传组成的变化。为了测试群体是否正在进化,因此仅仅显示平均表型有变化是不够的,因为变化的环境条件可能产生这样的趋势(Hendry&Kinnison 1999)。在给定的研究期内在群体中展示微生物需要基因型变化的证据,其中育种值的分析可以提供。
在1989年至1998年期间,加拿大育空地区红松鼠的分娩日期每年增长3.7天(Re?ale et al。2003a)。这种变化的一部分是由于平均育种价值的微观转变,其每代产量提前了0.8天,而剩余变化可以通过表现型个体内变化的表型可塑性来解释(Re?ale et al。2003a) 。在没有育种值的预测的情况下,这种表型可塑性可能被误认为进化变化,因此高估了选择的反应。类似地,大角羊羔中角质尺寸和体重的平均育种值的下降反映了战利品狩猎在去除具有最高遗传优势的个体中的不期望的影响(Coltman等人2003)。
在Gotland岛上的圈套捕蝇草群体中,具有高身体状况指数的小鸡显然更可能在冬季迁移到非洲后生存,并作为繁殖成虫返回(Merila¨等人,2001a)。身体状况也是可遗传的(Merila¨等,2001b),提示身体状况应该增加。然而,与大规模气候变化相关的恶化的环境条件导致在二十年研究期间新生身体条件的平均表型值下降(图3a)。对育种值的分析表明,这种环境变化掩盖了育种值相反方向的遗传趋势,在研究期间显示出显着增加(图3b:每年增加0.0022〜0.0009; Merila等2001a)。反对环境趋势的存在掩盖了
进化反应或“反梯度变化”(Conover&Schultz 1995),在这种情况下,对于对可遗传性状的定向选择缺乏明显反应,提供了一个有吸引力的解释(Cooke et al。,1990; Larsson et al。 1998;Merila¨等人2001c)。此外,恶化的环境条件实际上可以增加对性状的选择的程度(Milner等人1999;Merila¨等人2001a; McAdam&Boutin 2003b; Coulson等人2003),增加了对选择的微观演化反应的可能性。
在抓住的捕蝇器例子的情况下,我们可以显示观察到的变化不是由于移民从另一个人口,因为移民的后代的育种价值在这段时间没有变化(变化-0.0006?0.0014;
L.E.B.Kruuk,B.C. Sheldon和J.Merila,未发表的数据)。因此,以这种方式区分本地群体中的遗传趋势相对于移民,也提供了量化迁移的影响的可能性,并且在适当的情况下应该提供明确展示基因流动的影响的手段。
(b)性状之间的环境协方差
和健身
分析育种值可以揭示第二种情况,其中环境异质性产生选择动态的误导性印象。选择是从给定特征和适合度测量之间的关联度测量的。然而,在一些情况下,这种关联可以完全由特征和适应度之间的环境协方差生成,例如,如果主导环境条件导致性状值增加加上适应度增加。净结果是选择的统计印象,但在遗传水平的性状和适应性之间没有关联。这个理论由Fisher(1958)讨论,并由Price等人明确建模。 (1988)。在测量方面,可以通过使用表现值与育种值估计的选择梯度的比较来检测环境短路(Rausher 1992; Stinch-combe等人2002)。
作为这种环境协方差的一个例子,雄性马鹿鹿角的大小是可遗传的(图2)和在正向选择下(Kruuk等人2002b)。对于朗姆酒研究群体,在30年研究期间鹿茸尺寸的增加的缺乏可能是由于环境条件恶化,因为研究区域中的人口密度增加,并且鹿茸生长强烈地依赖于条件。然而,在研究期间,没有证据表明育种值存在遗传倾向。相反,当个体表型被分解为育种值和环境偏差时,唯一重要的选择差异是环境偏差:育种成功的差异与鹿茸群体的环境因素有关,而不是育种值(Kruuk et al.2002b)。这可能是因为环境条件影响个体的营养状态,并因此影响在给定年份中生长的鹿角的尺寸以及其在该年的繁殖季节的战斗能力和交配成功。鹿茸尺寸和适应度之间的环境协方差的概念进一步得到了鹿茸群体和终生繁殖成功之间缺乏任何遗传相关性的支持,再次表明两者之间的任何关联是环境决定的(Kruuk等人2002b)。
环境协方差假设因此提供了一个可能的解释维持遗传变异在强阳性选择的性状,和缺乏对表观方向选择的表型反应。该分析还构成另一个例子,其中环境变化产生错误导向的模式,再次突出了能够将表型与基因型效应分开的需要。
(c)拮抗选择压力
最后,不同性状或不同适应度成分之间的复杂相互作用也可通过分析育种值而变得明显。例如,在捕捞的捕蝇草中,对于从巢产生的后代的数量,早期育种具有强烈的选择,并且育种时间是可遗传的(Sheldon等人2003)。个体育种值的预测表明,虽然在招聘后代的数量上与早期育种时间相关的育种价值有重大选择,早期育种的育种价值也与较低的成年存活率相关。在当前繁殖力和未来繁殖之间,在育种值水平上的这种权衡可能限制了对选择的任何反应,但是拮抗选择的模式在表现水平上不明显。
5.多元分析
(a)量化遗传相关性
动物模型方法的另一个有价值的方面是可以容易地分析关于多个表型性状的数据。这是很重要的,因为与人工选择不同,自然选择很少只针对单一特征(Price&Langen 1992; van Tienderen&de Jong 1994)。性状之间的遗传相关性将它们的命运结合在一起,使得进化轨迹的单变量分析不可避免地过于简单化。如果没有单个基因型是最佳的,则通过负遗传相关性或拮抗选择压力起作用的性状之间的权衡的存在可以用于防止基因性状遗传变异的侵蚀。直觉上,我们可能期望正方向选择下的性状之间的遗传相关性是负的,只是因为产生正相关的等位基因大概已经被选择扫描到固定(Roff 1996,1997)。然而,尽管这个概念的直观吸引力,重要的健身相关性状之间的负遗传相关性的观察是相对罕见的:尽管生命史特征之间的负遗传相关性比形态性状更高比例,但是大多数遗传相关这两个类仍然是积极的(Roff 1997)。
多变量动物模型提供了估计协方差的直接方法,因此提供了性状之间的相关性(Mrode 1996; Lynch&Walsh 1998)。来自野生种群的动物模型研究的结果迄今通常证实了上述对性状之间的大多数正相关性的观察。例如,三者之间存在正的遗传相关性
在Soay绵羊中的形态测量测量(Milner等人,2000),以及体质量和寄生虫抗性之间(Coltman等人,2001)。身体质量和角尺寸在大角羊羔中具有相当的遗传相关性(Coltman等人,2003年),蓝喙are的t骨长度和身体质量(Charmantier等人2004a)和两个羽毛特征在男性抓住的捕蝇器(Sheldon et al。,2003),但在育种时间与母本之间存在相关性(Sheldon et al。,2003) Jensen等人(2003年)报道了一组六种不同种群的阳性和阴性显性遗传相关性的证据(Coulson et al。2003),红色松鼠(Reyesle et al。形态学特征,但是在一套多变量分析中,在有圈捕蝇器中进行直接选择的9个物候和形态特征,没有一个负相关是显着的(Sheldon et al。 2003)。
估计性状之间的遗传相关性需要大量的样本大小,标准误差通常比那些与遗传相关的大得多(Roff 1997; Lynch&Walsh 1998)。此外,多变量分析将只是作为已经测量的性状的信息,而可能是一些完全未测量的性状是进化变化的真正载体(van Tienderen&de Jong 1994; Kruuk et al。 2002b)。然而,多变量进化的进化意义的增长的欣赏应该弥补遗传相关遗传相对遗传力的缺乏,从而提高我们对复杂表型的遗传结构的理解(Roff 2003)。
(b)基因型 - 环境相互作用
基因型 - 环境相互作用的存在将改变不同环境中遗传方差的表达。在这种情况下,动物模型分析很容易通过拟合多变量分析或通过随机回归来测试基因型对环境的相互作用。在前者中,通过将在不同环境中表达的性状定义为不同的'子性状'来定量基因型 - 环境相互作用。这些子性状之间的遗传相关性显着小于单位,或者加性遗传方差大小的显着差异,表明基因型 - 环境相互作用(Falconer&Mackay 1996; Hoffmann&Merila¨1999)。到目前为止,G?这种方式的E相互作用是一个很大程度上尚未探索野生种群的领域,将这种分析的功效与G的测试进行比较是有趣的。 E交互作用(例如Merila¨1997; Kunz&Ekman 2000)。 Charmantier et al。 (2004b)显示了在寄生的和非寄生的巢中饲养的蓝鳍tit的体型的显着的基因型 - 环境相互作用的证据,寄生虫的存在使得遗传力估计值从0.91降至0.53。类似地,环圈捕蝇器第二性性羽毛特征的变异的因果分量与气候条件有关(Garant et al。2004)。在这两种情况下,根据以前鸟类群体的结果,在更紧张的环境中,添加遗传方差的水平降低(Hoffmann&Merila¨1999)。在不同性别可以被视为表达特征的不同环境的程度上,多变量分析也可以用于量化遗传协方差和性别之间的相关性,这对于预测性别特异性进化反应和性二态性。例如,Jensen et al。 (2003年)报告大型遗传相关性,并没有显着不同的性别之间的统一在麻雀的形态特征。
多变量方法仅允许在不同类型的离散环境之间进行比较,其中特性被定义为在一个或其他环境中表达。环境条件的连续变化,有效地反应规范或个体表型可塑性的遗传性的影响的分析(Pigliucci&Schlichting 1997)可以通过与用于描述年龄变化的随机回归模型类似的随机回归模型来实现(de Jong& Bijma 2002);见Kolmodin et al。 (2002)和Fikse et al。 (2003),用于在动物育种中应用该方法。目前在野生种群中似乎没有任何研究采用这种方法,但是它们应该作为混合模型用于探索表型可塑性的自然延伸(Przybylo et al.2000; Brommer et al.2003) 。
讨论
(a)环境异质性的会计
人口和野生人口之间的关键区别是人口所经历的环境条件。这些可以是恒定的或至少在人工种群中是可控的,但对于野生种群是可变的和不可预测的。虽然这种变化是自然环境中研究最有趣的方面之一,但它也使得进化模式显得更加困难。因此,异质环境导致测试进化论的问题有很多原因,主要与难以获得重要参数的准确估计有关。例如,总结前面章节中讨论的例子:(i)如果不控制,常见或母体环境影响可以偏差方差组成部分和遗传力的估计; (ii)环境变化可能掩盖遗传趋势; (iii)环境协方差可产生偏差的选择测量; (iv)基因型 - 环境相互作用可以影响方差分量的表达。在每种情况下,环境异质性的影响可以通过适当的模型进行量化和控制,我希望已经证明了使用动物模型方法可能经常可行的方法。
在所有情况下,需要比环境条件恒定时更复杂的分析。考虑到数据的更大变异性,需要较大的样本量来提供等量的统计能力,并确保对环境影响的准确估计。这些是使用最有效和最强大的分析手段的进一步原因。
(b)
REML动物模型的优点
前面的部分已经给出了REML动物模型相对于基于更传统的亲代后代回归或全或半同胞设计的分析的优点的一些指示(参见Merila等人2001c中的讨论)。首先,在同时考虑来自所有世代的所有亲戚的信息时,动物模型提供了对可用数据的相当更有效的使用,并且因此提供了更强大的统计测试。 (例如,在30年的研究期间,只有18对父子对可用于分析鲁尔斯岛研究中的马鹿鹿茸的雄性鹿茸数量,鹿茸质量的测量值,通过动物模型纳入关于母系和父系链接的信息以及在全多代家系中对兄弟姐妹的测量意味着可以包括具有已知鹿角测量的126个个体(LEB Kruuk,未发表的数据)。多代分析还避免个体包括父母后代回归两次,作为父母和后代,或不得不平均后代表型。因此,在几个研究中,使用父母 - 后代回归和动物模型估计的遗传力估计在完全相同的数据集上,标准误差在后者中一直较低,大约为2倍(Re等人1999; MacColl&Hatchwell 2003)。在以后使用动物模型重复进行群体中给定性状的研究的情况下,与基于亲代 - 后代回归的早期结果的比较也显示出明显更小的标准误差,尽管差异将部分地因为在最近的分析中样本量较大(表1)。
第二,除了提高效率之外,似然估计还提供比传统最小二乘法更大的灵活性(Shaw 1987)。 REML分析容易地适应包含缺失的表型测量的不平衡数据集,使得未测量的个体仍然可以包括在患者中以提供测量的个体之间的联系。一个典型的例子是性别有限的性状,例如雌性鸟类的离体尺寸:将在分析中包括男性亲属以提供亲缘之间的联系,使得父亲半姐妹或父亲祖母和后代之间的协方差可以是开发。第三,也没有要求在平衡的结构中设计,个人可以被包括在谱系中,尽可能少的或尽可能多的关于其亲属的身份的信息。第四,一系列固定效应可以容易地并入模型中,这比分析来自单独模型的校正残差在分析上更简单。第五,如上文详细讨论的,可以估计表型变异的其他因果分量,例如母体效应或共同环境效应,否则可能导致遗传力的估计过高。类似地,第六,可以包括对同一个人的重复测量,允许估计永久环境影响或个体生长轨迹的遗传性。最后,因为关系矩阵允许遗传信息从一代到下一代的流动,基础群体中方差分量的估计在研究期间不受非随机交配,近交繁殖,选择或进化的任何影响(Thompson 1973; Sorenson&Ken-1984; van der Werf&de Boer 1990; Lynch&Walsh 1998)的偏差估计。
(c)REML动物模型的缺点
针对动物模型的各种优点设置显然具有增加计算复杂性的缺点,其中用于解决ML方程的复杂数值方法(Lynch&Walsh 1998)需要更大量的计算时间和复杂的编程工具。第二,与任何分析一样,随着模型的复杂性增加,由于过度指定,混杂效应和误解的问题的机会也增加。特别地,包括额外随机效应可能在方差分量的估计中产生可靠性成本,并且过度规范可能导致算法收敛的失败。
还值得注意的是,这些技术已经开发用于动物和植物育种中,其中研究通常涉及数千个个体的样本大小和完全可靠的谱系链接,保证在研究中很少(如果有的话)获得数据的质量的野生动物种群。为了分析基于多代和多种形式的相关性的大型,复杂的家系,动物模型的优越性是显而易见的。然而,对于更简单的数据集,例如只有父母 - 后代数据可用,相对于传统技术(Knott et al。1995)将有更少的优势。类似地,不必要的复杂分析不应被用作伪装较低质量的数据集:遗传参数的估计只与它们所基于的数据一样好(Meyer 1989a)。因此,值得强调的是,在更复杂的分析技术的应用中使用注意。这里讨论的不是万能的定量遗传学中的所有弊病,没有任何意义,采取一个大锤破解坚果。
最后,动物模型返回基础群体的方差分量的估计,而不受后续世代中的选择的影响。然而,如果这个基本群体本身被选择,则REML分析不能考虑这个先前的选择,也不能考虑未包括在分析中的任何相关但未测量的字符的选择(Schaeffer& Song 1978; van der Werf&de Boer 1990)。
(d))血统错误
最后一个考虑因素是不可靠数据的影响。任何定量遗传学分析的基础是评估个体之间的相关性的谱系信息。错误的谱系将产生错误的遗传参数估计。对于野生脊椎动物群体的野外研究,母体身份的错误是罕见的:例如,产妇是通过现场观察确定有完全可靠性的有蹄动物群体讨论这里(Marshall等人,1998年),没有证据的内部特异性讨论的雀形目鸟类群体(例如Kempenaers等人1995; Sheldon&Ellegren 1999)中的寄生寄生。然而,父系链接中的错误更有可能,例如由于鸟类群体中的外配对父亲(EPP)。例如,在圈套的捕蝇草种群中,15%的病例中父系链接因为EPP而错误(Sheldon&Ellegren 1999);在法国南部的蓝山雀种群中,EPP率在14%和25%之间(Charmantier和Blondel 2003)。然而,使用遗传数据的父亲分配也是不完全的:例如,在这里讨论的有蹄动物研究中,父亲分配中的统计确定性水平(Marshall等人,1998)涉及20%的错误率(Kruuk等人2000; Coltman等人2001)或5%(Milner等人2000; Coltman等人2003)。
父亲错误率因此相对较高,如果与英国奶牛家族的父系中估计的10%误差率没有显着不同(Visscher等人2002)。此外,请注意,在许多情况下,谱系中的母亲链接显着增多,因此父系的贡献不到信息的一半。然而,谱系误差的净效应毫无疑问是减少遗传力的估计,这种减少的幅度是需要勘探的区域。 MerilaĄ§等人。 (1998)报告了在从已有的EPPs(16%的个体)基于父系副树对的分析中,在抓住的捕蝇器中t骨长度的遗传率增加了3%。 Milner et al。 (2000)提出使用由95%置信度的父系构建的谱系估计的遗传力,但提到使用80%置信度的估计较低,尽管具有较少的父系,模型的可靠性也降低。 Konigsberg&Cheverud(1992)开发了一个ML模型,其中父亲转让是可能的,所有潜在的候选父亲被分配给同等可能的父亲为一个给定的后代;使用模拟数据,他们表明,遗传性估计的精度只有增加,只有非常有限的可能性的数量。最后,荟萃分析显示,在鸟类群体中,女性的遗传率略高于雄性(Jensen et al。2003),部分原因可能是由于EPPs降低了父亲Cson回归估计的遗传力。进一步探讨这些影响的模拟研究将是非常有价值的。还要注意,我们假设错误是随机的表型,但是这又需要进行测试。
(e)未来方向
尽管动物模型在动物育种文献中有着悠久的历史,但其在进化生态学中的普遍应用仍然是最近的。因此,对于简单动物模型有许多阐述,但仍需要使用来自野生群体的数据进行探索,这将产生更复杂的分析并允许更好地分析关键假设。多变量分析,随机回归和基因型 - 环境相互作用的分析在野生种群的研究中都得到相当多的关注。鉴于足够的谱系信息,量化母体遗传效应的方差及其与直接遗传效应的协方差也有可能产生一系列新的调查途径。混合模型在非正态数据分析中的使用仍然需要充分利用来自自然群体的数据。例如,现在可以使用具有贝叶斯估计的混合模型来拟合生存分析,以量化长寿中加性遗传方差的比例(Ducrocq&Casella 1996; Ducrocq&Solkner 1998)。然而,对于二项式特别是二进制数据,混合模型的结果可能不如基于正态理论的分析(Breslow&Clayton 1993)可靠,因此,如果可能,在处理这样的情况下,接近正态分布可能是优选的数据。
对多代谱系信息的野生动物群体的研究数量不断增加,并且利用动物模型分析可以提供实质性益处的数据集的数量。希望这将导致文献中这类研究的分类范围扩大,从而打破目前对雀形目鸟类或有蹄类动物的近乎垄断。最近已经开发了许多方法,其允许使用来自分子标记数据的间接推断(例如Ritland 1996; Ritland&Ritland 1996; Mousseau等人1998)来估计定量遗传参数而没有明确地指定谱系,分析,需要在群体中谱系结构的先验知识。然而,到目前为止,几种可供选择的方法的比较(Thomas et al。2001; Wilson et al。2003b)表明,使用分子数据推断个体之间的家族关系(例如Thomas&Hill 2000,2002)比不涉及谱系的间接方法更可靠的估计。考虑到分子数据的不断增加的可用性,这样的技术将增加系谱中的定量遗传学分析的范围,其中谱系构建是不可能的(例如Garant等人2003; Wilson等人2003a)。最后,通过将表型性状的动物模型分析与旨在鉴定个体数量性状基因座的基因组分析结合起来,从协同两端的表型变异的遗传基础上协同攻击也将获得很多益处(Barton&Keightley 2002)。鉴于足够的谱系信息,QTL定位在未经处理的野生动物种群中是可行的(Slate等人,1999),但Slate等人除外。 (2002),但还没有尝试过。
7.结论
表型性状的遗传基础是进化和生物多样性研究的核心。定量遗传学提供了分析这个基础的连续字符的统计方法,其表达由多个基因座决定。然而,两个关键问题仍然存在于进化定量遗传学的核心:什么保持表型性状的遗传变异在面对选择压力侵蚀(Roff 1997),为什么我们很少看到微观演化反应选择期望从理论预测(MerilaĄ§等人2001c)?来自实验室研究或植物和动物育种的结果可以提供对表型性状的遗传结构的一系列见解,但是实际上方差和选择压力的分量将在自然和人工环境之间变化(Hoffmann 2000) ditions只有有限的理解野生的进化的相关性。
在分析来自长期的,基于个体的研究的数据中使用动物模型已经开辟了一系列新的武器,用于攻击自然环境中的群体的这些问题。特别是,这些模型已经允许对特定假设进行明确的测试,这些假设解释了以前只能讨论的遗传变异或显性进化停滞的维持,并且在分离遗传与表型的环境成分时,揭示了基础模式通常与不太详细的分析建议的显着不同。正如这里所讨论的结果,简单地估计特征的遗传性而不考虑其他环境协方差来源可能产生高度误导的结果。此外,不同性状之间的相互作用可以施加约束,使得单变量预测不再有效。在每种情况下,使用动物模型来估计方差分量和预测育种值允许在我们对野生种群的进化遗传学的理解中作出重大进展。希望适当的数据集的增加,必要软件的可访问性,计算能力以及对混合模型和ML估计的熟悉将结合起来,鼓励在进化生态学中使用动物模型。