Holand2013 INLA

  1. Holand AM, Steinsland I, Martino S, Jensen H. Animal models and integrated nested Laplace approximations. G3 (Bethesda). [Internet]. 2013;3:1241–51. Available from: http://www.g3journal.org/content/3/8/1241.short

动物模型是在进化生物学和动物育种中使用的广义线性混合模型,以鉴定性状的遗传部分。集成嵌套拉普拉斯逼近(INLA)是一种用于对分级高斯马尔可夫模型进行快速,基于非抽样的贝叶斯推理的方法。在本文中,我们证明了INLA方法可以用于许多版本的贝叶斯动物模型。我们使用INLA分析具有高斯,二项式和泊松似然性的合成案例研究和麻雀(Passer domesticus)群体病例研究的动物模型。使用马尔科夫链蒙特卡罗方法将推断结果与结果进行比较。对于模型选择,我们使用偏差信息标准(DIC)的差异。我们建议并展示如何通过将它们与模拟研究的抽样结果进行比较来评估DIC中的差异。我们还引入了一个R包,AnimalINLA,为使用INLA的贝叶斯动物模型容易和快速推理。


为了估计不同种类性状的加性遗传方差(以及遗传力),生物学家和动物育种者经常使用称为动物模型的广义线性混合模型(GLMM)。在动物模型中,个体i的性状具有遗传部分ui。值ui被称为个体i的育种值假设育种值是许多基因的影响的总和,并且来自中心极限定理,育种值被假定为具有由谱系给出的依赖性结构的高斯分布。自20世纪80年代初以来,动物育种者成功地使用了限制最大可能性(REML)的频率方法,例如增加牛的肉或牛奶产量(Simm1998)。然而,对REML的推论对于GLMM模型不是微不足道的。非高斯性状的模型在育种值和其他参数估计的不确定性方面尤其具有挑战性(Tempelman和Gianola 1994; Sorensen和Gianola 2002; Bolker等人2009; Fong等人2010)。流行的方法是用于计算育种值的最佳线性无偏预测(BLUP)(Henderson 1950)(Wilson等人2009)。然而,BLUP忽略了与估计相关的所有不确定性,并且不适合在进化问题中的假设检验**(Postma 2006; Wilson等人2009; Hadfield等人2010)。另一种方法是在贝叶斯框架中执行建模。所有参数都被认为是随机变量,并且(在理论上)直接考虑参数估计中的所有不确定性。这解决了推断非高斯性状的问题(Tempelman和Gianola 1994; Fong等人,2010),并解释了育种值的估计不确定性。此外,贝叶斯建模还解决了关于育种值分析的许多问题,在Postma(2006),Wilson等人(2009),和Hadfield et al。 (2010),因为育种值和育种值的功能(例如,孵化年份的平均育种值)被认为是随机变量,因此考虑不确定性和依赖性。贝叶斯框架的这种灵活性使得贝叶斯动物模型越来越受欢迎。它们从1990年代早期开始用于动物育种,而最近才引入进化生物学(Kruuk et al。2008; O'Hara et al。2008; Ovaskainen et al。2008; Hadfield 2010; Steinsland and Jensen 2010) 。参见Gianola和Fernando(1986)和Sorensen和Gianola(2002)讨论贝叶斯动物模型。除了少数特殊情况,贝叶斯模型对于典型感兴趣的数量(例如,后期均值)没有闭合形式的分析表达式。因此,需要数值近似。贝叶斯模型的传统近似程序是马尔科夫链蒙特卡罗(MCMC)(Sorensen和Gianola 2002,Van De Wiel等人2013)。 MCMC是一种非常灵活的方法,可用于推断任何贝叶斯模型,我们可以得到任何随机变量或参数的后验估计;少量,共同或功能。建立一个好的MCMC算法(快速收敛,良好的混合,计算速度快)和评估它(收敛和混合)是一个非专家的挑战。最后,对于动物模型,这已经改善,因为现在有可用于在R中使用MCMC(MCMCglmm; Hadfield 2010)和BUGS(Lunn等人2000)推断这些模型的包。对于层级潜在高斯马尔科夫随机场模型,最近已经引入了基于非抽样的数值近似过程(Rue et al。2009)的集成嵌套拉普拉斯逼近(INLA)。使用INLA,我们可以计算所有参数和每个随机效应的边际后验,以及随机效应的线性组合的后验。 INLA基于直接数字积分而不是模拟。 Rue和Martino(2007)展示了几种模型和数据集,INLA比MCMC快得多,并且对于给定的计算预算更准确。更快的推理鼓励应用研究者探索更多的模型。此外,这也打开了新的机会进行模拟研究,例如可用于探索识别性问题和建立特定假设的测试。在GLMM之间执行模型选择不是一个简单的任务(Skrondal和Rabe-Hesketh 2004),并且使用偏差信息标准(DIC)的差异已被质疑(Fong等人2010)。我们建议使用模拟研究来评估DIC是否是模型选择的适当度量。快速模拟和推理方法对于计算可行的模拟研究至关重要。 INLA已被用于统计学的若干领域,例如生存分析(Martino等人2011),空间GLMM(Eidsvik等人2009)和疾病绘图(Roos和Held 2011,Schrödle等人2011)。本文通过证明这些模型适合INLA框架并且通过提供用于进行推断的R包,AnimalInLA,对高斯和几个非高斯动物模型的更简单和更快的贝叶斯推理做出贡献。在材料和方法部分,我们介绍案例研究中使用的数据。然后我们简要修改使用INLA的相关要求和INLA给出的可能性,并完全指定我们使用的动物模型。我们还提出了一个基于模拟的测试的框架DIC的差异的能力选择有遗传效应和没有遗传效应的模型。接下来,介绍了合成案例研究和麻雀案例研究的结果。使用INLA进行推理,在一些情况下,将结果与MCMC进行比较。文章以讨论和结论为结束,讨论了INLA框架在定量遗传学中的结果以及机会和局限性。

你可能感兴趣的:(Holand2013 INLA)