Cuevas2016 GS G×E 非线性高斯核函数

Cuevas J, Crossa J, Soberanis V (2016) Genomic prediction of genotype× environment interaction kernel regression models. Plant Genome 9:1–20.

抽象
在基因组选择(GS)中,基因型×环境相互作用(G×E)可以通过标记×环境相互作用(M×E)建模。G×E可以通过线性核或非线性(高斯)核来建模。在这项研究中,我们建议使用两个非线性高斯内核:再生核希尔伯特空间与内核平均(RKHS KA)和高斯内核与带宽通过经验贝叶斯方法(RKHS EB)估计。我们进行单一环境的分析,并扩展到占G×E互作(GBLUP-G×E,RKHS KA-G×E和RKHS EB-G×E),小麦(小麦 L.)和玉米(玉米大号。)数据集。对于小麦和玉米数据集的单环境分析,RKHS EB和RKHS KA对所有环境的预测精度都高于GBLUP对于小麦数据,RKHS KA-G×E和RKHS EB-G×E模型确实显示出比相应的单一环境高60至68%的优势,具有正相关的环境对。对于小麦数据集,具有高斯核的模型的准确度比GBLUP-G×E的准确度高17%。对于玉米数据集,RKHS EB-G×E和RKHS KA-G×E的预测精度平均比GBLUP-G×E高5〜6%。高斯核模型优于线性核的优势是由于更灵活的核,这说明了更小,更复杂的标记主效应和标记特异性交互效应。

他的开创性工作的Meuwissen等人。(2001)表明,复杂性状的预测能力利用全基因组标记预测使用几个标记时比当较好从模拟和实证研究的结果表明,GS可以与常规和系谱相比,提高预测精度(德洛斯坎波斯等人,2009年,2010 ; Crossa等人,2010年,2011 ; Heslot等,2012 ; Pérez- Rodriguez等,2012)几个基因组贝叶斯和非贝叶斯线性回归模型已经开发和公开,但大多数贝叶斯回归替代仅在其先验分布不同(洛斯Campos等人,2012)在基因组预测中,偏离线性是规则而不是例外,因为基因(即上位性)中的复杂隐藏相互作用及其与环境的相互作用是复杂性状的遗传组成的一部分从线性这些偏差可以通过半参数的方法,例如RKHS回归(处理。Gianola等人,2006,2014年); RKHS回归减少了参数空间的维度,并且捕获了标记物之间的小的复杂相互作用。Morota和Gianola(2014年)提到加上内核的组合可能捕捉非加性变异基因的预测

该RKHS方法GS使用标记为建设协方差结构矩阵是为了对称半正定ñ × ñ(其中ñ称为再生核(RK)矩阵,它依赖于标记和上线数)带宽参数(ħ)。这是一般的方法需要选择RK,例如,高斯核函数,其中(点¯x 我,点¯x 我 ')是用于将标记载体我和第我 '个个人,并且是标记基因型的平方欧几里德距离(佩雷斯-Rodríguez等人,2012)。几项研究已经表明,高斯核的方法提高的遗传值的预测(佩雷斯-埃利萨尔德。等,2015年),如果带宽参数被正确地选择。带宽参数可以基于(i)交叉验证过程,(ⅱ)限制最大似然(被选择Endelman,2011),和(iii)一种经验贝叶斯方法诸如通过提议的佩雷斯-埃利萨尔德等。(2015) 。即使用multikernel模型时带宽参数的不适当值的作用最小化的高效贝叶斯方法是由所提出的RKHS-KA 洛斯Campos等人。(2010) ,其中,每个内核使用由它的相关联的方差分量加权的带宽参数的一些预定义的值。

以前的模型通常用于在一个环境中收集的数据。然而,在植物育种中,G×E在选择候选者时起重要的混杂作用,因为基因型的表型性能在不同环境中不同。在植物育种和农业实验中评估G×E的程度的常用方法是估计环境中线性能的遗传相关性; 这些相关性总结了基因和环境条件的联合作用。基因和环境条件之间的相互作用的大小和符号预期在整个基因组中不同。在过去十年中,分子标记物的使用促进了与表型可变性相关的染色体区域的作图,并且揭示了这些染色体区域在环境中的差异反应。

在基因组选择,使用GBLUP多数分析(VanRaden 2007年,2008年)的模式是单一环境的分析。一些研究使用,可容纳G×ËGS车型提出(。Burgueño等,2012 ; Heslot等人,2014年,Jarquín等人,2014年。),并表明建模G×E能给予在基因组预测精度可观的收益(Zhang等人,2014年 ; 蒙特西诺斯-洛佩斯等人,2015年。)。近日,洛佩斯-克鲁兹等人。(2015)提出了一个GBLUP预测模型,明确车型G×所有可用的标志物和环境之间的互作(M×E)。在基因组的预测,线性模型考虑遗传值的标记效应线性组合,这样GBLUP与G×E是相当于以M为GBLUP×E(洛佩斯-克鲁斯等人,2015年)。然而,其他非线性内核(例如,高斯内核)不能具有这种双重表示; 因此,非线性核只能表示为G×E模型。

GBLUP-G×E(或GBLUP-M×E)交互模型的主要特征是它将标记效应分解为在环境(稳定性)和环境特异性偏差中常见的成分。原则上,对M×E模型可以帮助研究人员检测哪些指标具有跨环境的稳定,哪些是负责G×E.在最近的一项研究中,效果Crossa等。(2015)表明,对M×E型号可以用作收缩方法和作为变量选择方法假设内环境方差异质性。结果表明,当环境之间的相关性为正时,与单环境模型或跨环境模型(比较GBLUP-G×E相互作用模型产生在预测精度一个显著增加洛佩兹-Cruz等人,2015年)。

在这项研究中,我们建议结合高斯核方法,使用单个环境模型和G×电子交互模型洛佩斯-克鲁兹等人。(2015) 。我们比较三核回归方法预测的准确度:(i)的线性核方法洛佩斯-克鲁兹等人。(2015)(GBLUP单环境和GBLUP-G×E),(二)RKHS KA单环境和RKHS KA-G×E(德洛斯坎波斯等,2010),及(iii)本高斯核的带宽参数(^ h由经验贝叶斯方法估计)佩雷斯-埃利萨尔德等。(2015年)(RKHS EB单环境和RKHS EB-G×E)。我们说明了在单环境和G×E相互作用模型中两种数据集(玉米和小麦)中这三种核方法的使用,用于预测未被评估的环境中线的性能的问题。

你可能感兴趣的:(Cuevas2016 GS G×E 非线性高斯核函数)