全基因组选择育种(GS)简介

全基因组选择(Genomic selection, GS)是一种利用覆盖全基因组的高密度标记进行选择育种的新方法,可通过早期选择缩短世代间隔,提高育种值(Genomic Estimated Breeding Value, GEBV)估计准确性等加快遗传进展,尤其对低遗传力、难测定的复杂性状具有较好的预测效果,真正实现了基因组技术指导育种实践。

原理

常规育种手段主要利用性状记录值、基于系谱计算的个体间亲缘关系,通过最佳线性无偏估计(best linear unbiased predication,BLUP)来估计各性状个体育种值(EBVs),通过加权获得个体综合选择指数,根据综合选择指数高低进行选留。

标记辅助选择(marker assisted selection, MAS)育种,利用遗传标记,将部分功能验证的候选标记联合BLUP计算育种值,这样不仅可以提高育种值估计的准确性,而且可以在能够获得DNA时进行早期选择,缩短世代间隔,加快遗传进展。

而GS则通过覆盖全基因组范围内的高密度标记进行育种值估计,继而进行排序、选择,简单可以理解为全基因组范围内的标记辅助选择,主要方法是通过全基因组中大量的遗传标记估计出不同染色体片段或单个标记效应值,然后将个体全基因组范围内片段或标记效应值累加,获得基因组估计育种值(GEBV),其理论假设是在分布于全基因组的高密度SNP标记中,至少有一个SNP能够与影响该目标性状的数量遗传位点(quantitative trait loci, QTL)处于连锁不平衡(linkage disequilibrium, LD)状态,这样使得每个QTL的效应都可以通过SNP得到反映

相比BLUP方法,全基因组选择可以有效降低计算个体亲缘关系时孟德尔抽样误差的影响;相比MAS方法,全基因组选择模型中包括了覆盖于全基因组的标记,能更好地解释表型变异。

技术路线

  • 植物GS路线


    image.png
  • 动物GS路线


    image.png

GS预期效果:

  1. 缩短育种周期,实现待选群体的低世代选留
  2. 提高育种值估计准确性
  3. 降低育种成本,减少表型鉴定的数量
  4. 预测亲本杂交后代,选择最佳杂交优势组合

统计模型

统计模型是GS的核心,极大地影响了基因组预测的准确度和效率。根据统计模型的不同,全基因组选择的模型大体可分为两大类:

1. 直接法

此方法把个体作为随机效应,参考群体和预测群体遗传信息构建的亲缘关系矩阵作为方差协方差矩阵,通过迭代法估计方差组分,进而求解混合模型获取待预测个体的估计育种值;

image.png

2. 间接法

此方法则首先在参考群中估计标记效应,然后结合预测群的基因型信息将标记效应累加,获得预测群的个体估计育种值。

image.png

直接法 VS 间接法

性状遗传构建复杂多样,目前还没有一种模型能广泛适用于所有性状。随着全基因组选择统计模型的不断改进优化,模型的稳定性及准确性不断提高,但是依然面临两个重要的挑战,即计算准确性和计算效率

直接法(GBLUP为代表)计算效率较高,但是计算准确性略差于间接法(BayesB为代表),虽然学者对直接法进行了改进,但是由于改进的策略中人为设定参数较多,因此模型的预测准确性受主观因素影响较大;

间接法计算准确性较高,但是由于参数求解过程中计算量庞大,且无法实现并行运算,而育种讲求时效性,所以难以高效指导育种实践;

因此,如何优化模型,尽可能减少人为设定参数,与机器学习方法有效结合,并融入高效可并行运算,既能保证较高准确性的同时,大大提升计算效率,是未来全基因组选择模型优化的方向。

GS的局限

  • 1)GS主要考虑加性效应,对于显性效应及互作效应等未纳入到育种值估计模型中;

  • 2)GS目前主要在品种内进行,品种间由于遗传背景不同,跨品种预测准确性难以保证;

  • 3)同品种间亲缘关系太远的个体育种值预测效果也不理想,如不同育种公司间由于育种策略不同,选择方向差异,导致同品种间遗传背景也不同,难以实现跨公司预测;

  • 4)GS只用到基因组信息,大量的多组学研究结果利用不够充分,如何将多组学信息进行整合,通过整合组学提高选择准确度也是目前待解决的问题;

  • 5)GS的分型个体数目越来越大,相比传统BLUP的稀疏矩阵,利用基因组信息计算的稠密矩阵给混合模型参数估计及模型求解带来了巨大的挑战,通过数学或着计算机手段简化计算复杂度,才能更高效利用庞大的基因组数据甚至其他各组学数据;

  • 6)个体分型主要是芯片技术,芯片分型具有良好的稳定性,但由于密度不足,使得全基因组选择对LD的依赖性强,通过测序手段可以得到较高密度SNP标记从而减少对LD的依赖,同时测序方法可以捕获不同品种间所有遗传变异,可能实现跨品种预测,并且测序能够得到更丰富的遗传信息,如CNV等,对于亲缘关系较近的群体,可以通过填充技术将芯片个体标记密度填充到测序水平。因此,测序技术的应用将成为全基因组选择新时代的转折点。

GS未来发展

尽管测序技术对GS有利,但高质量的测序结果需要更高的测序深度,意味着测序成本更昂贵,并且测序数据庞大,主流的分析软件处理速度较慢,使用复杂繁琐,对于计算资源的配置需求较高,因此如何快速、有效地储存、处理及分析数据是测序技术应用于全基因组育种的重要挑战,另外,测序只能检测参考基因组中已知的序列和基因信息,对于未知的基因序列和基因还不能进一步深入研究。

随着测序方法和芯片技术的不断成熟,未来个体分型费用将不断降低,分型准确性不断提高,GS将逐步替代传统育种方法。

Ref:http://www.xml-data.org/XMSYXB/html/2019/2/20190201.htm
http://www.lifescience.net.cn/html/201810/20181013.htm
http://blog.sciencenet.cn/blog-2577109-1201959.html
http://www.kangpusen.com/Server/1.html

你可能感兴趣的:(全基因组选择育种(GS)简介)