全面解读|“小”产品,“大”能量的 BSA 性状定位

BSA(bulked segregant analysis)分离体分组混合分析法,根据目标性状的表型对分离群体中的个体进行分组混合,将群体中的个体或株系依据目标性状的相对差异分成两组,然后将两组的个体或株系 DNA 分别混合,形成相对的 DNA 混合池。对亲本和子代混池进行建库测序,检测 SNP,根据亲本间纯和差异的位点,计算子代池的 index 值,进而挑选差异较大的位点。

图1 BSA 原理图

群体的选择

根据群体的形成过程,通常将群体类型分为自然群体和家系群体。根据群体的性状个数,分为单个性状和多个性状。BSA 性状定位适用于对家系群体的单个性状进行主效定位。

亲本来源很重要,对于目标性状亲本有多种方法获得,例如EMS诱变,自然个体,紫外线诱变,T-DNA 插入等,对于以上类型,BSA 都有对应的解决方案。

家系群体的构建方法有很多种,其中 F2、BC、RIL 为常见的可做 BSA 的群体,常规 F1代由于无性状分离,不可用于 BSA 性状定位,DH 也可用于 BSA 性状定位,但由于构建困难,不常见。

图2 群体构建图

BSA 的分析方法

1. 传统 BSA

针对目标性状,选择表型极端差异的亲本构建出分离群体(或家系群体),再从分离群体中选取目标性状表型极端的一定数量的单株,混合构建两个 DNA“池”(DNA pools)。对两个样本池进行全基因组重测序,检测到的两池间 DNA 差异片段即为候选区域,可进一步定位到目标性状相关的基因或标记。

2. QTL-seq

适用于自然变异下的材料,定位主效 QTL 位点。选择目标性状存在极端表型差异的亲本进行杂交,构建子代分离群体,一般选择构建F2或 RIL 群体。若定位数量性状,那么子代分离群体的性状一般会呈正态分布。比如性状为株高,从子代分离群体中选取一定数量高株个体和一定数量矮株个体分别构成一个混池,然后对亲本及两个混池进行测序,SNP-index 分析后实现性状定位。

图3 QTL-seq 方法示意图

3. MutMap

适用于点突变产生的突变体且突变性状为质量性状的材料,MutMap 比较适合对 EMS 诱变的隐性突变基因进行分析。EMS 诱变和自交得到纯合体后,将突变体和其亲本回交得到F1,F1自交后得到F2代会出现表型的分离,最后得到的群体为野生型(WT)表型群体与突变体表型群体。分别对这两个群体的 DNA 进行等量混池,即野生型 DNA 混池和突变体 DNA 混池。DNA 测序后利用 MutMap pepline 对数据进行分析,计算 SNP 不同基因型在突变体混池和野生型混池出现的频率,根据频率差异即可得到和突变表型连锁的染色体区段和可能的突变位点。

图4 MutMap 方法示意图

4. MutMap+

适用于隐性致死突变、不育或者人工杂交困难的物种。MutMap+ 的原理如图5所示,将野生型诱变得到的突变型(M1)自交得到M2,诱变产生的突变型一般为杂合,所以在 M1 中通常不会表现出突变表型。将 M2 种植后观察表型,利用卡方检验统计野生型和突变型是否符合3:1的分离比,若符合则判定该突变表型为隐性遗传。将 M2 野生型自交得到 M3,选择 M3 野生型和突变型分离比为3:1的子代池,两种表型分别选取至少20株混池测序(深度≥10×),测序结果比对参考基因组,计算 SNP-index(和野生型不同的 reads 占总 reads 的比例)。与 MutMap 不一样的是,在 MutMap+ 中的两个混池中出现很多不是导致突变性状的 SNP 位点的 index 等于1(图5D),因为在 M2 中随机固定下来的突变 SNP,并且这些位点在两个池中同时存在,所以 ΔSNP-index=SNP-index(突变池)−SNP-index(野生池),得到的结果消除了随机“干扰”,最后显著大于零的 ΔSNP-index 的位点作为候选位点(图5E)。

图5 MutMap+ 方法示意图

5. MutMap-Gap

适用于研究品系中特有的但在该物种参考基因中缺失的突变位点,或感兴趣的位点是 T-DNA 外源插入位点的定位。MutMap-Gap 和 MutMap 基本一致,不同的是增加了denovo 组装的过程。如图所示,按照 MutMap 的流程分析后发现候选区域不存在导致基因功能改变的 SNP,考虑该区域可能存在 SV(结构变异),且导致突变表型的 SNP 位点存在于 SV 中。因此对亲本 unmapped 的 reads 以及这段候选区域 mapping 上的 reads 进行收集,加上 mate-pair reads 组装后和之前的参考序列一起重新 mapping 并计算 SNP-index。

图6 MutMap-Gap 方法示意图

6. GPS-BSA

GradedPool-Seq 是一种改良的 BSA,目的是快速定位复杂性状 QTL,其分析过程主要包括三步:变异检测、标记筛选和统计分析。根据材料方法,假定每个 SNP 的测序深度是100,如果 SNP 与表型不关联,那该位点会表现出50%参考序列(ref),50%为变异序列(var),反之如果该位点与表型关联,则在梯度1(Grade1)和梯度3(Grade3)混池中该位点的 ref 和 var 之间表现出巨大的差异(如图7b)。

图7 GradedPool-Seq方法示意图  

7. PCAMP

PCAMP 是一种 QTL-seq 的优化方法,混池个数由2个扩展到N个(N≥3),分析方法由单组混池测序成对比较分析扩展到多组混池测序成对比较分析(Pair-wise Comparison Analysis for Multiple Pool-seq,PCAMP)。

图8 PCAMP 定位花青素合成相关基因

方案策略

1. 两个亲本+两个子代池:常见样本类型,所有 BSA 分析方法均适用。亲本间选择纯和差异的位点,然后计算这些位点在两个子代池中的 index 值,还可以采用 ED(欧式距离)关联 SNP 位点,计算差值后挑选候选区间以及候选位点。

2. 一个亲本+两个子代:选择亲本纯和的位点,计算2个子代池的 index,计算差值,划窗口,挑选候选区间,挑选候选位点。(适用于 QTL-seq / MutMap / MutMap+ / MutMap-Gap)

3. 两个亲本+一个子代:亲本间选择纯和差异的位点,然后计算这些位点在子代池的index,挑选候选位点。(适用于 QTL-seq / MutMap / MutMap+ / MutMap-Gap)

4. 一个亲本+一个子代池(性状相反):选择亲本纯和的位点,然后以亲本为参考,计算这些位点在子代池的 index,挑选候选位点。若为 EMS 诱变的样本,可选择一个野生型亲本+突变体混池。

5. 两个子代池:通过 ED 算法进行性状关联,可以对性状进行定位,但是由于缺少亲本信息,对于 QTL 的检测效率较低。(适用于 QTL-seq / MutMap / MutMap+ / MutMap-Gap)

6. 多个子代池:对于多基因控制的性状,或是提高定位精准度,可采用多子代混池,适用于 GPS-BSA 以及 PCAMP 两种分析方法。

以上就是对 BSA 性状定位分析方法的总结,当不知道自己的材料是否适合做 BSA 或者如何混池选样,本篇推文应该可以帮到你~记得点击收藏哦~

你可能感兴趣的:(全面解读|“小”产品,“大”能量的 BSA 性状定位)