Fine mapping定位QTL

       作物遗传育种需要发掘对农艺性状有重要贡献的QTL。某一重要农艺性状往往是由多个QTL调控。对这些QTL进行精细定位找出对应的基因对作物的改良具有重要意义。本文对如何进行精细定位进行详细的介绍,希望能抛砖引玉,引出宝贵意见。

       对某一QTL进行精细定位的前提是能将这一QTL先粗定位到一条染色体的某一特定区域。而对QTL进行初定位主要有两种方法:GWAS和BSA-Seq。

       GWAS(Genome Wide Assosiated Study )即全基因组关联分析。是利用自然群体或杂交群体在全基因组范围内分析哪些区域与目标性状之间存在相关性的一种方法。如果利用自然群体进行GWAS分析,发现某一QTL与目标性状存在显著相关性,那么这一QTL在整个自然群体中的存在频率是相对较高的。而如果仅仅用杂交群体后代进行GWAS分析,则所得到的与目标性状呈显著相关的QTL只是代表在杂交双亲中对这一相对性状具有贡献,但是在自然群体中则不一定能够检测出来。通过GWAS分析,我们能够将目标QTL定位于特定的染色体的特定区间内。这相比较于一开始在全基因组范围内设计maker利用交换单株去确定QTL在某一条染色体,能节省大量人力物力。图1的GWAS分析结果表明调控目标性状的QTL位于3号染色体上。且通过对染色体的进一步分析,可以得知QTL所在3号染色体的具体区间。通过GWAS分析确认QTL位于三号染色体的某一具体区间后,可以在这一区间设计maker对其进行fine- mapping,最终找到目标基因。

图1.GWAS 曼哈顿图

        BSA(Bulked Segregant Analysis)是利用极端性状进行功能基因挖掘的一种方法。 主要思想是将杂交后代中两个具有极端性状的群体进行混池测序,比较两个群体在多态位点(SNP)的Allele Frequency(AF)是否具有显著差异。

       BSA有一个前提假设:与目标基因邻近的marker会表现出连锁不平衡现象。例如与目标基因邻近的marker在后代群体中不会表现出自由组合的情况,而随着与目标基因的距离越远,则重组事件就越多,最终与目标基因不连锁的marker会在两个bulk DNA pool中没有差异。早期BSA受限于marker少等因素而无法在全基因组上鉴定与目标性状连锁的QTL或基因。随着测序技术的发展及价格的下降,我们能在全基因组范围内筛选高密度marker,从而能在全基因组范围内将与目标性状连锁的QTL/基因找到。

影响BSA结果的有效性主要有5个因素:

群体大小:群体越大,所包含的两种极端群体数目就越多,表型差异就越大,群体足够大甚至能精细定位一个基因

选择率:两个极端群体所选择的个体占总群体的比例越小越好,最好能控制在5%以下

极端个体数目:两个极端群体的极端个体数目越多,由于表型鉴定错误导致的假阳性率就会越低

标记密度:标记密度越高,假阳性率就越低

表型准确性:表型鉴定准确是确保BSA成功的关键。只有确保极端群体的表型准确才能确保BSA成功

图2.BSA测序原理(Takagi et al., 2013)

        由于GWAS和BSA的定位在精确度上存在一定缺陷,只能将QTL定位于特定染色体的某一较大区间。往往难以究竟是哪个基因调控目标性状。因此需要在粗定位的基础上进行精细定位。

        在减数第二次分裂过程中,同源染色体的非姐妹染色单体之间会发生染色体联会与交叉互换,在这一过程中,染色体发生断裂重组,会形成多种形式的配子。之后各种配子之间发生自由组合,最后能够形成不同组合的合子体。这些合子体最后发育成个体,这些个体之间的染色体组合就存在很大的差异。如一半染色体没有发生交换,另外一半染色体在一个或者多个位点发生了交换。在fine-mapping的过程中,我们就是需要挑选这些在目标区间一半染色体没有发生染色体交叉互换,而另外一半发生交换的交换单株。

       对于数量性状,由于控制这一相对性状的QTL众多,首先需要确定哪一个或哪几个QTL的表型的贡献度(PVE,phenotype variation explained by QTL)最大,即这一相对性状是受哪一个或哪几个QTL调控的。当确定某一QTL在染色体所处的大致位置被知晓后,我们能够在这一位置左右两端设计一些SNP或者Indel marker。通过对某一F2代的全部子代(即F3代)进行表型统计,我们能够判断F3代是否发生性状分离。由遗传定律可知,当合子的基因型是杂合时,杂合基因型控制的表型会随着基因型的分离而分离,而当合子的基因型是纯合时,由于纯合基因型在自由组合时不会进行分离,那么纯合基因型控制的表型在后代也不会发生性状分离。因此通过统计F3代是否发生性状分离可以反推F2代在QTL存在的区域是纯合还是杂合状态。如下图所示,F2-1与F2-2的后代没有发生性状分离,这表明QTL所在的区域是纯合基因型,因此QTL在Indel marker 3的右侧,而F2-3的后代发生了性状分离,表明在F2-3中,QTL的基因型是杂合的,故QTL是在Indel marker 2的右侧。通过以上的方法,利用合适的交换单株,目标QTL最终能够被锁定在很小的区间,有时甚至能将QTL锁定在只含有一个注释基因的区域内,从而实现QTL的精细定位。对于数量性状,如果用F2:3群体进行fine mapping, 我们需要知道每一个F3群体中每个个体的基因型,根据F3子代个体的基因型与对应表型是否分离判断对应target QTL是位于杂合区还是纯合区。而对于一个由未知QTL控制的质量性状,我们只需要鉴定F3子代的表型,无需知道每个F3个体的基因型就能确定其对应的F2代个体QTL所在区域的基因型。

你可能感兴趣的:(Fine mapping定位QTL)