群体遗传学-选择清除分析基本概念及参数

一、中性学说

分子水平上,生物的演化或物种的进化并不是自然选择引起的,而是由中性/近中性的突变等位基因经过遗传漂变引起的,从而形成分子水平上的进化性变化或种内变异。
分子演化的驱动力:遗传漂变
1、突变大多是中性的,对生物个体的生存既无害处也无益处
2、中性突变经过随机的“遗传漂变”固定,在分子水平上进化不依赖于自然选择
3、中性突变决定进化的速率,对于所有生物几乎是恒定的

二、正选择vs负选择

正选择(positive selection):自然选择“选留”一些稀少的等位基因,拥有这些等位基因的个体能繁殖更多的后代;这样的突变基因往往具有与原来基因不同的功能,而且该功能使得拥有它的生物更能适应环境。
负选择(negative selection):指群体中出现有害突变等位基因时,携带该等位基因的个体会因为生存力或育性降低而从群体中淘汰,也叫净化选择。
选择清除vs背景选择
选择清除:在有利突变产生后被正选择固定的过程中,与之连锁的中性位点的变异也被固定。
背景选择:负选择在清除有害突变时,也会随之清除与其连锁的中性位点的变异。
选择清除和背景选择都会导致基因组上受选择的区域遗传多样性下降,两者很难区分,但背景选择在群体中不会导致高频等位基因突变出现。

三、 群体分析

群体分析一般可以分为,分层分析和选择分析。分层分析可以定义为,基于群体内个体之间基因序列上的差异。群体选择分析是在群体水平在基因组不同区域遗传多样性的差异。

1. 分层分析:

  • 系统发育研究:一般使用发育树研究具有共同祖先之间进化关系,探究物种进化的关系和分类的关系。
  • PCA(主成分分析):用较少不相关的变量替代原始大量相关的变量,来研究群体分层,亚种之前的进化关系。
  • 群体结构分析:研究大群体中存在基因频率不同的亚群,一般可以用来推断祖先群,个体血缘组成,还有杂交事件。

2. 选择分析

选择清除分析:自然选择促使有利突变在群体中保留下来,与之连锁的中性位点突变频率提升,非连锁的中性位点突变频率下降;简单的说就是基因组某区域由于受到了选择而消除多态性,即遗传多样性降低,在群体中出现高频的等位基因和低频的等位基因。主要用于:挖掘驯化过程中受选择的基因和挖掘物种适应性进化过程中受选择的基因。

适合度分析是指:生物体或生物群体对环境适应的量化特征,是分析估计生物所具有的各种特征的适应性,以及在进化过程中继续往后代传递的能力的指标。适合度是衡量一个个体存活和繁殖成功机会的尺度。适合度越大,个体成活的机会和繁殖成功的机会也越大,反之则相反(因此义项与广义适合度相对应,故亦可称之为狭义适合度)。

计算方式:适合度可以用数据计算出来:W=ml。其中,W代表适合度,m表示基因型个体生育力,l表示基因型个体存活率。

四、群体多态性度量

1、群体多态性参数:
θ = 4Neμg
Ne:有效群体大小
μ:每年每位点核苷酸突变速率(中性突变率)
g:时间(个体从出生到繁育下一代的时间,比如人25年)
θ 是群体多态性度量的理论值,在实际分析中,有两个参数近似估计θ,分别是θπ和θw。
中性检验:
如果某个位点是中性突变的话,则θπ=θw;
Tajima’D = (θπ–θW)/Var(θπ–θW)
2、核苷酸多态性θπ
θπ:群体中任意两条不同序列(个体)的碱基差异数(SNP)取平均值。

群体遗传学-选择清除分析基本概念及参数_第1张图片
(1)受过人工选择的群体,遗传多样性相对单一,π值较小
(2)野生群体遗传多样性较大,π值较大
(3)单个群体内部基因型多样性(0-1),多样性越大,π值越大

群体遗传学-选择清除分析基本概念及参数_第2张图片
图中,横轴表示基因组的位置,纵坐标表示π值,图中的曲线表示3个群体的多态性水平。多态性越低,受选择程度越高。

3、Watterson估值(θW)
θW:基于全部序列内分离位点个数
ind1:ATCCGCCGAT
ind2:ATCCACGCTT
ind3:CGTGATGCTT
ind4:CGTGGTCGAA
D12 = 4;D13 = 9;D14 = 6;D23 = 5;D24 = 10;D34 = 5
θπ = (D12+D13+D14+D23+D24+D34)/(3*4/2) = 6.5
θW = K/a = 10/(1+1/2+1/3+1/4+1/5+1/6+1/7+1/8+1/9)= 3.53
k : 分离位点数,即总的SNP数
a = 1+1/2+1/3+ … +1/(k–1)

4、中性检验(Tajima’s D)
群体遗传学-选择清除分析基本概念及参数_第3张图片

Tajima’D = (θπ–θW)/Var(θπ–θW)
θπ = θw Tajima’s D = 0,中性进化;
θπ < θw Tajima’s D < 0:群体中存在许多低频率的等位基因(稀有等位基因),则θW增大而θπ不受影响(或影响较小),由定向选择或群体扩张引起;
θπ > θw Tajima’s D > 0:群体中高等/中等频率的等位基因较多, θπ增大而θW 不受影响,由于平衡选择和瓶颈效应引起的。
平衡选择与定向选择都属于正选择的范畴,因此,只要D值显著背离0,就可能是自然选择的结果;而当D值不显著背离0时,则中性突变。

5、亚群间差异检验Fst
Fst:F-statistics(Fixation indices)群体间遗传分化指数,是种群分化和遗传距离的一种衡量方法,分化指数越大,差异越大。

在这里插入图片描述
π Between :来自群体间的所有两两个体间差异的均值
π within :来自亚群内所有两两个体间差异的均值

6、 选择清除vs背景选择

选择清除:在有利突变产生后被正选择固定的过程中,与之连锁的中性位点的变异也被固定。
背景选择:负选择在清除有害突变时,也会随之清除与其连锁的中性位点的变异。

选择清除和背景选择都会导致基因组上受选择的区域遗传多样性下降,两者很难区分,但背景选择在群体中不会导致高频等位基因突变出现。

连锁不平衡(Linkage disequilibrium, LD):指群体内不同位点等位基因间的非随机性组合的关系,即当位于同一条染色体的两个等位基因(A,B)同时存在的概率,大于群体中因随机分布而同时出现的概率时,就称这两个点处于LD状态。通常用D’和r2值表示。一般来说,在连锁不平衡分析中, 野生种的 LD 值较低,而驯化种由于受到了正选择的作用,LD 值就会偏大。

群体遗传学-选择清除分析基本概念及参数_第4张图片

瓶颈效应:由于环境骤变(如火灾、地震、洪水等)或人类活动(如人工选择、驯化),使得某一生物种群的规模迅速减少,仅有一少部分个体能够顺利通过瓶颈事件,在之后的恢复期内产生大量后代。
群体遗传学-选择清除分析基本概念及参数_第5张图片

迁移压力(又叫基因流):由于某种原因,具有某一基因频率的群体的一部分移入基因频率与其不同的另一群体,并杂交定居,就会引起迁入群体的基因频率发生改变。
群体遗传学-选择清除分析基本概念及参数_第6张图片

参考:
https://www.jianshu.com/p/82719840ec4a
https://www.jianshu.com/p/807e54278539
https://www.jianshu.com/p/c489da8e75ff

你可能感兴趣的:(算法,线性代数,数据挖掘)