选择性分析之遗传分化指数Fst(一)

大家好,今天给大家分享一种群体遗传学中的一种选择性方法,即群体间遗传分化指数(Fst),也叫固定指数。Fst取值范围[0,1],Fst=0时,表明不同群体遗传结构完全一致,群体间没有分化,Fst=1时,表明等位基因在不同的群体中被固定,完全分化。Wright提出,在实际研究中,如果Fst取值为0~0.05群体间遗传分化很小,可忽略不计;Fst取值为0.05~0.15,群体间存在中等程度的遗传分化;Fst取值为0.15~0.25,群体间遗传分化较大;Fst取值为>0.25时,群体间有很大的遗传分化。

今天我们就来学习一下如何利用群体基因型数据,利用vcftools软件进行Fst分析。

1、 安装软件:

下载,执行以下命令即可

git clone https://github.com/vcftools/vcftools.git
cd vcftools
./autogen.sh
./configure --prefix=$PWD
make
make install

这样即安装好了。

2.Fst分析:

首先我们需要准备的文件有群体基因型文件(vcf格式),2个群体ID信息
2.1、 bim/fam/bed文件格式转化为vcf文件格式。

plink --bfile PopA_PopB_Chr1_7.snp.genotype.gen --recode vcf-iid --out PopA_PopB_Chr1_7.snp.genotype.gen

首先看一下文件格式:
2.1.1 群体基因型文件,该文件中包含群体基因组水平的遗传变异信息


基因型文件.jpg

2.1.2 群体A和群体B文件格式


群体ID.jpg

2.2、Fst分析分为单个位点分析和滑窗分析,一般情况采用滑窗分析,今天我们两种方法都尝试一下
2.2.1 单个位点计算Fst

vcftools --vcf PopA_PopB_Chr1_7.snp.genotype.gen.vcf --weir-fst-pop PopA.txt --weir-fst-pop PopB.txt --out PopA_PopB_single_locus
单位点Fst.jpg

结果说明:
第一列:染色体
第二列:SNP位置
第三列:单个位点Fst

2.2.2 滑窗分析Fst,我们选择窗口大小为100kb,滑动窗口大小为10kb

vcftools --vcf PopA_PopB_Chr1_7.snp.genotype.gen.vcf --weir-fst-pop PopA.txt --weir-fst-pop PopB.txt --fst-window-size 100000 --fst-window-step 10000 --out PopA_PopB_100_10_locus
滑窗分析Fst.jpg

结果说明:

第一列:染色体

第二列:窗口起始位置

第三列:窗口终点位置

第六列:窗口中所有位点平均Fst

vcftools参数说明:

--vcf:输入的群体基因型文件

--weir-fst-pop:输入的群体ID文件,必须为txt文本格式,每个ID为一行

--fst-window-size:滑窗分析中窗口大小,上述例子中窗口选择为100kb

--fst-window-step:滑动窗口大小,上述例子中滑动窗口选择为10kb

3. Fst结果可视化

可参考小编之前GWAS分析中GWAS分析-曼哈顿图 (二)

(https://www.jianshu.com/p/fa261b6045c2),只需要将上述结果文件调整成所需要格式即可,直接上图看效果。

3.1 单个位点Fst可视化


PopA_PopB_single_locus.weir.fst.jpg

3.2 滑动窗口Fst可视化


PopA_PopB_100_10_locus.windowed.weir.fst.jpg

今天分享就到这了。

你可能感兴趣的:(选择性分析之遗传分化指数Fst(一))