大家好,今天给大家分享一种群体遗传学中的一种选择性方法,即群体间遗传分化指数(Fst),也叫固定指数。Fst取值范围[0,1],Fst=0时,表明不同群体遗传结构完全一致,群体间没有分化,Fst=1时,表明等位基因在不同的群体中被固定,完全分化。Wright提出,在实际研究中,如果Fst取值为0~0.05群体间遗传分化很小,可忽略不计;Fst取值为0.05~0.15,群体间存在中等程度的遗传分化;Fst取值为0.15~0.25,群体间遗传分化较大;Fst取值为>0.25时,群体间有很大的遗传分化。
今天我们就来学习一下如何利用群体基因型数据,利用vcftools软件进行Fst分析。
1、 安装软件:
下载,执行以下命令即可
git clone https://github.com/vcftools/vcftools.git
cd vcftools
./autogen.sh
./configure --prefix=$PWD
make
make install
这样即安装好了。
2.Fst分析:
首先我们需要准备的文件有群体基因型文件(vcf格式),2个群体ID信息
2.1、 bim/fam/bed文件格式转化为vcf文件格式。
plink --bfile PopA_PopB_Chr1_7.snp.genotype.gen --recode vcf-iid --out PopA_PopB_Chr1_7.snp.genotype.gen
首先看一下文件格式:
2.1.1 群体基因型文件,该文件中包含群体基因组水平的遗传变异信息
2.1.2 群体A和群体B文件格式
2.2、Fst分析分为单个位点分析和滑窗分析,一般情况采用滑窗分析,今天我们两种方法都尝试一下
2.2.1 单个位点计算Fst
vcftools --vcf PopA_PopB_Chr1_7.snp.genotype.gen.vcf --weir-fst-pop PopA.txt --weir-fst-pop PopB.txt --out PopA_PopB_single_locus
结果说明:
第一列:染色体
第二列:SNP位置
第三列:单个位点Fst
2.2.2 滑窗分析Fst,我们选择窗口大小为100kb,滑动窗口大小为10kb
vcftools --vcf PopA_PopB_Chr1_7.snp.genotype.gen.vcf --weir-fst-pop PopA.txt --weir-fst-pop PopB.txt --fst-window-size 100000 --fst-window-step 10000 --out PopA_PopB_100_10_locus
结果说明:
第一列:染色体
第二列:窗口起始位置
第三列:窗口终点位置
第六列:窗口中所有位点平均Fst
vcftools参数说明:
--vcf:输入的群体基因型文件
--weir-fst-pop:输入的群体ID文件,必须为txt文本格式,每个ID为一行
--fst-window-size:滑窗分析中窗口大小,上述例子中窗口选择为100kb
--fst-window-step:滑动窗口大小,上述例子中滑动窗口选择为10kb
3. Fst结果可视化
可参考小编之前GWAS分析中GWAS分析-曼哈顿图 (二)
(https://www.jianshu.com/p/fa261b6045c2),只需要将上述结果文件调整成所需要格式即可,直接上图看效果。
3.1 单个位点Fst可视化
3.2 滑动窗口Fst可视化
今天分享就到这了。