fst

计算Fst,Pi,Tajimi'D based on SNP vcf file

(2015-06-24 16:04:29)
标签:

bioinformatics

分类:bioinformatics

Fst:

 

Fst(Fixation index)通常用来衡量population之间的geneticdistance。1说明两个population是完全独立的。0说明两个population之间自由interbreeding。Fst值越大,说明geneticdistance越远。值越低,说明大多数的genetic variation是发生在同一个population的。

fst_第1张图片

 

Tajimi'D:

 

Tajimi's D是一种统计检验。它主要用来区分一个DNAsequence是random还是non-randon进化的,是不是directionalselection。T=0说明没有进行选择,T>0说明sudden populationcontraction,而<0则说明population expansion after a recentbottleneck。

 

Pi主要用来衡量每个site的nucleotide divergency。

 

这几个参数同样可以通过vcftools来计算:

 

vcftools:

vcftools --vcf test.vcf  --window-pi3000  --out Tenera

vcftools --vcf test.vcf  --TajimaD3000  --out Tenera

vcftools --vcf test.vcf --weir-fst-pop A2.txt --weir-fst-popA134567.txt --fst-window-size 3000 --outA2.all.Fst 

 

fst_第2张图片

通过一些参数的设置,我们可以删选出positive selection的区域,从而进行关联分析,找到可能起作用的gene。

你可能感兴趣的:(fst)