遗传多样性参数计算

1 使用vcftool计算pi值

输入文件:SNP_qc0818.vcf,未LD过滤,若文件较大则过滤更好
工作路径:/home2/yl/abi/Gorilla/fq_data/2021/PI/
每个物种目录整理为一个文件夹

bcftools query -l SNP_qc0818.vcf | grep "zy" > zy.txt
bcftools query -l SNP_qc0818.vcf | grep "fabri" > fabri.txt
sed 's/^##fileformat=VCFv4.3/##fileformat=VCFv4.2/' SNP_qc0818.vcf > SNP_qc0818_v4.2.vcf #报错Error: VCF version must be v4.0, v4.1 or v4.2:的解决办法

使用vcftools滑窗分析pi值

vcftools --vcf SNP_qc0818.vcf --keep zy.txt --window-pi 300 --window-pi-step 50 --out zy35
 >Error: VCF version must be v4.0, v4.1 or v4.2:#应该是gatk输出vcf格式和vcftools输入格式不一致
sed 's/^##fileformat=VCFv4.3/##fileformat=VCFv4.2/' in.vcf > out.vcf #解决办法

使用vcftools计算所有site得pi值

vcftools --vcf SNP_qc0818.vcf --keep zy.txt --site-pi --out zy

2 使用plink计算杂合度

将vcf转换为plink输入格式ped,map
plink各种格式转换及简单命令

 plink --vcf LD0818.vcf  --recode --out LD0818 --double-id --allow-extra-chr

计算样本的杂合度

 plink --vcf SNP_qc0818.vcf --recode --out snp-qc0818 --double-id --allow-extra-chr

** 输出minor allele frequency (MAF)**
plink --bfile [prefix] --freq --out outfile

你可能感兴趣的:(遗传多样性参数计算)