vcftools 是处理VCF文件的工具,服务于1000G计划,用于VCF的统计、变异位点的过滤等,功能强大。废话少说,直接上命令。
# filter chr1:1000-2000 > new.vcf;
vcftools --gzvcf input_data.vcf.gz --chr 1 --from-bp 1000 --to-bp 2000 --recode --recode-INFO-all --out out_prefix #如果没有--recode 则不输出; 文件为out_prefix.recode.vcf
# filter in specific region
vcftools --gzvcf input_data.vcf.gz --bed
# filter chr1:1000-2000, 输出人群频率,不是个体的VAF
vcftools --gzvcf input_data.vcf.gz --freq --chr 1 --from-bp 1000 --to-bp 2000 --out
# filter specific snp
vcftools --gzvcf input_data.vcf.gz --snps
vcftools --gzvcf input_data.vcf.gz --snp rs001 --snp rs002 --out
# filter allele freq
vcftools --gzvcf input_data.vcf.gz --min-alleles
# output alleles statitstics
--freq # out_prefix.frq;
--counts # out_prefix.frq.count
--depth # out_prefix.idepth, mean depth per individual
--site-depth # out_prefix.ldepth, the sum of depth across all individuals per site
--site-mean-depth # out_prefix.ldepth.mean, the mean of depth accross all individuals per site
--geno-depth # extract the DP
# transition, transversion statistics
--TsTv # out_prefix.TsTv
--TsTv-summary # out_prefix.TsTv.summary
# extract from INFO of vcf
vcftools --vcf input_data.vcf --get-INFO NS --get-INFO DB
# output vcf
vcftools --vcf input_data.vcf --recode-INFO DB
# min-meanDP : overall individual ; min-DP: per specific individual;
vcftools --vcf input_data.vcf --min-meanDP <10> --minQ <> --minGQ <> --minDP <>
# compare of vcf
vcftools --vcf input_data_1.vcf --diff input_data_2.vcf # out_prefix.