2021-06-08 vcftools提取特定vcf子集

vcftools可以去除或保留vcf文件中的样品,用到的选项为--indv 和 --remove-indv  ,指定要从vcf文件中保留或删除的样品。 可以多次使用此选项来指定多个样品。

具体用法如下:

下图为原始vcf文件。

只保留1和10号两个样品,执行以下代码:

vcftools --vcf in.vcf --recode --recode-INFO-all --stdout  --indv  1--indv  10  > out.vcf

删除1号样品,执行以下代码:

vcftools --vcf in.vcf --recode --recode-INFO-all --stdout  --remove-indv  1 > out.vcf

如果样品较多,也可将样品保存到文件 id.txt 中,每行为一个样品ID,格式如下:

1

105

然后使用下面两个选项对vcf文件保留或者删除样品。

--keep    保留样品

--remove

    删除样品

代码如下:

vcftools --vcf in.vcf --recode --recode-INFO-all --stdout  --keep id.txt   > out.vcf

你可能感兴趣的:(2021-06-08 vcftools提取特定vcf子集)