下载gatk相关数据

ftp路径:ftp://ftp.broadinstitute.org/bundle/
用户名:gsapubftp-anonymous
密码:为空

目录清单如下图:


image.png

在教程1:http://www.360doc.com/content/22/0609/14/79853805_1035305810.shtml

在使用 gatk FilterVariantTranches 命令过滤时使用的dbsnp_138.hg19.vcf.gz 和1000G_phase1.indels.hg19.sites.vcf.gz都在这里的hg19里面。


image.png

这里的hg18/hg19/hg38,大家可自行查询相关版本信息。

    gatk FilterVariantTranches -V  $vcf_annot \
          --resource dbsnp_138.hg19.vcf.gz \
          --resource 1000G_phase1.indels.hg19.sites.vcf.gz \
          --info-key CNN_1D  \
          --snp-tranche 99.9   --snp-tranche 99.0  --snp-tranche 95.0  \
          --indel-tranche 99.9   --indel-tranche 99.0  --indel-tranche 95.0  \
          -O filtered.vcf

在Linux环境下断点续传下载目录:
nohup wget -c -r ftp://[email protected]/bundle/
如果只下载hg19,那么就调整为
nohup wget -c -r ftp://[email protected]/bundle/hg19

你可能感兴趣的:(下载gatk相关数据)