Annovar(1) 注释也能输出vcf格式(--vcfinput)

一直知道用table_annovar.pl的输入文件可以是vcf format也可以是avinput format,今天才发现输出文件也可以是vcf format:

perl table_annovar.pl DPM09234_L8.somatic.vcf humandb/ -buildver hg19 \
-out DPM09234_L8 \
-remove -protocol refGene,cytoBand,dbnsfp30a -operation g,r,f \
-nastring .  -vcfinput --otherinfo

1)不仅仅输出vcf format格式的注释,也同时输出 \t分割的txt文件:
DPM09234_L8.hg19_multianno.txt
DPM09234_L8.hg19_multianno.vcf

2)除了最后两个注释文件,还会生成一个avinput format 文件,因为加上了--otherinfo参数,还会将所有的信息都保留在第六列之后;

3)txt格式注释结果文件中,在最后一栏otherinfo中放进vcf format中每个样本的信息;

perl convert2annovar.pl   --allsample -format vcf4 DPM09234_L8.somatic.vcf \  
-outfile H --includeinfo

--includeinfo: specify that the output should contain additional information in the input line. By default, only the chr, start, end, reference allele, observed allele and homozygosity status are included in output files.

加上--includeinfo这个参数输出的avinput会将vcf所有的信息输出在第六列之后以\t分割:
1 11182261 11182261 - T 1 11182261 . G GT . artifact_in_normal;str_contraction DP=397;ECNT=1;NLOD=8.30;N_ART_LOD=2.82;POP_AF=1.000e-05;P_CONTAM=0.00;P_GERMLINE=-5.202e+01;RPA=10,11;RU=T;STR;TLOD=16.82 …………………………

perl convert2annovar.pl   --allsample -withfreq -format vcf4 DPM09234_L8.somatic.vcf -outfile F

--withfreq :include frequency information in the output (for VCF format with multiple samples)
加上--withfreq参数,就算vcf文件包含多个样本,输出的文件也只有一个,输出的文件名也不会自动加后缀,比如上面--outfile后面我写的F,那么输出文件名就是“F”。

你可能感兴趣的:(Annovar(1) 注释也能输出vcf格式(--vcfinput))