bedtools,vcftools,bcftools的功能区别

bedtools,vcftools的功能区别

在生信分析中有很多很多小软件,我们不一定要记住每个软件是怎么用的,太多了也记不住。
但是我们需要知道每个软件都有哪些功能,在我们需要的时候,我也有方向可以寻找。
今天主要介绍一下 bedtools、vcftools、和bcftools的功能。

一、bedtools

bedtools的功能主要是:

1、基因坐标的计算:

交集(intersectBed,windowBed);邻集(closest);补集(complement);差集(subtract);合并(merge,合并重叠或相接的区域);聚类(cluster,聚类重叠或相接的区域);排序(sort);random,随机产生一个区间;注释(annotate);multiinter,多个文件的交集;unionbedg,多个文件的并集

2、基因组覆盖度

coverage(给定区域的覆盖度),genomecov(整个基因组的覆盖度),multicov(多个bam文件,在给定区域的覆盖度)

3、格式转换

bamtobed;bedtobam;bamtofastq;bedpetobam;
bed12tobed6

4、fasta

getfasta,使用bed文件从基因组中提取序列
maskfasta:Use intervals to mask sequences from a FASTA file
nuc: Profile the nucleotide content of intervals in a FASTA file

5、其他

split,拆分,将一个文件等大小拆分
igv,用于生成一个脚本,批量捕获IGV截图
links,产生一个到UCSC locations的一个连接
makewindows,把给定区域划分成指定大小和间隔的小区间 (bin)

二、vcftools

vcftools的功能主要有:

1、位点过滤

1)可以根据位置 -chr -from-bp -to-bp -not-chr
2) 根据位点过滤 -snps -exclude 包括或排除文件中位点
3)变异类型过滤 保留snp或者indel的位点
4)根据flag
5)根据info
6)根据allele,maf
7)根据位点的测序深度、质量值,去除低质量位点
8)根据材料,去除低质量的材料

2、比较两个vcf文件的位点区别

-diff
–gzdiff
–diff-bcf
–diff-site
–diff-indv
–diff-site-discordance
–diff-indv-discordance
–diff-indv-map
–diff-discordance-matrix
–diff-switch-error

3 格式转化

vcf向bcf格式的转换
–recode 输出vcf格式
–recode-bcf 输出vcf格式
–recode-INFO
–recode-INFO-all 保留所有的info
–contigs
plink 输出plink格式

4 计算allele的频率

-freq 计算位点在群体中的频率
-het 位点的杂合度
–missing-site 每个位点的缺失率

5计算测序深度

总结每个位点或者每个个体的测序深度
-depth
-site-depth

6计算群体Fst

可以计算群体的Fst或者个体之间的Fst
必须提供text文件,每行一个个体(同一个population)

7 计算连锁不平衡

vcftools --vcf input_data.vcf --hap-r2 --ld-window-bp 50000 --out ld_window_50000

你可能感兴趣的:(生信)