生信软件3 - mapping比对bam文件质量评估工具 qualimap

qualimap简介

qualimap可用于统计bam文件,输出结果包含可视化图形和详细统计信息,以及每条contig的mapping信息。

软件官网及案例

http://qualimap.conesalab.org/
案例
http://qualimap.conesalab.org/doc_html/samples.html#bam-samples

安装

wget https://bitbucket.org/kokonech/qualimap/downloads/qualimap_v2.2.1.zip

# 解压
unzip qualimap_v2.2.1.zip

# 进入软件目录
cd qualimap_v2.2.1
# 查看帮助信息
./qualimap -h

软件模块

bamqc: 用于单个bam文件的QC统计
rnaseq: 用于转录组RNA-Seq样本的bam文件的QC统计
multi-bamqc: 用于多样本的bam文件分组QC统计
counts: 用于转录组数据计数的统计,用于量化表达水平
clustering: 用于表观遗传特征的聚类
comp-couts: 输入bam文件和注释文件,计算映射到每个区域reads的数量

运行

1. 执行bamqc模块命令

bamqc模块用于单个NGS样本bam文件的统计。

qualimap bamqc -bam sample.bam \  # 指定bam文件路径
					-outformat PDF:HTML \  # 输出文件格式
					-outdir out \        #输出文件目录
					-nt 12 \             # 线程数
					--java-mem-size=10G  #设置最大内存

程序运行结束后,统计信息在report.pdf文件中查看。

report.pdf中部分图表如下所示:

生信软件3 - mapping比对bam文件质量评估工具 qualimap_第1张图片生信软件3 - mapping比对bam文件质量评估工具 qualimap_第2张图片

2. 执行rnaseq模块命令

rnaseq模块用于RNA-seq数据的bam文件的统计。

qualimap rnaseq -bam sample.bam \  # 指定bam文件路径
					-outformat PDF:HTML \  # 输出文件格式
					-outdir out \        #输出文件目录
					-nt 12 \             # 线程数
					--java-mem-size=10G  #设置最大内存

3. 执行multi-bamqc模块命令

multi-bamqc模块用于多样本NGS的bam文件的统计和比较。

qualimap multi-bamqc -r \ # -r指定输入bam文件
					-d qualimap.list \     # 输入文件列表
					-outformat PDF:HTML \  # 输出文件格式
					-outdir out \        #输出文件目录
					-nt 12 \             # 线程数
					--java-mem-size=10G  #设置最大内存

其中输入文件列表qualimap.list有三列,每行一个样本,第一列样品名称,第二列 包含路径的bam文件/bamqc结果目录,第三列组名。

生信软件文章推荐

生信软件1 - 测序下机文件比对结果可视化工具 visNano

生信软件2 - 下游比对数据的统计工具 picard

你可能感兴趣的:(生信软件实战集合,数据挖掘,python,pandas,numpy)