生信软件2 - 下游比对数据的统计工具 picard

下游比对数据的统计工具 picard

Picard是一组命令行工具,用于处理高通量排序数据和格式,如sam/ bam/ cran和vcf文件。

安装

在Linux系统目录下执行以下命令下载软件

wget https://github.com/broadinstitute/picard/releases/download/2.25.5/picard.jar

Picard 官网

http://broadinstitute.github.io/picard/

运行

软件依赖于java环境,可通过以下命令查看Java是否安装及版本

java -version

在软件下载的目录下执行以下命令运行软件,出现下方表示软件安装成功

java -jar picard.jar

生信软件2 - 下游比对数据的统计工具 picard_第1张图片

使用示例

插入片段分布统计工具CollectInsertSizeMetrics

通过检测双端序列在参考基因组上的起止位置,可以得到样品DNA打断后得到的测序片段的实际大小,即插入片段大小(Insert Size),它是信息分析时的一个重要参数。插入片段大小的分布一般符合正态分布,且只有一个单峰,Insert Size分布图可以展示各个样品的插入片段的长度分布情况。

java -jar picard.jar CollectInsertSizeMetrics \
        I=sorted.mkdup.bam \   # 比对后取出pcr重复后的bam文件
        O=insert_size_metrics.txt \   # 输出txt文件
        H=insert_size_histogram.pdf \ls   # 输出含统计图的Pdf文件
        M = 0.5

生信软件2 - 下游比对数据的统计工具 picard_第2张图片

生信软件文章推荐

生信软件1 - 测序下机文件比对结果可视化工具 visNano

你可能感兴趣的:(生信软件实战集合,java,开发语言,数据分析)