SV变异检测软件(1)-breakdancer的安装及简单使用

小的Indel(Insertion 和 Deletion),指的是在基因组的某个位置上所发生的小片段序列的插入或者删除,其长度通常在50bp以下;
大的结构性变异,这种类型比较多,包括长度在50bp以上的长片段序列的插入或者删除、染色体倒位,染色体内部或染色体之间的序列易位,拷贝数变异,以及一些形式更为复杂的变异。

为了和SNP变异作区分,上述这两类变异通常也被称为基因组结构性变异(Structural variation,简称SV)。这里值得一提的是,研究人员对基因组的结构性变异发生兴趣,主要是由于这几年的研究发现:(1)虽然还未被广泛公认,但研究人员发现SV对基因组的影响比起SNP来说还要大;(2)基因组上的SV比起SNP而言,似乎更能用于解释人类群体多样性的特征;(3)稀有且相同的一些结构性变异往往和疾病(包括一些癌症)的发生相关联甚至还是其致病的诱因。

目前常用于检测SV变异的软件有很多,这里介绍下breakdancerCREST的安装和简单使用。
首先介绍下breakdancer。
这里先贴出软件GitHub的地址:https://github.com/genome/breakdancer
关于软件的说明可在GitHub上自行阅读。
sourceforge的下载地址:https://sourceforge.net/projects/breakdancer/files/
通过git clone命令或者wget命令都可以下载breakdancer的安装包,这里比较简单,略过不讲。

breakdancer的安装过程比较容易各种报错
首先先安装libgd库,具体可参考这里

然后安装以下的perl模块,安装方式同上:GD、GDGraph、GDGraph-histogram、GDTextUtil、Math-CDF、Statistics-Descriptive;也可自行通过cpanm方式自动安装

然后安装samtools,版本在0.1.7以下

最后一步才是安装breakdancer:

    cd breakdancer
    make && make install

安装成功后生成breakdancer-max的执行文件
以上各个安装过程若无root权限,请自行修改./config文件的安装路径

安装成功后进入perl文件夹下找到bam2cfg.pl文件

    perl bam2cfg.pl 

安装成功就可以看到该文件的使用说明,若失败根据提示安装对应的perl模块即可。

breakdancer检测SV变异的使用方法如下:

    perl bam2cfg.pl -v (float)sample.bam > sample.cfg

生成配置文件,配置文件如下所示:

    readgroup:sample
    platform:illumina
    map:sample.bam
    readlen:
    lib:
    num:
    lower:
    upper:
    mean:
    std:
    SWnormality:
    exe:samtools view

接着使用breakdancer-max鉴定结构变异:

    breakdancer_max  sample.cfg > sample.out

以上各步骤中请自行将安装路径加入环境变量中。breakdancer的检测量很大,检测时间会很久,建议加上nohup &命令放入后台运行。后面再进行CREST的介绍。

你可能感兴趣的:(SV变异检测软件(1)-breakdancer的安装及简单使用)