转录组笔记(5)序列比对

HISAT2:比对到基因组

TopHat首次被发表已经是7年前,STAR的比对速度是TopHat的50倍,HISAT更是STAR的1.2倍。HISAT2是TopHat2/Bowti2的继任者,使用改进的BWT算法,实现了更快的速度和更少的资源占用,作者推荐TopHat2/Bowti2和HISAT的用户转换到HISAT2。
官网:https://ccb.jhu.edu/software/hisat2/index.shtml(学习一个软件最好的方法就是结合现有中文资料,加上阅读官方说明书和HELP文档,一般刚开始学习的时候先使用默认参数,不要乱调参数)

直接去hisat2的主页下载index文件即可,然后把fastq格式的reads比对上去得到sam文件。 接着用samtools把它转为bam文件,并且排序(注意N和P两种排序区别)索引好,载入IGV,再截图几个基因看看! 顺便对bam文件进行简单QC

  1. 下载index文件(小鼠)
    axel ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/mm10.tar.gz
    tar -xvzf mm10.tar.gz

    下载注释文件
    axel ftp://ftp.sanger.ac.uk/pub/gencode/Gencode_mouse/release_M10/gencode.vM10.annotation.gtf.gz

  2. 序列比对
    a. 配置 1核8G内存
    hisat2 -t -x ref/mm10/genome -1 rawdata/SRR3589960.sra_1.fastq.gz -2 rawdata/SRR3589960.sra_2.fastq.gz -S align/SRR3589960.sam


    111111111111.jpg

    运行时间38分钟,源文件1.6G

更改配置4核32G
for ((i=60;i<=62;i=i++));do hisat2 -t -x ref/mm10/genome -1 rawdata/SRR35899${i}.sra_1.fastq.gz -2 rawdata/SRR35899${i}.sra_2.fastq.gz -S align/SRR35899${i}.sam;done

注释: -t 记录时间 -x hg19(index)文件路径 -1 -2 测序的两个fastq文件 -S 比对结果输出路径 -U 单端测序文件
reference=~/wikiwei/human/ref/index/hg19/genome
hisat2 -t -x $reference -U SRR957679.fastq -S siSUZ12_1.sam 2>siSUZ12_1.log

参考文章

  1. 转录组入门(mac版本)
  2. https://www.cnblogs.com/freescience/p/7342895.html

你可能感兴趣的:(转录组笔记(5)序列比对)