如何将转录组数据mapping到自己的序列并可视化?(HISAT2+Samtools+IGV)

        以小编自己最近在做的HBV mapping为例,前期的环境部署及软件安装找时间再细说,直接进入主题,如下:

前期准备:

Linux以及Windows操作系统,HISAT2、Samtools以及IGV等软件的安装,fastq文件

操作步骤:

1. 在NCBI中找到HBV genotypeD的序列并下载sequence.gb以及sequence.fa格式文件。


2. 使用HISAT2构建HBV genome的Index,命名为HBVgenotypeD。

extract_exons.py sequence.gb > exons.txt

extract_splice_sites.py sequence.gb > splicesites.txt

hisat2-build --s splicesites.txt --exon exons.txt PATH/sequence.fa HBVgenotypeD

3. 采用HISAT2进行mapping获得sam文件,命名为HBVmaping.sam。

hisat2 -p 8 --dta -x PATH/ HBVgenotypeD -1 HBV_R1.fastq.gz -2 HBV_R2.fastq.gz -S HBVmaping.sam

5. 采用Samtools将sam文件sort为bam文件,命名为HBVmaping.bam。

samtools sort -@ 8 -o HBVmaping.bam HBVmaping.sam

6. 对bam文件建立index。

samtools index HBVmaping.bam

7. 打开IGV,genome——load genome from file,选择sequence.fa;File——load from file,选择HBVmaping.bam。结果如下:

大功告成!


怎么样,是不是很简单呢?快来试一试吧!

你可能感兴趣的:(如何将转录组数据mapping到自己的序列并可视化?(HISAT2+Samtools+IGV))