2022-11-29 RNA-seq数据处理

之前用hisat2尝试处理RNA-seq数据,这里使用tophat2

1.使用前建立index

使用bowtie2建立index

bowtie2-build genome.fa bowtie2index/genome

genome.fa是基因组fasta文件 

bowtie2index 是index存储目录

genome是index的前缀、

注意:程序运行完后genome.fa文件要放在bowtie2index目录中,tophat2软件才能正确运行。

2.将readmapping到参考基因组

tophat2 -p 8 -G genes.gtf -o . bowtie2index/genome ${i}.QC.1.fq.gz ${i}.QC.2.fq.gz | samtools view -h -q 10 -@ 20 | samtools sort -@ 20 -m 1G -o q10.bam

-p :指定线程数

-G :指定已有的基因组注释信息,gtf或gff文件;

-o :指定输出目录,默认为”./tophat_out“;

后面加上索引文件:与前面的bowtie2建立的索引相对应,只取前缀名。

最后加上fastq文件:filename.fq;如果是双端测序则是filename_1.fq和filename_2.fq 两个文件。

3.我喜欢用featurecount计算count数目

featureCounts -p -t exon -g gene_id -M -T 8 -a genes.gtf -o featurecounts.txt q10.bam

4.差异表达使用DESeq2 流程见RNA-seq数据分析 09:DESeq2差异表达分析 - 知乎 (zhihu.com)

参考:

[转载]RNAseq: TopHat2 + Cufflinks分析流程 - (jianshu.com)

RNA-seq数据分析 09:DESeq2差异表达分析 - 知乎 (zhihu.com)

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

你可能感兴趣的:(2022-11-29 RNA-seq数据处理)