RNAseq教程(4.1)

1.Module 1 - Introduction to RNA sequencing

  1. Installation
  2. Reference Genomes
  3. Annotations
  4. Indexing
  5. RNA-seq Data
  6. Pre-Alignment QC

2.Module 2 - RNA-seq Alignment and Visualization

  1. Adapter Trim
  2. Alignment
  3. IGV
  4. Alignment Visualization
  5. Alignment QC

3.Module 3 - Expression and Differential Expression

  1. Expression
  2. Differential Expression
  3. DE Visualization
  4. Kallisto for Reference-Free Abundance Estimation

4.Module 4 - Isoform Discovery and Alternative Expression

  1. Reference Guided Transcript Assembly
  2. de novo Transcript Assembly
  3. Transcript Assembly Merge
  4. Differential Splicing
  5. Splicing Visualization

5.Module 5 - De novo transcript reconstruction

  1. De novo RNA-Seq Assembly and Analysis Using Trinity

6.Module 6 - Functional Annotation of Transcripts

  1. Functional Annotation of Assembled Transcripts Using Trinotate

4.1 Reference Guided Transcript Assembly

利用Stringle和Ballgown发现从头组装的转录本和差异表达

在上一个模块中,使用Stringtie的'-G'和'-e' 选项在'reference only'模式下运行Stringtie。

在本模块中,我们将以另外两种模式运行Stringtie:“reference guided”模式及(2)“de novo”模式。在已知转录本的帮助下,Stringtie可以预测每个文库中存在的转录本。然后,Stringtie将为每个由数据组装的转录本分配任意的转录本id,并估计这些转录本的表达。这种方法的一个复杂之处在于,在每个库中,都可能预测出一组不同的转录本。可能有很多相似之处,但是在每个库的输出文件中,转录的数量和它们的确切结构是不同的。因此,在跨库进行比较之前,需要确定哪些转录本在跨库之间相互对应。Stringtie提供了一个merge命令来组合来自不同库的预测文本GTF文件。

一旦有了一个合并的GTF文件,就可以用它来运行Stringtie,而不是我们以前使用的已知的transcripts GTF文件。合并的GTF被用来重新计算表达估计在准备运行Ballgown使用合并新转录本。

To run Stringtie in 'reference guided' mode: use the '-G' option WITHOUT '-e'

To run Stringtie in 'de novo' mode do NOT specify either of the '-G' OR '-e' options.

参考Stringtie手册获得更详细的说明:https://ccb.jhu.edu/software/stringtie/index.shtml?t=manual

Running Stringtie in Reference Guided Mode

使用我们在前面模块中生成的对齐,现在只使用'-G'选项在reference guided模式下运行Stringtie。

额外选项如下

  • '-p 8' tells Stringtie to use eight CPUs
  • '-G ' reference annotation to use for guiding the assembly process (GTF/GFF3)
  • '-l' name prefix for output transcripts (default: STRG)
  • '-o' output path/file name for the assembled transcripts GTF (default: stdout)

首先,创建一个输出目录,然后以reference guided模式运行stringtie。

mkdir ref_guided
stringtie -p 1 -G ../chr22_with_ERCC92.gtf -l HBR_Rep1 -o ref_guided/HBR_Rep1/transcripts.gtf HBR_Rep1.bam
所有做相同处理
  1. Functional Annotation of Assembled Transcripts Using Trinotate

你可能感兴趣的:(RNAseq教程(4.1))