RNAseq教程(1.4)

目录

1.Module 1 - Introduction to RNA sequencing

  1. Installation
  2. Reference Genomes
  3. Annotations
  4. Indexing
  5. RNA-seq Data
  6. Pre-Alignment QC

2.Module 2 - RNA-seq Alignment and Visualization

  1. Adapter Trim
  2. Alignment
  3. IGV
  4. Alignment Visualization
  5. Alignment QC

3.Module 3 - Expression and Differential Expression

  1. Expression
  2. Differential Expression
  3. DE Visualization
  4. Kallisto for Reference-Free Abundance Estimation

4.Module 4 - Isoform Discovery and Alternative Expression

  1. Reference Guided Transcript Assembly
  2. de novo Transcript Assembly
  3. Transcript Assembly Merge
  4. Differential Splicing
  5. Splicing Visualization

5.Module 5 - De novo transcript reconstruction

  1. De novo RNA-Seq Assembly and Analysis Using Trinity

6.Module 6 - Functional Annotation of Transcripts

  1. Functional Annotation of Assembled Transcripts Using Trinotate

1.4 Indexing

创建HISAT索引

为chr22和ERCC spikein序列创建HISAT2索引。HISAT2可以将外显子和剪接位点合并到索引文件中进行对齐。首先创建一个剪接站点文件,然后创建一个外显子文件。最后制作FM索引。

要了解更多关于HISAT2索引策略与其他软件的不同之处,请参阅说明书。

hisat2_extract_splice_sites.py chr22_with_ERCC92.gtf >INDEX/splicesites.tsv
hisat2_extract_exons.py chr22_with_ERCC92.gtf >INDEX/exons.tsv
hisat2-build -p 8 --ss INDEX/splicesites.tsv --exon INDEX/exons.tsv chr22_with_ERCC92.fa INDEX/index

[可选]为所有染色体创建索引,而不是仅仅为chr22,你会做以下操作:

注意:下面的例子没有利用将剪接位点和外显子添加到索引。如果需要,可以使用完整的GTF生成这些文件,并使用适当的选项将它们添加到命令中。

警告:为了索引整个人类基因组,HISAT2需要160GB内存。AWS实例大小将耗尽RAM。

#cd /home/ubuntu/workspace/data/fasta/GRCh38
#hisat2-build -p 8 Homo_sapiens.GRCh38.dna_sm.primary_assembly.fa Homo_sapiens.GRCh38.dna_sm.primary_assembly

你可能感兴趣的:(RNAseq教程(1.4))