RNA-seq生信分析流程

RNA-seq生信分析流程

 

RNA-seq是近些年发展起来的针对转录组的测序技术,其能够获得mRNA、smallRNA以及各种非编码RNA的序列。

在不同细胞或者在相同细胞的不同发育阶段细胞中这些RNA的表达水平是不同的,依赖RNA-seq测序技术对这些不同细胞进行差异表达分析,可以得出转录组层面上的表达模式,当前已广泛应用于基础研究、临床诊断和药物研发等领域。

文章目录

  • 1.数据质控
  • 2.mapping
  • 3.确定RNA丰度
  • 4.差异基因表达分析
  • 叮!

1.数据质控

由于当前的测序方法需要再测序样品的两端加上接头,以便于进行大量非特异性扩增以及高通量测序,因此测序结果首先要进行去接头和质控处理。数据质控即包括去接头和质控处理两部分,可以进行数据质控的工具有FastQC、cutadaptor、Trimmomatic、Trim galore等,其中较常见的是Trim galore。

2.mapping

进行数据质控后需要将获得的序列mapping回基因组,用于mapping的工具也有很多如tophat、Bowtie、hisat2、BWA等。几个工具正hisat2和Bowtie使用较多,Bowtie使用时较为节省内存并且超级快速,其并不只是一个简单的拼接工具,其适合的工作是将小序列mapping到大基因组上。hisat2速度也很快,也较为常用。

3.确定RNA丰度

确定各种RNA的丰度是非常重要的。不同样品间可以使用TMM值、upper quartile值来计算,同种样品则可以使用RPKM、quantile值进行比较。可以使用的工具有htseq-count或stringtie、Bedtools、GFold等。

4.差异基因表达分析

差异表达分析用于确定各RNA表达差异是否有显著性,差异分析的工具有CuffDiff、DEseq、EdgeR等,每种工具都有一定的特点如CuffDiff更适合于不同样本间的比较,而另外两种更适合于相同样本的比较。获取到差异分析结果后,还可以选择使用GO分析或者KEGG通路分析进行后续分析,用于确定这些差异表达代表的生物学意义。

叮!

当前除了RNA-seq外还有sRNA-seq、miRNA-seq、chip-seq、甲基化测序等测序技术,但是这些测序技术后续的生信处理的原理基本相似。本文仅非常简要地介绍了一下RNA-seq的大体步骤,很多细节信息未涉及,技术实现也未涉及到,因为现在还没做过这方面的课题,仅仅是记录一下之前课上学到的内容。以后若是有做到相关内容再更新吧!!!

你可能感兴趣的:(RNA-seq)