BBQ(生物信息基础问题31):RNA-Seq建库用哪种策略?

今天我们讨论的是RNA-Seq建库策略问题,我们来思考一下如何对RNA进行测序呢?

Q1:现在可以直接对RNA的序列进行测序吗?
A:肯定是不行的,因为现在没有仪器可以去测RNA序列(太不稳定了)

Q2:那测RNA用什么方法呢?
A:现在的测序仪进行测序的一定都是DNA片段!因此,我们需要把RNA变成DNA,然后加上Adapter(接头序列)进行测序。

BBQ(生物信息基础问题31):RNA-Seq建库用哪种策略?_第1张图片
RNA-seq建库策略

图片来自 https://journals.plos.org/ploscompbiol/articleid=10.1371/journal.pcbi.1004393

  我们都知道,细胞中的RNA有rRNA, tRNA, mRNA, lncRNA等等。细胞中含量最多的是rRNA,其次是tRNA,mRNA与lncRNA只占大约5%左右甚至更低,而我们真正关心的往往就是mRNA与lncRNA代表的基因表达量。那么怎么对mRNA或者是lncRNA进行富集呢?

Q4:首先我们来了解一下,在正常人类细胞中rRNA,tRNA,mRNA的大致比例是多少?

BBQ(生物信息基础问题31):RNA-Seq建库用哪种策略?_第2张图片
一个正常细胞的RNA含量

BBQ(生物信息基础问题31):RNA-Seq建库用哪种策略?_第3张图片
RNA的含量

图片来自: http://www.liankebio.com/wap/article-681.html

  一般来说,我们做RNA-Seq的假设是基于:

某一个条件影响了表型 -->
假设,表型是由蛋白的变化引起的 -->
假设,蛋白的变化大概率是由对应gene表达量的改变引起的 -->
因此,需要对gene进行定量 -->
最终,进行RNA-Seq

(ps:在这种情况下,和正常的相比,RNA的表达肯定存在差别。基于此,可以进行后续的分析)

现有的有2种建库策略:

1:polyA + 建库策略

  在绝大多数情况下,我们关心的gene都是protein coding gene或者是与其结构非常详细的lncRNA(long non-coding RNA)这些gene在形成成熟的mRNA以后,往往都会在3'末端带有polyA 尾巴。与此同时,成熟的tRNA,rRNA,miRNA等等都不带有经典的polyA尾巴。

成熟的RNA

  如果我们使用一段 带有能与A配对的T的磁珠就可以与对应的带有polyA尾巴的RNA结合,随后再经过随机打断,反转录,加adapter就可以完成建库,这样的建库策略叫做polyA + 或者 polyA positive。核心是对带有polyA尾巴的RNA进行富集。

Q5:是不是所有人类的protein coding gene的mRNA都带有polyA尾巴?如果不是请举例;
A:并不是,组蛋白的mRNA就没有polyA尾巴。polyA对mRNA起到稳定作用 即使其不被降解.组蛋白mRNA3'端是一茎环结构 所以组蛋白mRNA降解机制也与其他mRNA不同.

2: rRNA -建库策略

  那么polyA positive策略有个比较大的问题就是,会丢掉很多不带有polyA尾巴的RNA序列,比如tRNA,比如有些lncRNA以及一些特殊的mRNA。同时,我们知道细胞中含量占绝大多数的是序列重复的rRNA,如果我们把rRNA去除之后也就可以顺利进行建库测序。这个过程是对rRNA进行若干次的消化,使得rRNA都被降解而其他类型的RNA不受影响。随后再进行随机打断,反转录,加adapter。这种RNA-Seq的建库策略为rRNA - 或称为 rRNA minus。这种策略的核心是尽可能多的去除rRNA。

Q6:如果一个实验想要探索与可变剪切相关的内容,应该选择polyA +的建库策略还是选择rRNA - 的建库策略?为什么?
A:采取第一个polyA+建库策略。因为研究可变剪接的话,最后得到的都是成熟的mRNA.那么它都具有polyA,在这种情况下利用带T的磁珠进行特异性富集,将mRNA进行富集。然后建库就可以。

Q7:rRNA minus与polyA positive这两种建库策略,哪种最终比对到参考基因组的比例会高一些?为什么?
rRNA minus只是去掉了rRNA,其他的RNA没有去掉,比如说mRNA,lncRNA等等。在mapping回基因组的时候,reads的数量会多。从已知的参考基因组上来看,虽然hg38和hg19差别不大,hg38的mapping结果估计会比hg19高一些。

Ref:
1:生物信息学100个基础问题 —— 第31题 RNA-Seq建库用哪种策略?https://zhuanlan.zhihu.com/p/37081245
2:https://journals.plos.org/ploscompbiol/articleid=10.1371/journal.pcbi.1004393
3:http://www.liankebio.com/wap/article-681.html

你可能感兴趣的:(BBQ(生物信息基础问题31):RNA-Seq建库用哪种策略?)