[RNA-Seq] 学习

最近在学RNA-Seq,从收集资料开始,将好用的链接先拷过来,方便阅读:

背景:

生信技能树:RNA-Seq这十年

嗯、这篇文章写的很全,从一篇综述翻译过来的,介绍了短读长和长读长(PacBio / Oxford Nanopore(ONT)) 、还有direct RNA的一些特点(不需要cDNA合成和PCR扩增操作,消除了常规操作带来的biase,且可以保留表观遗传学特性)...

long-read Sequencing较于短读长优缺点:

长读长有助于检测isoforms、 利于3’端alternative polyA分析
缺陷:
1、 测序通量小

在Illumina平台上,运行单次的RNA-seq可以生成10E9-10E10条短读长,但是在PacBio和ONT平台上,一次RNA-seq则只能产生10E6-10E7条读长。这种低通量限制了应用长读长测序技术进行实验的规模,并降低了对差异基因表达检测的灵敏性。

2、测序错误率更高
这里要get一个词CCS(circular consensus-sequencing,环形一致性测序),针对PacBio(PacBio测序原理图如下)。

PacBio.png

3、灵敏度受限

No. 31 RNA-Seq建库用哪种策略?

  • 第1方面,最终拿去测序仪进行测序的一定都是DNA片段,因此我们需要对实验提取到的RNA序列进行反转录成cDNA,然后再进行连接adapter。
  • 第2方面,细胞中含量最多的是rRNA,其次是tRNA,mRNA与lncRNA只占大约5%左右甚至更低,而我们真正关心的往往就是mRNA与lncRNA代表的基因表达量。

建库策略

  1. PolyA

在绝大多数情况下,我们关心的gene都是protein coding gene或者是与其结构非常详细的lncRNA(long non-coding RNA)这些gene在形成成熟的mRNA以后,往往都会在3'末端带有polyA 尾巴;同时,成熟的tRNA,rRNA,miRNA等等都不带有经典的polyA尾巴。
使用一段 带有能与A配对的T的磁珠就可以与对应的带有polyA尾巴的RNA结合,随后再经过随机打断,反转录,加adapter就可以完成建库,这样的建库策略叫做polyA + 或者 polyA positive。

  1. rRNA minus

那么polyA positive策略有个比较大的问题就是,会丢掉很多不带有polyA尾巴的RNA序列,比如tRNA,比如有些lncRNA以及一些特殊的mRNA。
这个过程是对rRNA进行若干次的消化,使得rRNA都被降解而其他类型的RNA不受影响。随后再进行随机打断,反转录,加adapter。这种RNA-Seq的建库策略为rRNA - 或称为 rRNA minus。

RNA质检三步曲

1、 Nanodrop 2000

纯RNA,其A260/A280约为2

OD260/OD280 介于1.8到2.1间,大于2.1,则为基因组污染;小于1.8则为蛋白质污染
OD230/OD260 介于0.4-0.5间,大于0.5说明样本中有盐和小分子杂质污染,小于0.4则考虑基因组污染

2、 Qubit 3.0 进行浓度定量

3、 Agilent 4200 测量RNA完整性RIN值

一般RIN值取值为1-10之间,mRNA大于7则为RNA完整性较好;lnc、circle、miRNA测序要求RIN值大于6。

Bioinformation:

1、 初始数据过滤、质控

NGS 数据过滤之 Trimmomatic 详细说明

GSEA

参考资料: GSEA富集分析

表达量验证:

Date: 2019-10-29
昨晚转录组分析,需要用qRT-PCR进行定量检验基因表达量,今天正好和实验组的人讨论了一份用相对定量法检测缺失的报告,记录一些相关的信息。
个人理解:
扩增曲线基本如下所示,类似于细菌生长的S型曲线,主要是基线期、指数增长期和平台期。其中指数增长期与初始的DNA量有关,初始DNA量越大,ct值越小,在图中表示为越早出峰。这里面有个ct值的概念,ct值可以理解为每个反应管内的荧光信号达到设定的域值时所经历的循环数 (cycle)。所以如果出现了DNA片段的缺失,ct值在扩增曲线上会表现出相对于阴性对照更晚出现的S型曲线。另外还有一个参考的值2^-ΔΔCt ,做这个分析时还需要对阴性对照和样本取一个内参基因,例如GADPH,做校正,最后获得目标基因的2^-ΔΔCt值。

扩增曲线.png

参考资料:
实时荧光定量PCR的基本原理
qRT-PCR相对定量计算详解

你可能感兴趣的:([RNA-Seq] 学习)