生信分析学习笔记 - RNAseq (一) 前传

声明:本文部分内容和部分图片来源于网络。本文为生信小白学习笔记,不能保证专业名词和内容全部正确或权威。

       RNAseq,也被称为全转录组测序,是检测样品RNA含量的测序。这是一种可以获得某时刻转录组状态的方法。RNAseq主要包含将RNA样本转换为cDNA library, 接着被测序和根据参考基因组进行定位。加上其可以测量基因表达水平,RNAseq可以提供关于可变剪接和非编码RNA(i.e., microRNA)的更多信息。RNAseq转录组测序的能力克服了全基因组芯片的许多不足。具体而言,这种测量是定量的,可检测目标的光谱不受芯片上基因探针的限制。

        尽管RNAseq具有很明显的优势,但该技术不可避免得会受到逆转录和PCR扩增过程导致误差的影响。RNA引物的退火并不是随机的,这可能会导致来自链5‘和3’末端的数据减少(?什么关系?),从而导致检测转录本的开端和末端更加困难。同时,PCR在扩增转录本时,倾向更大程度地扩增长转录本,从而导致转录本长度地偏差。

Fig.1 RNAseq protocol

忽略具体方法,RNA首先被转换为cDNA,然后被包装进测序文库,通过二代测序方法得到数百万个短的核酸序列。 

1. RNAseq允许测量几乎所有的RNA转录本(而不限于芯片表面上所预设的转录本);

2. RNAseq测定的转录表达水平有一个更广泛的动态范围;

3. RNAseq可发现未报道的转录本和可变剪接转录本;

4. RNAseq能够对选择性剪接事件进行定量。

       由RNAseq技术延伸出的数据分析具有巨大挑战。而在现有数据分析流程中,没有一种方法是最优的,而且不同的方法受离群值的影响程度不同,不同方法为达到足够的统计功效所需要的样本大小不同,不同方法也具有不同的准确度。此外,测序读段(read)在基因组中不同表达区域的覆盖率之间的波动对所有的方法都有影响。

       为了尽可能减少误差,对数据的评估和前期处理对提升RNAseq分析结果可靠性尤为重要,这也对理解RNAseq分析各个流程工作原理提出了很高的要求。下一步尽量对RNAseq各个流程收集更多信息,以获得更全面理解。

你可能感兴趣的:(生信分析学习笔记 - RNAseq (一) 前传)