RNA-seq中的生物学重复

  • 生物学重复:经过相同方式处理相同样品(不是同一个体)。指样本重复,比如3只小鼠,同时做一种处理,就是三个生物学重复。
    • 消除组内误差:生物学重复可以测量变异程度
    • 增强结果可靠性:测序的样本数越多,越能够降低背景差异
    • 检测离群样本:异常样本的存在,会严重影响测序结果的准确性,通过计算样本间的相关性可以发现异常样本,将其排除。
    • 没有生物学重复实验发文章困难,如确实无法设置生物学重复。就得结合强有力的实验数据支撑,如定量实验FISH荧光原位杂交,或是northern 杂交等,用实验数据说服。考虑到现实条件,重复设置≥3。一般不建议两个重复,如果两者结果不一,无法确定哪个数据为参考。
    • 原核生物以及真菌生物学重复的效果>植物>动物
    • 植物取样:同一片试验田,同一长势,外部形态特征相同
    • 动物取样:同一遗传背景,同一饲养条件,同一年龄,性别相同,外部形态特征相同
    • 生物学重复文献研究:在控制相同的假阳性率水平下,差异基因的数目整体与生物重复数量正相关;差异基因数目的稳定性与生物重复数量负相关;生物重复较少时,不同的抽样导致的差异基因数目波动较大;生物重复较多时,差异基因数目更集中。生物重复越多,真阳性率越高,并受筛选阈值影响越少,漏掉的差异基因(假阴性基因)越少。
    • 【Paper】RNA-seq differential expression studies:more sequence or more replication:对高、中、低表达的基因的表达量进行了评估,生物学重复提高所有基因表达水平鉴定的准确性,而增加测序深度主要提高低表达基因表达量鉴定准确性
    • 【paper】The power and promise of RNA-seq in ecology and evolution
    • Efficient experimental design and analysis strategies for the detection of differential expression using RNA-Sequencing:DESeq的效果于edgeR或NBPSeq;差异分析对数据量并不敏感,增加生物学重复对提高表达差异分析结果可靠性的效果要优于单样本测序量。
      • 假阳性率(FPR):真实非差异表达中的基因中,被错误判定差异表达的比例,FPR越低越好;
      • 真阳性率(TPR):真实差异表达的基因中,能够正确判定为差异表达的比例,TPR越高越好;真阳性率这个概念,如果换用为“差异基因的检出率”更容易理解
      • 单样本测序量保持不变,生物学重复数(n)提高,差异分析的假阳性率(FPR)基本稳定,但真阳性率(TPR)在不断提高。提高生物学重复数,实验对差异表达基因的检测更加敏感,那些差异倍数较小或表达量较低的差异表达基因(此类基因的差异检测难度较大)能够更容易检测到。

  • 技术重复:同一样品多次测量。一般是三次实验,比如对一块组织,提了三次RNA,做三次real time。

你可能感兴趣的:(RNA-seq,RNA-seq)