测序深度和测序覆盖度,怎么估算?

    在我们开始测序之前,经常会被问道,你需要的测序深度和测序覆盖度的概念,比如在测序线粒体的DNA时候,测序小哥就问说1个G的数据量够了吗?下面就给大家解释下这两个概念:


(图片来源于知乎余功旺)

测序深度(depths)

      测序深度(depths)指测序得到的总碱基数与待测基因组大小的比值,简单的说就是测序的数据量大小比上参考基因组/转录组的大小,通常结果用n×来表示。

测序覆盖度(coverage)

      测序覆盖度是测序所组装的结果占整个基因组的比例,实际上,由于我们测序的结果通常不能组装出完整的结果,因为在基因组上有很多的重复序列,高GC的结构存在,这使得组装结果不能覆盖整个参考基因组,这些没有被组装好的区域就叫做覆盖度。

实例

(1)小明请测序公司测序DNA样本,采用Illumina PE150的测序平台,采用双端测序技术,生成150 bp的reads,单端的reads数目为3,300,000,Insert size为350 bp,测序的基因组大小为760 Mb,测序的样品DNA不考虑样品中的线粒体DNA影响,测序深度为( )×?

(2) 我们有时候也说,我要测序1G的数据量,那么这种情况下测序深度是( )×?

备注:(1)1G=1024Mb 1Mb=1024kb 1kb=1000bp

           (2)如果是测昆虫线粒体基因组大小,一般1G的数据量够了


Reference:

https://zhuanlan.zhihu.com/p/40040208

http://www.360doc.com/content/19/0123/16/52645714_810824928.shtml

https://zhuanlan.zhihu.com/p/74558512

你可能感兴趣的:(测序深度和测序覆盖度,怎么估算?)