No.1 第三代测序单分子荧光测序之Pacbio 测序原理

测序原理:边合成边测序

测序特点:

1. 四色荧光基团

分别将四色荧光基团标记在脱氧核苷酸的磷酸基团的末端。当碱基配对完成之后,随着磷酸基团的掉落而掉落,并且不会影响后续的测序过程。

2.Zero Model Waveguide(ZMW) 70mm 直径的测序微孔

在测序微孔中,聚合酶存在于玻璃板的底部,当聚合酶抓住一个dNTP的时候,会停留一段时间,这时激发波长才会激发基团发出荧光,而孔中其他少量的游离dNTP则不会被激发。

3.Pacbio 哑铃状文库

DNA分子被接上发卡状的adaptor,因此,构建的文库整个是圆环的分子,利于其周而复始的复制。并且,对于一个片段的重复测序,可以提高准确度,因为不会像illumina测序那样,因为同时测多个碱基而出现phasing 和prephasing的情况,制造噪音限制读长。


4.Pacbio 测序读长长的原因

就是因为只有一个分子,不会容易出现噪音。

5.缺点

对碱基的判断会出现随机误差,错误率大概是12.5%,但是这种错误可以通过对DNA分子对进行几次测序进行弥补。    

6.   限制读长的因素

光照条件下,DNA链可能会出现缺口。

光照条件下,聚合酶可能会变性

文库本身的长度不够,因为建立一个DNA文库,长度>20kb-30kb的文库是有困难的。

7.   Pacbio 的测序通量

每张芯片0.3-0.4G数据

测序复合物:包括聚合酶、测序模板,测序引物。在聚合酶上加上生物素,在玻璃板上加上链霉亲和素,将聚合酶固定在玻璃板的底部。芯片上的小孔是随机加入测序复合物的,一张芯片15万个空,其中1/3的小孔是含有一个测序复合物,1/3的小孔是空的,剩下的1/3含有2-3个测序复合物。(根据泊松分布)。空的不会产生信号,而多个测序复合物会产生杂乱的信号,都会失去作用。因此有效的孔数是5万个,每个平均测序长度是8000个碱基,因此平均每张芯片的测序数据量是0.3-0.4G的产出。

8.Pacbio 可以直接测到被修饰的DNA碱基

因为聚合物遇到模板上被修饰的碱基,例如甲基化的碱基,合成的速度明显被放慢,并且广谱特征也发生改变。这样就可以判断该位置的DNA被甲基化了。

9.GC bias

Pacbio的GC bias很小。例如,在PCR过程中,如果模板的GC含量比较高,那么PCR的效率就会比较低。反之,AT含量高,PCR的效率就会高,而传统的建库过程中,PCR的过程比较多,导致的结果就是GC含量高的reads数就会比较差。而Pacbio不是传统的建库方法,其GC bias明显小于PCR建库的illumina或Ion Torrent的测序结果。

10.测序速度

Pacbio的聚合酶可以1s钟合成3个碱基,1小时就是合成1万多个碱基。3个小时就是3万多个碱基,而之后,继续在读的reads数,已经几乎没有了,因此3小时之后基本完成测序。相对illumina的测序速度,是非常快的,也比Ion Torrent的测序速度也是快一点点的。国内测序的Pacbio大概10-20台。

你可能感兴趣的:(No.1 第三代测序单分子荧光测序之Pacbio 测序原理)