illumina测序

原理

illumina测序的技术核心原理是相同的都是边合成边测序的方法,它的测序过程主要分为四步:

构建DNA文库

利用超声波把待测的DNA样本打断成小片段,目前除了组装之外和一些其他的特殊要求之外,主要是打断成200-500bp长的序列片段,并在这些小片段的两端添加上不同的接头,构建出单链DNA文库。


adaptor作用.png
Flowcell随机附着

Flowcell是用于吸附流动DNA片段的槽道,当文库建好后,这些文库中的DNA在通过flowcell的时候会随机附着在flowcell表面的channel上。每个Flowcell有8个channel,每个channel的表面都附有很多接头(P5和P7),这些接头能和建库过程中加在DNA片段两端的接头相互配对(这就是为什么flowcell能吸附建库后的DNA的原因),并能支持DNA在其表面进行桥式PCR的扩增。

桥式PCR扩增与变性

桥式PCR以Flowcell表面所固定的接头为模板,进行桥形扩增(35X)。经过不断的扩增和变性循环,最终每个DNA片段都将在各自的位置上集中成束,每一个束都含有单个DNA模板的很多分拷贝,进行这一过程的目的在于实现将碱基的信号强度放大,以达到测序所需的信号要求。但PCR本身会造成的碱基错误也随之引进。

测序

测序方法采用边合成边测序的方法。向反应体系中同时添加DNA聚合酶、接头引物和带有碱基特异荧光标记的4种dNTP。这些dNTP的3’-OH被化学方法所保护,因而每次只能添加一个dNTP。在dNTP被添加到合成链上后,所有未使用的游离dNTP和DNA聚合酶会被洗脱掉。接着,再加入激发荧光所需的缓冲液,用激光激发荧光信号,并有光学设备完成荧光信号的记录,最后利用计算机分析将光学信号转化为测序碱基。这样荧光信号记录完成后,再加入化学试剂淬灭荧光信号并去除dNTP 3’-OH保护基团,以便能进行下一轮的测序反应。

特点

Illumina的这种测序技术每次只添加一个dNTP的特点能够很好的地解决同聚物长度的准确测量问题 (Homopolymer错误),它的主要测序错误来源是碱基的替换,目前它的测序错误率在1%-1.5%之间。测序周期以人类基因组重测序为例,30x测序深度大约为1周。

补充
链特异建库

链特异性测序可以保留最初产生RNA的方向,目前最常用的dUTP
链特异性建库的方法首先利用随机引物合成RNA的一条cDNA链,在合成第二条链的时候用dUTP代替dTTP,加adaptor后通过尿嘧啶DNA糖基酶处理,将有U的第二条cDNA降解掉。尿嘧啶DNA糖基酶能够催化含尿嘧啶的单链和双链DNA释放游离尿嘧啶,对RNA无活性,这样最后的insert DNA fragment都是来自于第一条cDNA因此,以dUTP链特异性建库方式测序RNA的结果中,R1文件中read的方向和基因的方向(正义链)是相反的,而R2文件中的read2 方向和基因的方向是相同的。

双端测序

上样
flowcell是用于吸附流动DNA片段的槽道,测序就在此进行。lane上随机分布两种接头,p5‘(与P5互补),P7(与P7'互补),待测序列自带了p5接头和p7接头。序列只能一开始是利用p5接头互补,因为p7接头和lane是一样的。将构建好文库中的待测序列配置成一定的浓度通过flowcell,序列会在特异的化学试剂作用下,强力随机地附着在lane上,并与上面的短序列配对。上样的结果就是lane吸附住了冲过来的DNA,并且可以在表面进行桥式PCR扩增。要测序的是模版链p5 - p7,开始它与lane接头配对产生了互补链,后来强碱试剂作用下去杂,两条链被分开,由于模版链没有附着在lane上,模版链被冲走,但是互补链p5‘- p7‘ 依然稳稳固定在lane上。加入缓冲溶液,互补链的p7‘和lane上的p7互补(但还是一个lane中的),目的是快速扩增lane p7接头连接的链,也就是下图中的Forward Strand,它和模版链是一致的,后来测序的只用这一部分。PCR弯成桥状,一轮桥式扩增一倍,大约35个循环后,最终每个DNA片段都将在各自的位置上集中成束,这PCR是一群完全相同的序列,叫做cluster。桥式PCR目的在于实现放大单一碱基的信号强度,满足后期测序需求。桥式PCR完成后,形成了很多的桥形的互补双链,再次强碱解链。这一次不再进行复制,而是利用甲酰胺基嘧啶糖苷酶(Fpg)选择性的切掉lane 上p5‘ 连接的链,只留下了与lane p7连接的链即Forward Strand。

测序

  1. 首先primer结合到靠近p5的sequencing primer binding site1上,再加入特殊的dNTP--它的3‘ 羟基被叠氮基团替代,因此每次只能添加一个dNTP;还含有荧光基团,能够激发出不同颜色;在dNTP被添加到合成链上后,所有未使用的游离dNTP和DNA聚合酶会被洗脱掉;再加入激发荧光缓冲液,用激光激发荧光信号,光学设备记录荧光信号的记录,计算机将光学信号转化为测序碱基。
  2. 当信号被记录后,再加入化学试剂淬灭荧光信号并使dNTP 3’ 叠氮基团变成羟基,这样能继续向下进行再加一个,并且保证这个不再发出荧光。如此重复直至所有链的碱基序列被检测出,得到了Forward Strand序列。
  3. 循环结束后,read product被冲掉,index1 primer和链上的index1 互补配对,进行index1的检测。测完后,洗脱产物,得到index1 的序列。接下来p5与lane上的p5‘配对,测得了index2,并洗脱。
  4. 洗脱掉index2 产物后,还是一轮桥式扩增,得到双链,再变性得到原始Forward strand 和 新的Reverse Strand, 除去测完的Forward strand。然后和测Forward一样,也是先连接primer,只是连接的位点是Primer Binding Site2,测完后得到reverse strand序列。

你可能感兴趣的:(illumina测序)