illumina测序

原理

illumina测序的技术核心原理是相同的都是边合成边测序的方法，它的测序过程主要分为四步：

构建DNA文库

利用超声波把待测的DNA样本打断成小片段，目前除了组装之外和一些其他的特殊要求之外，主要是打断成200-500bp长的序列片段，并在这些小片段的两端添加上不同的接头，构建出单链DNA文库。

adaptor作用.png

Flowcell随机附着

Flowcell是用于吸附流动DNA片段的槽道，当文库建好后，这些文库中的DNA在通过flowcell的时候会随机附着在flowcell表面的channel上。每个Flowcell有8个channel，每个channel的表面都附有很多接头（P5和P7），这些接头能和建库过程中加在DNA片段两端的接头相互配对（这就是为什么flowcell能吸附建库后的DNA的原因），并能支持DNA在其表面进行桥式PCR的扩增。

桥式PCR扩增与变性

桥式PCR以Flowcell表面所固定的接头为模板，进行桥形扩增(35X)。经过不断的扩增和变性循环，最终每个DNA片段都将在各自的位置上集中成束，每一个束都含有单个DNA模板的很多分拷贝，进行这一过程的目的在于实现将碱基的信号强度放大，以达到测序所需的信号要求。但PCR本身会造成的碱基错误也随之引进。

测序

测序方法采用边合成边测序的方法。向反应体系中同时添加DNA聚合酶、接头引物和带有碱基特异荧光标记的4种dNTP。这些dNTP的3’-OH被化学方法所保护，因而每次只能添加一个dNTP。在dNTP被添加到合成链上后，所有未使用的游离dNTP和DNA聚合酶会被洗脱掉。接着，再加入激发荧光所需的缓冲液，用激光激发荧光信号，并有光学设备完成荧光信号的记录，最后利用计算机分析将光学信号转化为测序碱基。这样荧光信号记录完成后，再加入化学试剂淬灭荧光信号并去除dNTP 3’-OH保护基团，以便能进行下一轮的测序反应。

特点

Illumina的这种测序技术每次只添加一个dNTP的特点能够很好的地解决同聚物长度的准确测量问题 (Homopolymer错误)，它的主要测序错误来源是碱基的替换，目前它的测序错误率在1%-1.5%之间。测序周期以人类基因组重测序为例，30x测序深度大约为1周。

补充

链特异建库

链特异性测序可以保留最初产生RNA的方向，目前最常用的dUTP
链特异性建库的方法首先利用随机引物合成RNA的一条cDNA链，在合成第二条链的时候用dUTP代替dTTP，加adaptor后通过尿嘧啶DNA糖基酶处理，将有U的第二条cDNA降解掉。尿嘧啶DNA糖基酶能够催化含尿嘧啶的单链和双链DNA释放游离尿嘧啶，对RNA无活性，这样最后的insert DNA fragment都是来自于第一条cDNA因此，以dUTP链特异性建库方式测序RNA的结果中，R1文件中read的方向和基因的方向（正义链）是相反的，而R2文件中的read2 方向和基因的方向是相同的。

双端测序

上样
flowcell是用于吸附流动DNA片段的槽道，测序就在此进行。lane上随机分布两种接头，p5‘（与P5互补），P7（与P7'互补），待测序列自带了p5接头和p7接头。序列只能一开始是利用p5接头互补，因为p7接头和lane是一样的。将构建好文库中的待测序列配置成一定的浓度通过flowcell，序列会在特异的化学试剂作用下，强力随机地附着在lane上，并与上面的短序列配对。上样的结果就是lane吸附住了冲过来的DNA，并且可以在表面进行桥式PCR扩增。要测序的是模版链p5 - p7，开始它与lane接头配对产生了互补链，后来强碱试剂作用下去杂，两条链被分开，由于模版链没有附着在lane上，模版链被冲走，但是互补链p5‘- p7‘ 依然稳稳固定在lane上。加入缓冲溶液，互补链的p7‘和lane上的p7互补（但还是一个lane中的），目的是快速扩增lane p7接头连接的链，也就是下图中的Forward Strand，它和模版链是一致的，后来测序的只用这一部分。PCR弯成桥状，一轮桥式扩增一倍，大约35个循环后，最终每个DNA片段都将在各自的位置上集中成束，这PCR是一群完全相同的序列，叫做cluster。桥式PCR目的在于实现放大单一碱基的信号强度，满足后期测序需求。桥式PCR完成后，形成了很多的桥形的互补双链，再次强碱解链。这一次不再进行复制，而是利用甲酰胺基嘧啶糖苷酶（Fpg）选择性的切掉lane 上p5‘ 连接的链，只留下了与lane p7连接的链即Forward Strand。

测序

首先primer结合到靠近p5的sequencing primer binding site1上，再加入特殊的dNTP--它的3‘ 羟基被叠氮基团替代，因此每次只能添加一个dNTP；还含有荧光基团，能够激发出不同颜色；在dNTP被添加到合成链上后，所有未使用的游离dNTP和DNA聚合酶会被洗脱掉；再加入激发荧光缓冲液，用激光激发荧光信号，光学设备记录荧光信号的记录，计算机将光学信号转化为测序碱基。
当信号被记录后，再加入化学试剂淬灭荧光信号并使dNTP 3’ 叠氮基团变成羟基，这样能继续向下进行再加一个，并且保证这个不再发出荧光。如此重复直至所有链的碱基序列被检测出，得到了Forward Strand序列。
循环结束后，read product被冲掉，index1 primer和链上的index1 互补配对，进行index1的检测。测完后，洗脱产物，得到index1 的序列。接下来p5与lane上的p5‘配对，测得了index2，并洗脱。
洗脱掉index2 产物后，还是一轮桥式扩增，得到双链，再变性得到原始Forward strand 和新的Reverse Strand，除去测完的Forward strand。然后和测Forward一样，也是先连接primer，只是连接的位点是Primer Binding Site2，测完后得到reverse strand序列。