Illumina测序原理

illumina二代测序平台特点:基于可逆终止的、荧光标记dNTP,实现边合成、边测序的工作
文字描述着实有很多局限性,文章起草基于这份视频(双端index),想要更轻松的阅读体验建议配合视频一起看:http://www.bilibili.com/video/av13107081/?share_source=copy_link&p=1&ts=1610448077&share_medium=iphone&bbid=a68e072c29d899785ac6735b234b9654](http://www.bilibili.com/video/av13107081/?share_source=copy_link&p=1&ts=1610448077&share_medium=iphone&bbid=a68e072c29d899785ac6735b234b9654)
注意⚠️:文章内容纯属个人见解,如有错误欢迎批评指正~

1. 文库制备

DNA文库的定义:所谓的DNA文库,实际上是许多个DNA片段,在两头接上了特定的DNA接头。

DNA文库的特点

  • 中间插入的DNA片段:是未知的各式各样的DNA片段,也正是测序仪要检测的序列片段
  • 接头序列:是人工特地加上去的,其序列是已知的

如何制作DNA文库:

文库制备过程

基因组DNA用超声波打断(也可以用通过酶切的方法)获得短的DNA片段,其粘性末端使用T4-DNA聚合酶补成平末端,然后用klenow酶在3'端加上polyA碱基(方便接头嫁接到DNA片段),最后,连接酶将特定的接头连接上去。连接好接头的DNA片段混合物,我们称为文库。


加入接头

2. 成簇反应

了解flowcell
flowcell(流动池)为一个载玻片大小的芯片,里面做了8条通道,通道的内表面做了专门的化学修饰:主要是用2种寡核苷酸(oligo)通过“共价键”种在玻璃表面-在flowcell通道有液体流动时不会轻易冲掉,这2种寡核苷酸(oligo)后面会和测序DNA文库的接头序列相互互补。

flowcell

1)文库片段附着到“flowcell上的oligo”
DNA文库两头的序列和芯片上的引物碱基互补,因此可以通过氢键力互补杂交。待测序的DNA片段通过氢键力与第一种oligo配对从而固定在flowcell上。
2)被文库片段附着的oligo延伸出互补的DNA链
加入DNA聚合酶和dNTP,flowcell上的oligo做引物,以文库片段为模版,合成出一条全新的DNA链(和原来的文库片段序列完全互补)
3)冲走文库片段
加入NaOH碱溶液,破坏氢键力,模版链(文库片段)被冲走,只剩下与芯片通过共价键连接的DNA链
4)通过“桥式PCR”将序列信息复制到第2种oligo
加入中性液体,中和碱液,创造可以产生氢键力的环境。
此时,第一种oligo所在DNA链上的自由端,会通过成桥的方式和flowcell上的第二种oligo互补配对(形成“单链桥”)。我们加入聚合酶和dNTP,聚合酶就沿着第二个oligo合成出一条新的链来(形成“双链桥”)。
5)DNA链线性化
加入NaOH碱溶液,破坏氢键力,“双链桥”解开(两个单链被固定在flowcell)
6)重复“桥式PCR”
再加入中性液体,中和碱液。DNA链的游离末端又和flowcel上新的oligo成桥,再加酶和dNTP,在尚未被占用的oligo上合成新的DNA链。
连续重复以上过程,DNA链的数量以指数方式增长
7)形成测序链
多次桥式PCR完成之后,实现了DNA文库序列在flowcell上的成倍扩增(实则是为了放大测序阶段的荧光信号)
后面要把合成的双链,变成可以测序的单链
方法:把反义链上的特定基团切断,即断开了反义链与oligo的连接,然后用碱溶液冲洗,被切断了的DNA链被冲掉,只留下通过共价键连接的正义链。
同时,DNA链的3'端被封锁,以防止与oligo的非特异结合。

3. 测序阶段

了解 可逆终止、荧光标记的dNTP

  1. 荧光标记的dNTP:不同碱基的识别信号(4种dNTP,每一种上面标的荧光素都不一样)
  2. 阻断基团:通过控制 3'羟基,控制碱基的合成节奏


    特殊的dNTP

1)read1读取
溶液状态:加入中性溶液,使其适应测序阶段。
所需原料:加入read1测序引物,荧光标记的dNTP,DNA聚合酶
测序过程:

  • 合成一个碱基:根据碱基互补的原理,DNA聚合酶将正确的dNTP合成到新的链上,合成一个碱基后即停止
  • 激光扫描:用溶液把多余的dNTP和酶冲掉,然后激光扫描,根据发出来的荧光判断它是那个碱基,根据碱基互补的原则,反推模版链上的碱基
  • 切掉荧光基团和阻断基团:加入化学试剂,把叠氮碱基和旁边标记的荧光基团切掉(暴露出3'羟基)
  • 加入新的dNTP和酶:又延长一个碱基,把多余的酶和dNTP冲掉,激光扫描判断碱基类型
  • 重复以上过程,把上百个碱基读出来(循环的次数取决于读长)
  • read1读完之后,读段产物会被碱液冲洗掉

2)读 index1 序列
因为测序仪的测序通量很大,一个样本用不到几百万条DNA,因此常常多个样本的DNA文库混在一起在同一条lane测序。而每一个样本,都有一个特定的索引序列相互区分(也就是我们常说的index序列)。

  • 加入index1引物,与模版碱基互补杂交
  • 与reads1的判读过程类似,加入荧光标记的dNTP和DNA聚合酶判读碱基,读完后用碱液冲洗掉

3)读 index2 序列

  • 3'端解除封锁
  • 正义链折叠结合到flowcell上的第2个oligo(形成“单链桥”)
  • 加入荧光标记的dNTP和DNA聚合酶,读取index2

4)读read2序列
形成反义链:
index2读完之后,聚合酶继续延伸,形成双链桥
然后加入碱液将DNA双链线性化
正义链上的特定基团被切除并洗掉,只留下反义链

加入read2的测序引物,与reads1的读取一样,重复测序步骤

4. 数据分析

测序获得的数百万个读段序列都通过 index序列 分离归类到对应的样本。

具有相似延伸碱基的reads被聚类在一起,正向和反向reads配对形成连续序列,它们与参考基因组比对,用于突变识别(variant identification)


突变类型的判读

你可能感兴趣的:(Illumina测序原理)