7种测序平台

1. illumina测序化学原理

2. HiSeq 测序仪工作原理

3. PacBio 单分子超长测序

4. Ion Torrent 测序

5. X10人全基因组测序

6. illumina 公司的Nano Well 测序技术

7.第一代DNA测序

 

1. illumina测序化学原理

今天的第一期节目,主要给大家介绍Illumina公司的技术。Illumina公司是当今最红火的二代测序公司。它的测序技术的最基本的原理,是基于可逆终止的、荧光标记dNTP来做“边合成、边测序”的工作

听起来有点拗口,接下来逐步为大家讲解。

Flowcell

7种测序平台_第1张图片

第一个要给大家讲的,是它这个flowcell。Flowcell翻成中文,就叫“流动池”。

我们来看这个图片。图片当中,我们看到一个象载玻片大小的芯片。这个芯片里面,是做了8条通道。在这个通道的内表面,是做了专门的化学修饰。它的化学修饰,主要是用2种DNA 引物,把它(2种DNA引物)种在玻璃表面。

 7种测序平台_第2张图片

这两种(DNA引物的)序列是和接下来要测序的DNA文库的接头序列相互补的。而且这2种引物是通过共价键,连到Flowcell上去。之所以要用共价键连到Flowcell上去,是因为接下来有大量的液体要流过这个Flowcell,只有有共价键连接的这些DNA,才不会被冲掉。

这就是Flowcell。

文库制作

再接下来,讲一下文库、和文库的制作(过程)

所谓的DNA文库,实际上是许多个DNA片段,在两头接上了特定的DNA接头,型成的DNA混合物。

文库有2个特点,第1个特点,是当中这一段插入的DNA,它的序列是各种各样的。第2个特点,它的两头的接头序列,是已知的,而且是人工特地加上去的。

要做这个文库,首先是把基因组DNA,用超声波打断。然后打断之后,两头用酶把它补平,再用Klenow酶在3’端加上一个A碱基。然后,再用连接酶把这个接头给连上去。

 7种测序平台_第3张图片

7种测序平台_第4张图片

7种测序平台_第5张图片

连好了接头的DNA混合物,我们就称为一个“文库”。英文也称作“library”。

桥式PCR

7种测序平台_第6张图片

 

做好了Library之后,就要做桥式PCR了。桥式PCR,实际上是把文库种到芯片上去,然后进行扩增,这样的一个过程。

这个过程,首先是把文库加入到芯片上,因为文库两头的DNA序列,和芯片上引物是互补的,所以,就会产生互补杂交。

7种测序平台_第7张图片7种测序平台_第8张图片7种测序平台_第9张图片

 

杂交完了之后,我们在这里面加入dNP和聚合酶。聚合酶会从引物开始,延着模板合成出一条全新的DNA链来。

新的这条链,和原来的序列是完全互补的。

接下来,我们再加入NaOH碱溶液。DNA双链在NaOH碱溶液存在下,就解链了。而且被液流一冲,原来的那个(模板)链,也就是没有和芯片共价连接的链,就被冲走了。而和芯片共价连接的链,就被保留下来。

 7种测序平台_第10张图片7种测序平台_第11张图片7种测序平台_第12张图片7种测序平台_第13张图片

 

然后,我们再在液流池里加入中性液体,主要是为了中和这个碱液,在加入中和液之后,整个环境变成中性了。这时侯,DNA链上的另外一端,就会和玻璃板上的第二种引物,发生互补杂交。

接下来,我们加入酶和dNTP,聚合酶就延着第二个引物,合成出一条新链来;然后,我们再加碱,把2条链解链解开;然后,我们再加中和液,这时侯,DNA链会和新的引物杂交。再加酶,再加dNTP,又从新引物合成出新的链来。

连续重复这一过程,DNA链的数量,就会以指数方式增长。

 7种测序平台_第14张图片7种测序平台_第15张图片7种测序平台_第16张图片

制备单链

在桥式PCR完成之后,接下来要做的工作,就是要把合成的双链,变成可以测序的单链。

办法是通过一个化学反应,把其中一个引物上的一个特定的基团给切断掉。

然后,再用碱溶液来洗这个芯片。这时侯,碱让DNA的双链解链,那根被切断了根的DNA链就被水冲掉了。留下那根共价键连在(芯片)上面的链。

 7种测序平台_第17张图片

接下来,再加入中性溶液,然后在这个中性溶液里面加入测序引物。

正式测序

好,接下来正式的测序工作就开始了。

那么,在测序的时侯,加入进去的,最主要是2个东西:一个是带荧光标记的dNTP。而这个dNTP,它还有一个特点,它的3’末端是被一个叠氮基堵住的。

然后,再加一个聚合酶,聚合酶就会选择:哪一个dNTP是和原来位置上的那个碱基是互补的,根据互补性原理,把这个dNTP合成到新的这个DNA链上去。

因为这个dNTP的3’端是被一个叠氮基团堵住了,所以,它一个循环只能延长一个碱基。然后,它就停在那儿了。

 7种测序平台_第18张图片

7种测序平台_第19张图片7种测序平台_第20张图片

 

合成完了之后,就用水把多余的dNTP和酶给冲掉。

冲掉之后,就放到显微镜下,去进行激光扫描。根据发出来的荧光来判断它是哪个碱基。

因为4种dNTP,它每一种dNTP上面标的荧光素都不一样,根据红、黄、蓝、绿,它出来的哪种颜色,那么,就可以倒过来推出来,这个新合成上去的碱基,是哪种碱基。

因为新合成的碱基,是和原来位置(的碱基)是互补的,所以,又推出模板上那个碱基是哪个。

这一个循环完成之后,就加入一些化学试剂,把叠氮基团和旁边标记的荧光基团切掉。切完了之后,3’端的羟基就暴露出来。

 7种测序平台_第21张图片

再接下来,加入新的dNTP和新的酶,然后,又延长一个碱基。新延长完一个碱基之后,把多余的酶和dNTP冲掉,再进行一轮显微的激光扫描,再读一下这个碱基是什么。

不断重复这个过程,可以重复上百次,到几百次,就可以把上百个碱基,甚至更多碱基的序列读出来。

7种测序平台_第22张图片

读Index

那么,什么是Index哪?是因为Illumina的评委会个测序量很大,往往一个样本,用不了那么几亿条DNA。所以,科学家就想了一个办法。在文库的接头上做了一些标记,每一个样本,它有一个特定的接头,每个接头里面,它有一段特定的序列。

这段特定的序列,我们就称为Index。也有人把它叫做Barcode,反正,表达的是一个意思:这么一段特定的序列,标记了样本的来源。

那么,要读这个Index的序列,先用碱把上面这根测完“Read 1”的序列,把上面这根DNA链给解链掉。

 7种测序平台_第23张图片

解链掉之后,再加入中性液,然后,加入“Read 2”这个测序引物。Read 2测序引物结合的位点,正好,就在这个Index序列的旁边。

接下来,就进行第2轮测序,一般来说,是读6到8个碱基。把这6到8个碱基读下来,我们就可以知道,这某一个具体的一段DNA,它来自于原始的哪个样本。

双端测序

 7种测序平台_第24张图片

这是Illumina的最核心的另外一个技术,就是双端测序。

那么双端测序,就是说,一根DNA链,除了从正向读一遍,还可以从DNA的负向,再读一遍。

这一下子就把Illumina测序的有效长度加了一倍。这是非常有实际用途的。

那么这个倒链的过程,是这样,先让这个DNA先合成,合成出来这根互补链。

有了这个互补链之后,用一个化学试剂,在原来这根链的根上切一下。切一下,原来这根模板链就掉了,剩下那根互补链。

再接下来,就进行第2端的测序。第2端的测序原理,和第一端的测序原理是一样的。

加上了“Read 3”的这个引物,依次往下,一个一个碱基地往下读。

 

大规模平行测序

7种测序平台_第25张图片

那么最重要的事情是什么呢?一个点,经过几百个循环,就读出了几百个碱基。但实际上,这个芯片上可以有上亿个点,上亿个“cluster”,也就是“簇”。那么上亿个“cluster”,每个循环,它都可以读出地么多序列,这是Illumina测序非常强大的原因。因为是成千上万,准确说是上亿上链都在合成,这个就得到了很大的一个测序数据量。

 

2. HiSeq 测序仪工作原理

上期节目,给大家介绍了Illumina测序的化学原理。这期节目,主要给大家介绍一下,Illumina HiSeq测序仪的工作原理。

也就是芯片上发生了这么多变化,HiSeq是如何把这些信息给读出来,并且把扫描出来的荧光信号,又通过怎样一系列的加工,变成可以识别的“A、C、G、T”的碱基序列的。

7种测序平台_第26张图片

HiSeq首先是一台高精度的显微光学扫描仪。然后再配上了一整套的液流系统,和计算机软硬件,再加温控系统,组成这样一台测序仪。

其中最核心,也是结构最复杂的,是它的光学系统。

前一期,我们讲了,Illumina测序仪主要是靠4种dNTP分别带有不同的荧光基团,在被激光照了之后,发出不同颜色的荧光。再通过对光的颜色的分辩,可以判断出到底是哪个碱基。

光路结构

我们先来说,它的光路结构。

这里,我们要说明一下:感光元件CCD,它本身是色盲。所以,它一定要配合滤光片,才能分辩出颜色来。

那我们先来看一下,HiSeq的光路图。

 7种测序平台_第27张图片

左边这两个元器件,就是激光器。一个发出红色激光,另一个发出绿色激光。

其中红色激光主要是激发A和C,这两种碱基上的荧光基团;而绿色激光主要是激发G和T,这两种碱基上的荧光基团。

红色和绿色这两束光,通过一面半透半反镜,组成一道激光。这道激光打在Flowcell上。

 7种测序平台_第28张图片

那么请注意,Flowcell就放在这个位置。

在Flowcell里面,结合在DNA上的那个荧光基团在激光的照射下,就发出荧光。

荧光通过3面半透半反镜,和1面全反镜,被分成4条光路,这4道光线,分别通过一道滤光片,这4张滤光片的滤过波长不一样。这样,这4 道光在经过了滤光片之后,就变成了4种颜色不同的光线。

然后,这4条颜色不同的光线,各自照在一面反射镜上,通过反射镜进入到CCD。这4个CCD就记录到不同颜色的光线。

7种测序平台_第29张图片

TDI线扫描

HiSeq的光线扫描是“线扫描”,和传统的相机不一样,传统的相机是面扫描。

HiSeq采取了一种特定的叫“TDI”线扫描方式,TDI是Time delayintegration的缩写。

在HiSeq上之所以采取TDI扫描方式,因为它有非常明显的优点。

第一个优点,就是它的扫描速度非常快,在HiSeq 2500上,从Flowcell的一个Lane的一头扫到另外一头,也就是一个“Swath”的扫描时间,大概只有20秒种不到。

第二个好处,就是它的扫描精度非常高。在最新的HiSeq V4版试剂上,它的光点密度,大概可以达到每平方毫米90万个点,要扫描清楚这么高密度的光点,扫描仪的扫描精度是可想而知的。

TDI扫描的第三个好处,是这种方式,可以把Flowcell的上表面、和下表面都扫描到。

Flowcell(测序芯片)

接下来,我们再要详细介绍这张Flowcell。

 7种测序平台_第30张图片

那么,先来看一下,这张flowcell有点象一张载玻片,在这一张片子里面,我们可以看到,

它做了8条通道。

每条通道,我们称为一个Lane。这8个Lane之间,相互是隔绝的。

每个Lane的两端各有一个小孔。这两个小也孔,就是液流流进、流出的地方。

 

你可能感兴趣的:(人工智能)