NGS006 illumina测序

illumina平台杂交捕获流程介绍

NGS流程(以Nanodigmbio的杂交捕获方案为例)

NGS流程图

建库原理介绍

建议此部分可以参考一些文献及商品化试剂盒进行了解

片段化

DNA片段化主要是通过物理方法(如超声打断,雾化等)或酶学方法来实现的
-超声法可以得到比酶切法更窄的DNA片段分布,酶切法虽不如超声打断集中,但是操作过程更经济便捷,且损失的样本更低。
-一般来说,对于裸露的DNA进行片段化不易引起较大的偏倚,但是需要注意的是,CHIP seq中,染色质的超声打断具有偏好性,也即常染色质比异染色质更容易被超声剪切。
-酶切法有一定的偏好性(容易切割AT),因此酶切法制备的片段化文库可能会存在GC含量轻度升高,以及形成扔造成的插入及缺失。

1.超声打断

-Covaris样品制备是基于专利的Adaptive Focused Acoustic(AFA)技术。它利用几何聚焦声波能量,通过>400kHz的球面固态超声传感器将波长为1mm的声波能量聚焦在样品上。这个过程是在等温的条件下进行的,配合专门设计的AFA管,Covaris仪器可精确地将DNA和RNA打断成100-1500 bp片段(microTUBE),或2-5 kb片段(miniTUBE)。对于那些需要更长DNA片段的测序应用,Covaris还开发出专利的g-TUBE。这种管通过离心产生剪切力,能产生6-20 kb的片段。

2.酶切法打断
  • DNase I(Deoxyribonuclease I):中文名称为脱氧核糖核酸酶I,是一种可以消化单链或双链DNA产生单脱氧核苷酸或单链或双链寡脱氧核苷酸的核酸内切酶。DNase I水解单链或双链DNA后的产物,5'端为磷酸基团,3'端为羟基。DNase Ⅰ酶切底物DNA通常依赖于钙离子,并能被镁离子或二价锰离子激活,在镁离子存在条件下,DNase I随机剪切双链DNA的任意位点;二价锰离子存在条件下,DNase I可在同一位点剪切DNA双链,形成平末端,或1-2个核苷酸突出的粘末端。DNase Ⅰ在不同的离子存在下可以片段化dsDNA,然后实际操作中却易受到多种条件的影响,如酶的用量,反应温度,底物DNA的纯度等。此外研究发现DNase Ⅰ对嘧啶核苷酸旁边位点有偏好性,大大影响终文库的多样性。
  • 核酸内切酶 V 是在E. coli 中发现的一种 DNA 修复酶。其识别脱氧肌苷(脱氧腺苷在DNA中的脱氨基产物),对错配的脱氧肌苷3´ 端第二个磷酸二酯键进行切割,产生一个 3´ 羟基、5´ 磷酸的切刻。除此之外在较小程度上可以识别AP位点,基因错配的DNA位点,插入/缺失不匹配等位点。
  • dsDNA fragmentase:以NEBNext dsDNA fragmentase为例,其实为两种酶的混合物(创伤弧菌核酸酶突变蛋白质,T7核酸内切酶突变蛋白质),前者在dsDNA双链上随机制造缺口,后者则会在缺口处剪开互补链,造成双链断裂。
  • 转座酶:Illumina的Nextera技术,利用一种转座酶能同时完成DNA片段化和接头的添加,从而减少样品处理,并节约时间。据了解,利用Nextera DNA样品制备试剂盒,测序即用型文库可在90分钟内产生,且手动操作仅需15分钟。

末端修复加A

1. 原理
  • 打断后的DNA片段,需要修复DNA链中存在的缺口,处理片段两端的粘性末端(3’端切除,5’端补平),随后对双链的5’端进行磷酸化。
  • 由于酶均为蛋白质,保存buffer主要成分含tris-HCl,BSA,NaCl,KCl,MgCl2,DTT,甘油等,tris主要用于稳定pH,DTT则具有强还原性可以用于保护蛋白中的巯基,BSA可以提高酶活性,高浓度盐粒子主要用于中和核酸骨架的负电荷,Mg2+则是因为其是部分酶的激酶。
2.组分
文献1 末端修复体系

文献1 加A体系
  1. Klenow fragment:最适温度37℃,其5’→3’ DNA聚合酶活性用于5’凹端的补平,5’→3’外切酶活性用于5’凸端的切除。
  2. T4 DNA ligase:最适温度16-20℃,用于修复DNA链中缺口磷酸二酯键
  3. T4 PNK:最适温度37℃,催化NTP的γ为磷酸向DNA,RNA及oligo的5’-OH进行转移,主要用于DNA fragment 5’末端磷酸化,进而与3’-OH形成磷酸二酯键。
  4. Taq DNA polymerase:最适温度约65℃,TaqDNA聚合酶具有5’→3’ DNA聚合酶活性及5’→3’外切酶活性,而并没有3’→5’外切酶校正活性(需要注意的事高保真taq聚合酶具有3’→5’外切酶校正活性)
  5. dATP:用于3’末端加A

接头连接

接头的分类

  • 根据Index位置可以将接头分为单端Index接头和双端Index接头。单端Index接头指的是仅在P5端或P7端存在Index(一般在P7端),双端Index接头指的在P5和P7端均存在Index。


    IDT TSHT 单端index接头

    IDT UDI 双端唯一index接头

    IDT xGen® Dual Index with UMI 3合1接头

    IDT xGen® Duplex Seq Adapters 双端UMI
  • 根据接头是否匹配PCR free建库可以将接头分为长接头(图4,图5,图6)和短接头(图7)。长接头又称为完整接头,包括P5/P7+Index序列+Read 1/2,完整接头通过TA克隆的方式连接到DNA片段之后,可不进行PCR扩增反应直接上机测序(DNA量足够上机测序时可直接上机,当DNA量不够时还需进行PCR扩增使得产物达到一定的量方可上机测序)。短接头通过TA克隆方式连接到DNA片段上后,必须与短接头互补的引物进行PCR扩增,扩增产物就是包含完整接头的DNA片段。也即短接头最终一定要通过PCR扩增成为完整接头才能上机测序。


    illumina Y型接头

    MGI泡状接头

连接过程

连接原理

主要利用连接酶,在AT接头配对以后,连接接头与DNA片段之间的磷酸二酯键,一般连接buffer主要成分为高浓度盐粒子及PEG,其中高浓度盐粒子左右为中和磷酸骨架的负电荷,使得核酸容易聚集,而PEG可以夺取核酸骨架的水分子,促使核酸分子聚集,另外还可以增加溶液的粘度,使得纯化磁珠不易沉降。连接后的接头产物需要经过纯化,避免对下一步的PCR扩增造成影响

连接流程

接头连接及PCR

连接体系

文献1 连接体系

磁珠纯化

  • 磁珠法目前已广泛的应用核酸纯化,磁珠的主要结构有三层,分别是最内侧的聚苯乙烯内核,中间层的Fe3O4,已经最外层的官能团修饰的高分子材料,而官能团的不同则决定了磁珠的功能不同,如提取,生物素捕获,片段筛选等。
  • NGS使用最多的还是贝克曼AMPure XP Beads。XP磁珠采用SPRI技术(固相可逆固定化技术),在较高的PEG及盐离子存在的条件下,核酸可以脱去水化层,DNA胶体的热力学稳定性及构想被破坏,导致大量带负电荷的磷酸集团暴露出来,通过Na+与磁珠的羧基集团形成电桥,进而被吸附在磁珠表面。而磁珠则因为内核的顺磁性,可以通过外加磁场进行富集。
  • 磁珠体系的主要成分是磁珠,聚乙二醇(PEG),NaCl以及一些辅助成分。
    PEG主要作用为脱去一些亲水性生物大分子的水化层,以及增加buffer的粘性,避免磁珠沉降,在DNA连接反应中也可以用于提高连接效率。PEG的分离效果受温度及pH的影响,所以在磁珠使用之前需要平衡至室温。另外不同分子量的PEG效果也有差别。
    高浓度的盐离子则是为了中和核酸的负电荷,使得核酸更容易凝聚。
  • 在磁珠体系中,还会加入一些润滑剂,如Tween 20,可以有效地减少磁珠的残留。

Pre-PCR

文献1 PCR体系

文献1 PCR引物

此步骤需要注意的是,如果使用的是PCR free接头,则使用Universal P5/P7 Primer进行预文库扩增;如果使用的是通用PCR amplification接头,则需要使用相应的indexing P5/P7 Primer进行预文库扩增。一般根据投入量及接头连接效率进行估算PCR扩增循环数,接头连接效率一般在30%左右,磁珠纯化回收率约在70%,默认PCR扩增效率为100%,计算能够达到1500ng预文库产量的循环数(通常1500ng预文库足够两次捕获的投入量,尽可能控制较少的循环数避免引入PCR偏差)

液相杂交捕获

液相杂交分类

吸附杂交:磁珠吸附杂交,亲和吸附杂交,羟基磷灰石杂交
发光液相杂交

温度选择

  1. 杂交温度
    杂交技术最重要的因素之一就是选择合适的杂交温度通常杂交反应温度低于Tm 10-15℃时,高度同源的碱基序列可以形成稳定的杂交链。一般情况下,在不含甲酰胺的体系中,杂交反应都是在65℃进行,当含有50%的甲酰胺时,在42℃进行杂交。
  2. Tm影响因素
    综合来说影响Tm值的两个核心因素就是“氢键”及“离子键”,只要是能够影响这两个因素的都可以影响到Tm,比如:
  • DNA的大小及碱基组成
  • buffer中的盐离子可以与核酸的磷酸骨架形成离子键,增加Tm
  • pH
  • 变性剂

捕获探针选择

  1. 分类
    目前NGS应用较为广泛的探针主要有:
  • IDT探针:DNA探针,长度为120mer,探针设计为end to end tilling
  • Roche探针:DNA探针,长度为60-90mer
  • Agilent探针:RNA探针,长度为120mer
    通常RNA探针效果更优,因为DNA-RNA杂交链更稳定。探针的长度在100bp左右时,捕获效率更好。

杂交反应时间选择

杂交反应时间太短,则杂交效率较低;杂交反应时间太长,则会形成大量的非特异性结合产物。所以一般杂交反应时间在16-20h,杂交反应的温度一般低于Tm 5-12℃(100bp左右的探针Tm约在80左右,参考3.2)

杂交严谨性

  • 杂交体系中,避免非同源或者部分同源的核酸序列形成杂交复合物的严格程度
  • 影响杂交体系的稳定性因素决定了杂交反应体系的严谨性,一般认为低于杂交体系20度杂交效果最优(这只是个经验值,具体温度需要试验验证)
  • 可以根据经验公式计算杂交体的Tm值,随后通过调节盐离子浓度,pH,甲酰胺浓度,以及杂交温度等来控制杂交的严谨性。

文库杂交捕获流程(参考文献1,文献2)

杂交buffer 组分

文献1 杂交buffer成分
  • 10×SSPE buffer:SSPE缓冲液(20×,pH7.4)主要由氯化钠、磷酸盐、EDTA等组成,主要用于RNA杂交(如Northern印迹)、DNA杂交(如Sorthern印迹)等核酸杂交
  • 10×Denhardt’s solution:主要作为杂交封闭剂,用于封阻非特异性结合,50×Denghardt’s solution主要成分为1%聚蔗糖(Ficoll 400),1%聚乙烯吡咯烷酮(pvp),以及1%牛血清白蛋白(BSA)
  • 10mM EDTA
  • 0.2% SDS

封闭剂

文献1 封闭组分

文献1 block oligo
  • Human cot1 DNA:主要用于封阻基因组中一些高度重复的序列
  • Universal block oligo:主要用于封阻接头序列(与接头序列反向互补)
  • 鲑鱼精DNA:保护cot1 DNA及block oligo,防止其被降解。

探针

文献1 探针组分
  • Probe:RNA探针
  • RNA酶抑制剂

洗脱液

  • SSC(saline sodium citrate)缓冲溶液是分子生物学中最标准的印迹和杂交处理溶液,旨在用于各种杂交实验达到变性和清洗的目的,主要成分为氯化钠和柠檬酸钠。SSC缓冲液中柠檬酸钠起缓冲作用,盐离子(Na )中和核酸主链上的负电荷,使其呈电中性,这样可以使探针和靶序列的结合比较容易进行。也用于SDS-PAGE电泳分离胶配制。用于核酸杂交,不同浓度作用不同:
    2×SSC:高盐洗膜,洗去部分非特异性结合的探针。
    0.5×SSC:低盐洗膜,增加核酸链的严紧性,使得 RNA/DNA 之间的排斥力增加。
  • SDS是一种阴离子去垢剂,它的主要作用有:①溶解细胞膜上的脂肪与蛋白,因而溶解膜蛋白而破坏细胞膜;②解聚细胞中的核蛋白,使蛋白质与DNA分开;③SDS能与蛋白质结合成为SDS-蛋白质复合物,使蛋白质变性而沉淀;④SDS能抑制核酸酶的作用,防止对DNA的降解。
  • 洗脱过程中,预杂交的目的是将硝酸纤维素膜上的非特异结合DNA位点使用与目的DNA同源性较差的分子(鲑鱼精DNA或者牛血清等)进行封闭,洗膜则是为了将未能特异性结合的DNA分子洗脱;预杂交、杂交两者处理温度相同,可以确保在目标DNA的杂交温度(约为Tm值-10℃)条件下,非特异性位点能够充分封闭,从而提高实验准确性;洗膜温度可以与杂交温度相同,也可进行梯度洗脱,总的来说,离子强度大,洗脱温度高,则实验精确性越高.
  • Beads wash buffer:1×TE + 1M NaCl(文献1使用M-280链霉亲合素磁珠


    文献1 磁珠洗涤液
  • Low stringency buffer:1×SSC + 0.1% SDS;室温孵育15min


    文献1 低严谨性洗脱液
  • High stringency buffer:0.1×SSC + 0.1% SDS;65℃,10min,重复洗涤共三次。


    文献1 高严谨性洗脱液
  • 0.1N NaOH变性,室温孵育10min,去上清
  • 1M Tris-Cl中和NaOH后即可进行纯化

illumina测序

簇生成过程

  • 文库结构


    illumina文库结构
  • 测序流程


    illumina测序流程

测序

  • 单端index测序(all plateforms)


    单端index测序流程
  • 双端index测序(Hiseq 2500,Miseq,Novaseq)


    image.png
  • 双端index测序(Nextseq,Miniseq,Hiseq 3000/4000)
    image.png

测序仪

  • 各种仪器介绍


    image.png
  • Flowcell


    image.png

Reference

  1. Blumenstiel B, Cibulskis K, Fisher S, et al. Targeted exon sequencing by in‐solution hybrid selection[J]. Current Protocols in Human Genetics, 2010, 66(1): 18.4. 1-18.4. 24.
  2. Gnirke A, Melnikov A, Maguire J, et al. Solution hybrid selection with ultra-long oligonucleotides for massively parallel targeted sequencing[J]. Nature biotechnology, 2009, 27(2): 182.

你可能感兴趣的:(NGS006 illumina测序)