【测序实验】二代测序文库读长的影响因素-实验角度简介

二代测序文库读长的影响因素-实验角度简介

一、现市场上,常见的文库长度种类
1)life的Ion Torrent平台:
该平台主要用于临床快速检测、产前诊断、疾病panl扩增子测序

PGM 测序仪:200bp、单端400bp、单端600bp(2017年发布)
Proton 测序仪:200bp

优点:测序时间短
缺点:通量低,价格较高

  1. illunima 测序仪平台全系列
    该平台占二代测序市场主要份额,主科研服务,随着测序仪器升级,测序时间的缩短,开始向临床推广。

Miseq :PE300 (向下兼容PE150)——目前illunima读长最长的测序仪器,常用于宏基因组16S双区扩增子测序
Hiseq 2500:PE250——长度较长,通量较Miseq大
Hiseq 3000、Hiseq4000、Nextseq 500:PE150
Hiseq Xten:PE150 (illunima的性能怪兽,10台测序仪器同时测序,数据量按T级别产出)
Novaseq :PE150 (继Hiseq Xten的升级版,测序时间大大缩短至72个小时完成,单台含2个通道,最新的,S4芯片可以每个通道产出2T)

优点:通量大,测序质量高,性价比高
缺点:测序时间相对于life平台长,测序长度相对于三代平台短

总结:仪器的读长,决定了文库构建时的插入片段的长度,如PE150,则表示可以测通300bp之内的插入片段、PE300,则表示可以测通600bp之内的片段


二、测序实验对文库片段的影响因素——起始模板的片段化

  1. 判断是否要进行起始模板的片段化
    1)如果模板的长度大于目前测序测序仪器的插入片段(>300bp或>600bp),则要进入片段化。
    如基因组DNA(一般病毒>10k,细菌>4M,动植物>100M或上G)——用于细菌、真菌、动植物基因组测序
    如mRNA、lncRNA(一般mRNA、lncRNA>2kb)——用于转录组、lncRNA测序

特点:
a. 文库构建的主峰呈正态分布,为保证所有样品都达到PE150,建库时,插入片段的主峰设为350bp,保证最大比例上,最短的序列也能达到300bp以上,可以获得更多的数据;
b. 该种建库方法,组学类型一般不需要overlap。

  1. 如果模板的长度小于目前测序仪器的插入片段(<300bp或<600bp),则不需要进行片段化。
    如宏基因组的16SV4V5双区扩增子测序(扩增产物长度400bp)、ITS扩增子测序(扩增产物长度350bp)
    如产前诊断、肿瘤诊断的游离DNA测序(DNA产物一般以核小体断裂单位,主峰为160bp)
    如micorRNA测序、外泌体小RNA测序(miR长度一般为22nt)

特点:
a. 文库构建的主峰呈单一柱状分布,根据插入主峰的长度,选择建库类型,如PE150,PE300,保证所有长度都能测通。
b. 该种建库的方法,组学类型一般都要求,确保有overlap,可以将插入的片段信息,完整还原为单条tags,才正确统计信息(表达量、拷贝数)的生物学意义。

  1. 文库片段化的方法选择
    物理法:
    冷冻超声波打断法——随机性最好,低成本,几乎能兼容所有物种基因组片段化。(默认)
    高Mg例子打断法——随机性较好,常用于转录组、lncRNA的片段化。(默认)

酶法:
DNA剪切酶——可能存在碱基偏好性,随机性较物理法差,操作快捷,用于基因组片段化。
RNA剪切酶——可能存在碱基偏好性,随机性较物理法差,操作快捷,用于转录组、lncRNA片段化。
转座酶法——不同的转座酶对物种的基因组大小,存在适用性。优点,可以一步同时进行片片段化和接头连接,操作快捷,常用于外显子测序、小型基因组测序(细菌)。


三、测序实验对文库片段的影响因素——建库的片段选择

  1. 目前的片段选择方法
    DNA磁珠法(DNA建库)
    RNA磁珠法、DNA磁珠法(建库时,RNA富集时使用RNA磁珠、经反转录后,DNA建库时,使用DNA磁珠)

注意:
a. 由于纯化磁珠的价格越来越低,技术也越来越成熟,目前建库进行片段时,均采用磁珠法,优点:回收率高,达80%以上,避免样品间污染,适合低浓度样品。
b. 目前市场上几乎不再采用切胶来进行片段选择,从2014年后,随着磁珠法的普及,切胶法建库及接近淘汰。缺点:回收率低、回收片段范围误差大,要求样品浓度高、极其容易出现样品污染、受环境污染。

切胶法的特例
a. 由于小RNA的含量低,建库后容易受到严重接头污染,且目标片段与接头举例非常近,磁珠法无法进行高精度片段选择,一般采用高分辨率的PAGE胶来进行切胶回收。
b. 对应靶标扩增的PCR产物存在严重杂带时,由于产物浓度高,条带清晰,可采用切胶法来进行目标片段回收。一般的宏基因组16S扩增,存在微量杂带时,使用磁珠法,便可以快捷回收。

  1. 片段选择的主峰设置及参数
    a. 对于不需要进行片段化的文库类型,靶标片段的主峰,就是文库插入片段的主峰,直接采用对应的低浓度的磁珠参数,一步将短片段去除即可。(去除引物二聚体、接头二聚体、纯化)

b. 对于需要进行片段化的文库类型,为了保证最短的插入片段也能达到测序的读长,最大获取数据量,因此,一般设PE150为350bp的插入片段正态主峰。测序时,Read1、Read2各测150bp,双拼接后Read存在空位,不影响分析。

如果想让Read1、Read2拼接后存在overlap,则设PE150为220bp的插入片段正态主峰,保证最长的插入片段也存在overlap。
如果想让Read1、Read2拼接中间的空位较大点,则设PE150为500bp的插入片段正态主峰,不影响测序质量。如插入片段严重超过500,会影响illunima的桥式PCR成簇和测序质量。

  1. 片段选择的正态分布峰获取
    a.首先,采用一步法参数磁珠回收,如去除200bp以上的所有片段,去除引物、接头二聚体,核酸由bufer溶液,转为存在于水溶液中。
    b.然后,使用两步法参数磁珠回收。第一步(去除400bp以上的片段),使用磁珠从大向小吸附大片段,将非磁珠吸附的上清溶液转移作为下一步的起始模板。第二步(保留300-400bp的片段),使用磁珠从大向小吸附,在有限的磁珠量下,控制为仅能吸附目标的插入片段文库,小片段在上清中去除。最终获得正态分布的文库峰。

以上描述的均按插入片段长度来描述

案例:
以下为PE150文库峰(约插入片段350+120bp双接头=470)

【测序实验】二代测序文库读长的影响因素-实验角度简介_第1张图片
5.png

【测序实验】二代测序文库读长的影响因素-实验角度简介_第2张图片
6.png

你可能感兴趣的:(【测序实验】二代测序文库读长的影响因素-实验角度简介)