基因测序之常见测序类型整理

高通量测序(二代测序)

高通量测序技术(High-throughput sequencing,HTS)是对传统Sanger测序(称为一代测序技术)革命性的改变, 一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序技术(next generation sequencing,NGS )足见其划时代的改变, 同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能, 所以又被称为深度测序(Deep sequencing)。

Sanger法测序(一代测序)

Sanger法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。直到掺入一种链终止核苷酸为止。每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。由于ddNTP缺乏延伸所需要的3-OH基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止。终止点由反应中相应的双脱氧而定。每一种dNTPs和ddNTPs的相对浓度可以调整,使反应得到一组长几百至几千碱基的链终止产物。它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶片放射自显影或非同位素标记进行检测。

全基因组测序(Whole Genome Sequencing)

全基因组重测序是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法。随着基因组测序成本的不断降低,人类疾病的致病突变研究由外显子区域扩大到全基因组范围。通过构建不同长度的插入片段文库和短序列、双末端测序相结合的策略进行高通量测序,实现在全基因组水平上检测疾病关联的常见、低频、甚至是罕见的突变位点,以及结构变异等,具有重大的科研和产业价值。

de novo测序

de novo测序也称为从头测序:其不需要任何现有的序列资料就可以对某个物种进行测序,利用生物信息学分析手段对序列进行拼接,组装,从而获得该物种的基因组图谱。获得一个物种的全基因组序列是加快对此物种了解的重要捷径。随着新一代测序技术的飞速发展,基因组测序所需的成本和时间较传统技术都大大降低,大规模基因组测序渐入佳境,基因组学研究也迎来新的发展契机和革命性突破。利用新一代高通量、高效率测序技术以及强大的生物信息分析能力,可以高效、低成本地测定并分析所有生物的基因组序列。

全外显子测序(whole exome sequencing)

全外显子组测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。外显子测序相对于基因组重测序成本较低,对研究已知基因的SNP、Indel等具有较大的优势,但无法研究基因组结构变异如染色体断裂重组等。

RNA测序(转录组测序或RNA-seq)

转录组学(transcriptomics)是在基因组学后新兴的一门学科,即研究特定细胞在某一功能状态下所能转录出来的所有RNA(包括mRNA和非编码RNA)的类型与拷贝数。Illumina提供的mRNA测序技术可在整个mRNA领域进行各种相关研究和新的发现。mRNA测序不对引物或探针进行设计,可自由提供关于转录的客观和权威信息。研究人员仅需要一次试验即可快速生成完整的poly-A尾的RNA完整序列信息,并分析基因表达、cSNP、全新的转录、全新异构体、剪接位点、等位基因特异性表达和罕见转录等最全面的转录组信息。简单的样品制备和数据分析软件支持在所有物种中的mRNA测序研究。

small RNA测序

Small RNA(microRNAs、siRNAs和 pi RNAs)是生命活动重要的调控因子,在基因表达调控、生物个体发育、代谢及疾病的发生等生理过程中起着重要的作用。Illumina能够对细胞或者组织中的全部Small RNA进行深度测序及定量分析等研究。实验时首先将18-30 nt范围的Small RNA从总RNA中分离出来,两端分别加上特定接头后体外反转录做成cDNA再做进一步处理后,利用测序仪对DNA片段进行单向末端直接测序。通过Illumina对Small RNA大规模测序分析,可以从中获得物种全基因组水平的miRNA图谱,实现包括新miRNA分子的挖掘,其作用靶基因的预测和鉴定、样品间差异表达分析、miRNAs聚类和表达谱分析等科学应用。

微小micro RNA测序

成熟的microRNA(miRNA)是17~24nt的单链非编码RNA分子,通过与mRNA相互作用影响目标mRNA的稳定性及翻译,最终诱导基因沉默,调控着基因表达、细胞生长、发育等生物学过程。基于第二代测序技术的microRNA测序,可以一次性获得数百万条microRNA序列,能够快速鉴定出不同组织、不同发育阶段、不同疾病状态下已知和未知的microRNA及其表达差异,为研究microRNA对细胞进程的作用及其生物学影响提供了有力工具。

Chip-Seq测序

染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP)也称结合位点分析法,是研究体内蛋白质与DNA相互作用的有力工具,通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。将ChIP与第二代测序技术相结合的ChIP-Seq技术,能够高效地在全基因组范围内检测与组蛋白、转录因子等互作的DNA区段。

ChIP-Seq的原理是:首先通过染色质免疫共沉淀技术(ChIP)特异性地富集目的蛋白结合的DNA片段,并对其进行纯化与文库构建;然后对富集得到的DNA片段进行高通量测序。研究人员通过将获得的数百万条序列标签精确定位到基因组上,从而获得全基因组范围内与组蛋白、转录因子等互作的DNA区段信息。

CHIRP-Seq测序

CHIRP-Seq( Chromatin Isolationby RNA Purification )是一种检测与RNA绑定的DNA和蛋白的高通量测序方法。方法是通过设计生物素或链霉亲和素探针,把目标RNA拉下来以后,与其共同作用的DNA染色体片段就会附在到磁珠上,最后把染色体片段做高通量测序,这样会得到该RNA能够结合到在基因组的哪些区域,但由于蛋白测序技术不够成熟,无法知道与该RNA结合的蛋白。

RIP-seq测序

RNA Immunoprecipitation是研究细胞内RNA与蛋白结合情况的技术,是了解转录后调控网络动态过程的有力工具,能帮助我们发现miRNA的调节靶点。这种技术运用针对目标蛋白的抗体把相应的RNA-蛋白复合物沉淀下来,然后经过分离纯化就可以对结合在复合物上的RNA进行测序分析。

RIP可以看成是普遍使用的染色质免疫沉淀ChIP技术的类似应用,但由于研究对象是RNA-蛋白复合物而不是DNA-蛋白复合物,RIP实验的优化条件与ChIP实验不太相同(如复合物不需要固定,RIP反应体系中的试剂和抗体绝对不能含有RNA酶,抗体需经RIP实验验证等等)。RIP技术下游结合microarray技术被称为RIP-Chip,帮助我们更高通量地了解癌症以及其它疾病整体水平的RNA变化。

CLIP-seq测序

CLIP-seq,又称为HITS-CLIP,即紫外交联免疫沉淀结合高通量测序(crosslinking-immunprecipitation and high-throughput sequencing), 是一项在全基因组水平揭示RNA分子与RNA结合蛋白相互作用的革命性技术。其主要原理是基于RNA分子与RNA结合蛋白在紫外照射下发生耦联,以RNA结合蛋白的特异性抗体将RNA-蛋白质复合体沉淀之后,回收其中的RNA片段,经添加接头、RT-PCR等步骤,对这些分子进行高通量测序,再经生物信息学的分析和处理、总结,挖掘出其特定规律,从而深入揭示RNA结合蛋白与RNA分子的调控作用及其对生命的意义。

metagenomic(宏基因组)测序

Magenomics研究的对象是整个微生物群落。相对于传统单个细菌研究来说,它具有众多优势,其中很重要的两点:(1) 微生物通常是以群落方式共生于某一小生境中,它们的很多特性是基于整个群落环境及个体间的相互影响的,因此做Metagenomics研究比做单个个体的研究更能发现其特性;(2)Metagenomics研究无需分离单个细菌,可以研究那些不能被实验室分离培养的微生物。

宏基因组是基因组学一个新兴的科学研究方向。宏基因组学(又称元基因组学,环境基因组学,生态基因组学等),是研究直接从环境样本中提取的基因组遗传物质的学科。传统的微生物研究依赖于实验室培养,元基因组的兴起填补了无法在传统实验室中培养的微生物研究的空白。过去几年中,DNA测序技术的进步以及测序通量和分析方法的改进使得人们得以一窥这一未知的基因组科学领域。

细菌16s测序

16S rDNA基因存在于所有细菌的基因组中,具有高度的保守性。该序列包含9个高变区和10个保守区,通过对某一段高变区序列(V4区或V3-V4区)进行PCR扩增后进行测序,得到1500bp左右的序列。

细菌16S区域

16S测序主要研究群落的物种组成、物种间的进化关系以及群落的多样性。宏基因组测序在16S测序分析的基础上还可以进行基因和功能层面的深入研究(GO、Pathway等)。

与宏基因组的区别:16S测序得到的序列很多注释不到种水平,而宏基因组测序则能鉴定微生物到种水平甚至菌株水平。对于16S测序而言,任何一个高变区或几个高变区,尽管具有很高的特异性,但是某些物种(尤其是分类水平较低的种水平)在这些高变区可能非常相近,能够区分它们的特异性片段可能不在扩增区域内。宏基因组测序通过对微生物基因组随机打断,并通过组装将小片段拼接成较长的序列。因此,在物种鉴定过程中,宏基因组测序具有较高的优势。

扩增子测序?

扩增子测序是一种高靶向性方法,用于分析特定基因组区域中的基因变异。PCR产品(扩增子)的超深度测序可以有效地识别变异并对其进行特征分析。总体思路是靶向地捕获目标区域,然后进行新一代测序(NGS),分析测序结果,得到相应信息。

扩增子测序应用领域:

(1)癌症基因测序:靶向癌症测序侧重于一组精选的基因、基因区域或扩增子,它们与癌症有着已知的关联,预先设计的集合和定制集合都可用于研究目标靶向基因;

(2)疾病筛查:使用NGS可通过同时评估多个基因来发现遗传病的致病变异,与传统方法相比,使用NGS可降低成本,因为传统方法通常成本较高且不确定,同时需要大量测试;

(3)植物和动物测序:预设的基因组区域靶向重测序可以发现动物和植物中的基因变异,这些变异可能代表了有益的突变,可以帮助做出育种决策,还可能揭示与疾病易感性相关的突变。

靶向捕获测序

靶向测序是将感兴趣的基因组区域通过捕获试剂盒进行富集后进行测序的研究策略,根据不同的应用,利用较少的数据量就能得到超高的灵敏度和准确度,实现变异位点的快速筛选。相较全基因组测序和全外显子测序,靶向测序能够聚焦所关注的区域,去除冗余数据的干扰,同时最大限度地利用测序reads,测序成本低且测序深度深,尤其适用于在临床应用中样本量少时的选择。例如人类全基因组大小约为3Gb,外显子区域仅占2%(约60M),全基因组测序(WGS)深度一般为30X—50X,单样本数据产出为90Gb-150Gb,全外显子测序深度一般为100X-200X,数据产出为6-12Gb,而针对一个目标区域大小为2M的panel来说,测序深度2000X,数据量也仅为4Gb。

常见的靶向捕获测序方法主要有以下三类:

1.杂交捕获

杂交捕获测序是针对感兴趣的目标区域,基于碱基互补配对原理,设计合成核酸探针,对DNA文库进行目标区域杂交富集,并进行测序。其中杂交捕获探针可以与目标区域全部互补,也可以是部分互补。根据杂交介质的不同,可分为固相杂交和液相杂交。

目前NGS应用最广泛的还是液相杂交,将生物素探针、封闭液、DNA在液相环境下进行杂交,使用链霉亲合素磁珠进行富集,通过洗涤除去非特异性结合的核酸,随后对纯化后的文库扩增富集,并进行测序。液相杂交捕获测序可适用于几kb到上百Mb的基因组目标区域的检测,可检测SNV,InDel,CNV,SV,基因融合等。

市面上常用的杂交捕获探针厂家有roche,Agilent,IDT,twist等。在探针设计时,需要评估覆盖位置的序列特征,如果探针有很多落在重复序列区,或者高拷贝序列区,则探针会结合较多的非目标区域。设计更加特异性的探针则可以有效减少非特异序列的结合,提升捕获特异性。

2.多重PCR

多重扩增子测序即针对感兴趣的目标区域,设计多重PCR引物进行扩增富集并进行测序的技术。通常适用于检测几十到几千个位点,或几十kb以下的区域。

3.分子倒置探针

分子倒置探针(MIP)技术其原理是设计一个口袋状探针,H1和H2能和目标区段退火,然后利用DNA聚合酶将探针缺口补齐,同时添加DNA连接酶,将缺口处磷酸二酯键连接,即可构成一个完整的环状探针。然后通过外切酶将游离的探针消化,完整的探针包括目标区段的序列,利用通用序列(H1、H2之间序列)作为后续文库构建的引物(可添加index和测序引物),扩增产物可以直接作为二代测序文库。

这种方法的优势是特异性好而且捕获完成后的片段直接完成了建库(杂交捕获后还需要构建测序文库,主要是添加Index和测序接头),劣势就是捕获效率很低。

单细胞测序 

单细胞测序技术是指能够在单个细胞的水平上,对基因组或转录组进行高通量测序分析的一项新技术。与传统高通量测序相比,单细胞测序不仅能够分析相同表型细胞的异质性,还能获取难以培养微生物的遗传信息以及珍贵的临床样本的信息,具有广阔的应用前景。

细胞是生命的单位,目前大部分的基因检测均是从组织中抽提DNA 来进行测序,得到的实验结果往往是细胞群体中信号表达的均值,是对细胞群体进行整体表征,或者只代表其中在数量上占优势的细胞信息,单个细胞独有的细胞特性往往被忽略。

而大量研究发现在同一器官或组织的相同类型细胞也表现出显着的异质性,每个细胞都有其独特的表达模式。例如实体瘤样本的总RNA,一半以上来源于非癌细胞(成纤维细胞、淋巴细胞、巨噬细胞等),使得癌细胞的信号可能被隐藏。因此,采用均值对单个细胞进行表征是不合适的,可能会丢失许多关键信息。因此,随着细胞分选和测序技术的进步,单细胞测序应运而生。

你可能感兴趣的:(基因测序之常见测序类型整理)