主要内容:
1.16S rDNA测序
2.宏基因组测序
3.宏基因组的由来及发展过程
4.16S rDNA测序与宏基因组的优势和局限性
5.16s rDNA测序与宏基因组技术差异
—————————————————————
1. 16S rDNA测序
1.1 什么是16S rDNA测序
16S rDNA测序技术:目前,主要指基于高通量测序技术,完成16S rDNA部分或全部基因序列,用于解释样本中或样本组间物种分布、丰度、差异、进化等关系。
同时,还可以利用真菌18S、ITS和功能基因(Gene Family)完成类似的研究。
1.2 为什么选择16S rRNA基因
①16S rRNA基因的序列有10个保守区和9个高变区(V1-V9:长度分布范围约30~100bp)之分。
②保守区为所有细菌共有,细菌间无差别,能反映生物物种的亲缘关系,可变区具有属或种的特异性,序列则随菌间的亲缘关系不同而有一定的差异,所以能揭示生物物种的特征核酸序列,被认为是最适于细菌系统发育和分类鉴定的指标。
③根据保守区设计引物位点,扩增可变区获得的序列可以用于菌种鉴定。一种快速、廉价的菌种鉴定方法。
④16S rRNA基因测序随后被发现能够将细菌分类到新种,甚至新属中。
⑤用来描述从未被成功培养的新物种。
说明:16S rDNA=16S rRNA Gene
2.宏基因组测序
2.1 什么是宏基因组测序
宏基因组测序:目前,是指基于高通量测序技术,研究收集到的来源于特定条件下环境样品的所有遗传物质。
2.2 宏基因组与16S rDNA测序之间的“相爱相杀”
从宏基因组的严格定义来说,宏基因组的概念是不包含仅分析现有环境样品中部分基因(例如:16S rRNA)的研究,因为针对部分基因的研究并没有提供环境中所有遗传物质潜在的信息。然而,针对这些部分基因群落谱系研究又经常和这种严格定义的“真实”宏基因研究形成互补
2.3 “广义” 和“狭义” 宏基因组
广义宏基因组:是指特定环境下所有生物遗传物质的总和,它决定了生物群体的生命现象。它是以生态环境中全部DNA作为研究对象,通过克隆、异源表达来筛选有用基因及其产物,研究其功能和彼此之间的关系和相互作用,并揭示其规律的一门科学。
狭义宏基因组:则以生态环境中全部细菌和真菌基因组DNA作为研究对象,它不是采用传统的培养微生物的基因组,包含了可培养和不可培养的微生物的基因,通过克隆、异源表达来筛选有用基因及其产物,研究其功能和彼此之间的关系和相互作用,揭示其规律。
※由于狭义宏基因组学概念的对象具体、范围局限和研究目标明确,一般文献上所提的宏基因组学,除非特别指明,一般均指的是狭义宏基因组学。
3.宏基因组的由来及发展过程
3.1 宏基因组发展过程—纯培养认识微生物
传统的微生物学研究对象是由基因相同的细胞组成的纯微生物培养物,这些细胞是通过繁殖分离出的单个细胞获得的。
20世纪微生物学提供的有关微生物代谢途径和生化过程多样性的所有知识都是通过对纯培养物的分析获得的。
随着培养技术的发展和不同微生物的纯培养物的建立,使用微生物、生化和遗传方法对其进行鉴定,产生了具有代表性的微生物集合,并最终加深了对微生物在生物圈中作用的理解。
3.2 宏基因组发展过程—基因组水平认识微生物
DNA作为遗传信息载体的开创性发现,标志着生物体的所有属性都在基因组中被加密,20世纪中叶分子生物学的兴起催生了基因组微生物学。
分子方法在微生物学中的第一个标志性应用可追溯到20世纪70年代末,当时Carl Woese在比较16S核糖体(r)RNA的基础上,提出了一个通用的原核生物系统发育系统。
基因组测序技术的发展,特别是21世纪中叶的二代测序技术的发展,导致了微生物学中所谓的“基因组革命”,使得全基因组测序成为常规,不仅适用于一些研究良好的模式生物如大肠杆菌,也适用于多种微生物。因此,基因组测序已成为分析纯培养新微生物的主要方法。
3.3 宏基因组发展过程 —基因水平表征微生物(微生物生态学)
一开始,环境微生物学的技术基础是将微生物群落分离成单个微生物物种的纯培养物,然后对其进行生理和生化表征。然而,尽管有着一百多年的微生物培养历史,大多数生活在自然环境中的微生物并没有作为纯实验室培养物被分离出来。
早在1933年,Arthur Henrichi就指出:“人们早就知道,细菌学的标准方法—纯培养—在人工培养基上分离和观察—往往只产生对某一特定微生物区系的不完全了解。”特别是,他在淡水湖中发现了不同的形态不典型的细菌,这些细菌是那时还没有作为纯培物被分离。
当rRNA测序和直接从环境中获得的相应基因开始用于微生物多样性的表征时,微生物生态学进入了一个新的阶段。
3.4 宏基因组的发展过程—不可培养微生物的认知
这些研究使人们认识到,通常只有不到1%的天然微生物可以在实验室条件下培养,未培养的物种不仅是微生物群落的主要组成部分,而且可以在生态过程中发挥关键作用。
Woese首次提出原核生物系统发育系统的时候,只有12个细菌门和古细菌门被确认,并且它们都可被培养,这些早期研究的结果以及现有的rRNA测序技术清楚地表明,我们离了解微生物世界真正的系统发育多样性还很遥远。
对不同自然生态系统的分子研究揭示了细菌和古细菌的一些新的系统进化谱系,只有一部分是可培养的,根据最近的估计,培养的微生物占原核生物真正系统进化多样性的比例不到20%。尽管未培养的微生物在地球上重要的生物地球化学过程中起着重要作用,并且在海洋、土壤、沉积物、动物微生物群和其他生态系统中非常丰富,但它们的表征仍不尽人意。为了强调支配生命的未培养微生物的范围和意义,提出了“微生物暗物质”一词。类比天体物理学中的暗物质。
3.5 宏基因组的诞生
对微生物系统发育多样性的描述,回答了“谁在这里?”“这只是微生物群落研究的第一步。更困难的任务是评估特定微生物的功能活动和生态作用,也就是说,回答“他们能做什么?”“与培养微生物的基因组测序(可预测其代谢潜能)类似,对微生物群落的集合基因组(宏基因组)进行分析,可提供有关整个群落及其每个成员(包括未培养物种)的功能特征的信息。
二代高通量测序(NGS)技术的发展使基因组研究发生了革命性的变化,因为它们在短时间内实现了大规模的平行测序,从而以更低的成本产生了数量级以上的核苷酸序列,使复杂环境群落的亚基因组研究即使是小型实验室也能负担得起。因此,有可能对动物和人类微生物群、牛瘤胃、土壤、海水和沉积物等复杂微生物种群进行综合表征。
4.16S rDNA测序与宏基因组的优势和局限性
4.1 16S rDNA测序的优势
①16s rRNA基因是核糖体翻译mRNA的亚基和必要部件,广泛存在于细菌和古菌中,其他常用Marker基因,并不是在所有活体微生物中存在。
②16S rRNA基因包含高度保守区适合设计PCR通用引物,用于目标区域的扩增。V1-V3和V1-V4提供属水平测序解决方案,比其他区域更能获得精确的微生物物种注释和评估。
③研究优良引物,可以高度特异地扩增细菌。
④完善的参考序列数据库和分类,更好地进行序列间的比较和分类学的比对。
⑤成本低廉、成熟且简单化的分析流程。
4.2 16S rDNA测序的局限性
①通过PCR扩增测序rRNA Markers,由于PCR相关的各种偏向性,可能漏检OTUs或分类;在引物和扩增问题上,可能导致在一个群落内,微生物多样性降低。
②16S rRNA测序高估菌群多样性或物种丰度,因为人为测序导致的测序错误、扩增子拼接错误、序列OTU划分归属错误且在大多数微生物中,16S位点在远缘类群间的转移或16S 拷贝数的变异。另外,这种高估往往很难识别。
③扩增子测序更关心微生物群落物种分类的组成,并不能够直接分析与物种分类相关的生物学功能。
④扩增子测序仅能分析分类信息遗传标记已知且可扩增类群。分析新型或高度变化的微生物存在一定困难(例如:病毒和真菌)。
⑤16S rRNA测序方法缺少金标准:质量控制、过滤和统计分析的指导指南。
4.3 宏基因组的优势(Why Metagenomics)
宏基因组与二代测序在实现中紧密相关,其特征是每个样本的核苷酸测序深度。
对样本的深入了解从“什么是高丰度的” 或者“最重要的是什么?”的传统思维,转变成“存在和潜在重要的什么?可能影响情况和结果的是什么?”
科学家和公众正在接受这样一个事实,即人类是超级有机体,同时拥有人类基因组和微生物基因组,后者的规模和多样性要大得多,是个人健康的关键。现在是研究人类及其相关微生物群之间错综复杂的关系以及这种关系如何调节或影响双方的时候。这些观点可以扩展到动植物界,并从整体上扩展到地球的生物群落。根据其性质,地球上所有生物群落的进化和功能都受到微生物(浮游生物、生物膜或与宿主相关的)与周围物理环境之间无数相互作用的影响。
宏基因组学的一般定义是在给定的环境中,基于采样,对微生物群体基因组的遗传信息进行不依赖于培养方式的独立分析。它的重点是通过测序收集遗传信息,测序可以针对DNA、RNA或两者。后续的分析可仅集中于序列保存、系统发育、系统基因组、功能或遗传多样性代表基因,包括尚未注释的基因。宏基因组能够证实的假设、解决的问题和实现目标是无止境多样化的。宏基因组实验初步设计是基于待分析“材料” 的性质及其主要作用。
4.4 宏基因组的局限性
核酸提取的全面性和文库的构建质量决定宏基因组分析结果的准确性和可靠性;
宏基因组是解决宏观分子生态学或微生态学的有力工具,但发掘到感兴趣的目标基因如何进行后续表达研究或验证存在一定阻碍;
目前集中在原核生物的研究较为集中,真核生物的研究相对较少。
生物信息分析中,目前很难或甚至不可能组装非常长的Contigs,因此,很难或不可能确定非常复杂微生物群落或包含多个密切相关物种的微生物群落中单个物种的高质量复杂基因组。
5.16s rDNA测序与宏基因组技术差异
5.1 不同方法学阐述的问题
5.2 基于功能的宏基因组
针对从环境中分离的总DNA进行宏基因组分析可以使用两种概念上不同的策略来进行,第一种是所谓的功能性宏基因组,它评估人们感兴趣的生化和代谢活动,其基础是通过克隆将群落DNA的随机大型片段插入并保持在载体(Cosmids、Fosmids等)中,以生成一个表达文库,然后筛选与特定底物靶向反应的物质。在这种情况下,允许选择生态系统用于分析识别具有所需特征酶 ;
功能基因组学被成功地应用于鉴定不同的抗生素、水解酶、抗生素抗性基因和许多其它功能
5.3 基于功能的宏基因组局限性
功能活性的范围仅限于可用筛选系统识别的活性;
并非所有的基因,特别是那些来自系统发育上较远的未培养生物体的基因,都能在大肠杆菌等标准宿主中高效表达;
宏基因组文库有一个大小限制。
5.4 基于测序的宏基因组
功能性宏基因组学的替代方法是基于测序的宏基因组学,它涉及对整个环境DNA进行大规模测序,随后通过生物信息学方法进行基因搜索和功能注释,通常是通过与已知序列的同源性比较。该策略更加有效,因为它提供了由宏基因组展示的所有潜在微生物的信息,而不是功能筛选所针对一组有限的微生物,它提供了可扩展的和可独立于高通量筛选系统的应用等优点。
然而,类似于可培养微生物的基因组测序,这种方法依赖于现有的基因的注释,这限制了从根本上识别潜在编码新功能基因。
在数据库中积累大量新数据和发展更复杂的生物信息学方法,促使基于测序的宏基因组作为感兴趣的功能活性筛选应用中可选择的方法之一。
基于测序的宏基因组,也提供了一种基于群落功能、群体功能差异化比较以及功能菌株搜寻探索的一种方法。
5.5 16s rDNA测序与宏基因组技术差异