Use of Metatranscriptomics in Microbiome Research
https://doi.org/10.4137/BBI.S34610
Bioinformatics and Biology Insights [IF: NA]
2016-04-20 Review Article
DOI: https://doi.org/10.1093/nar/gkaa254
第一作者:Stavros Bashiardes
通讯作者:Eran Elinav([email protected])
其他作者:Gili Zilberman-Schapira
作者单位:以色列,雷霍沃特,魏兹曼科学研究所免疫学系(Department of Immunology, Weizmann Institute of Science, Rehovot, Israel)
译者:五谷杂粮
责编:刘永鑫 中科院遗传发育所
本文出自超级大牛Eran Elinav实验室,发表至今引用157次(谷歌学术截止2020/6/26)。
Abstract
人类肠道微生物生态系统,表达的基因种类比人类宿主多100倍,是人类全基因组的重要组成部分,其与多种健康和疾病密切相关。由于大多数共生物种难以培养或无法培养,因此在各种环境条件下对微生物组成和功能的基因组测定,是了解其在健康和疾病中发挥作用的主要工具。微生物组研究的第一个十年的主要使用基于DNA测序的16S rDNA和宏基因组测序,从而阐明了微生物组成和基因组结构。RNA-seq(转录组测序)的技术进步最近为我们提供了深入了解复杂细菌群落中活跃表达基因的能力,从而能够阐明在特定环境下微生物组功能的改变,与宿主的互作,以及健康微生物组向疾病驱动构型转变。我们重点介绍了用于确定微生物群基因表达及其调控的宏转录组学策略,并讨论了与这些方法相关的优势和潜在挑战。
Microbiome
微生物组研究极大地受益于过去二十年的技术突破:实现了人类基因组表征的分析。人类基因组破译后不久,注意力就转移到了人体内部巨大的原核基因库上,该库远超过人类真核基因组,但其对人类的作用仍然难以确定。诺贝尔奖获得者Joshua Lederberg首先将微生物组(microbiome)称为在人体中定殖的常见的、共生和病原微生物的组合。这种微生物生态系统由细菌、真菌和病毒组成。当今的主要研究重点是细菌群落的组成。David Relman组首先对肠道微生物组细菌成分进行了测序,使用方法为桑格(Sanger)测序。Gordon的工作使人们能够了解影响细菌群落结构的因素,以及其在哺乳动物生理代谢和疾病风险中发挥的作用。人类微生物组项目和欧洲的MetaHit项目进行了大规模研究,以全面了解体内微生物的特征,并进一步确定其作用。
总而言之,这些开创性的工作使我们发现微生物组由大量细胞组成,最新估计表明微生物群细胞与我们自身细胞的数目大致相等,但且其表达的基因数量是人类真核基因库的100倍。不同个体微生物组的组成之间存在着很大的异质性。虽然不能完全理解这种异质性的基础,但人类微生物组的结构和稳定性会受到宿主遗传,免疫和环境等多种因素的影响。后来,人们意识到健康的人拥有一个核心微生物群。例如,肠道微生物组包含1000多种细菌,但是最常见的菌群是厚壁菌门(Firmicutes)、拟杆菌门(Bacteriodetes)、放线菌门(Actinobacteria)和变形菌门(Proteobacteria)。女性泌尿生殖系统有其自身的微生物群,包括150多个物种,其核心菌群是厚壁菌门,拟杆菌门和放线菌门。在本综述中,术语核心微生物群已被用来描述通常观察到的细菌门。值得注意的是,该术语已被Gordon用于肥胖和瘦的研究中,用来描述可识别的细菌代谢基因网络,而不是特征化的门。
肠道微生物组研究最深入的微生物群落在人类生理中起着重要作用。它们在控制病原体定植和免疫系统发育中非常重要,通过水解饮食中的化合物来促进消化,这些化合物不能通过酶的产生而分解,这些微生物也可以在维生素的生产中发挥作用,例如维生素 B12,B5和K。微生物群的变化,被称为生态失调(dysbiosis),与许多人类疾病有关,例如炎症性肠病,肥胖症和非酒精性脂肪肝。此外,病原体感染HIV和流感病毒也会导致生态失调。微生物组功能的简明概述和与疾病的关系在其他综述中得到了全面描述(引文21-24)。
Characterization of the Microbiome
通过对16S RNA基因进行测序,可以对微生物群的物种分类和系统发育进行定义。该基因包含整个细菌物种中保守的区域和独特的高变区,对每一个属都是特有的,可用于测序并作为分类学特征。
然后将序列的可变区聚类为操作分类单位(OTU),从而提供有关其分类特征的宝贵信息。
全基因组随机测序,然后进行宏基因组分析,通过生成所存在细菌的基因组成信息,为样品的分类学特征增加了更详细的信息。这些信息反过来又可以用来发现新基因,并推断功能通路和模块,从而提供对功能和遗传微生物组变异性的理解。对从环境中分离出的DNA进行宏基因组分析,但并不能 区分该基因组DNA是否来自活细胞,以及预测的基因是否实际表达,在什么条件下表达。此外,其他蛋白质组学方法,宏蛋白质组学和宏代谢组学,正在越来越多地被应用,有助于对微生物群落功能的理解。宏转录组学提供了DNA和蛋白层面间补充的研究手段,实现微生物群落转录活性的表达谱,并深入了解了表达的基因和细菌群落的关键代谢活动。代谢组学提供有关微生物群群落分泌或调节的代谢产物组成的信息,从而使人们能够了解功能动态对群落和宿主相互作用的影响。总之,这些基于非基因组学的方法可以补充宏基因组学和宏转录组学数据,并加深了我们对微生物群落动态环境中起作用的复杂通路的理解。
Characterization of the Metatranscriptome
测序技术的进展彻底改变了宏基因组学分析,也推动了在全球范围内研究和理解基因表达的方法。从早期描述的差异方法到通过使用基因芯片的整体转录组方法,了解宿主基因在细胞或组织水平上的表达已经走了很长一段路。近年来,大规模并行测序和RNA-seq的出现为转录组分析领域提供了新的进展。除了阐明宿主基因表达外,现在还可以研究给定环境(包括在肠道,口腔或呼吸道中)中复杂细菌群落的基因表达,包括可以或不能培养的细菌。
因此,来自宏转录组分析的数据,可通过准确阐明在宏基因组学分析中注释的基因哪些被转录以及在何种程度上转录,从而能够证明细菌环境中的潜在功能。
因此,与宏基因组学相比,宏转录组学提供了更丰富的见解,它可以揭示具有转录活性种群的详细信息,而不仅仅是宏基因组学分析中所鉴定的细菌种群的遗传数量。
在临床实验时,活性细菌的不同组常产生较大差异。
Isolation and Processing of Microbiome mrNA
转录组实验通常从目标区域的细菌中分离总RNA。
在真核生物中,可以通过使用oligod(T)引物合成cDNA来选择mRNA,可以利用poly-A尾部来区分mRNA种类。
原核mRNA仅占总RNA的1%–5%,大多数是16S和23S rRNA以及tRNA。与真核mRNA相比,原核生物mRNA缺乏poly-A尾端,使其不适用富集和cDNA合成。
因此,已开发出各种方法来解决该问题。使用靶向附着在磁珠上的特定rRNA区域的探针去除rRNA是一个有吸引力的选择。
该过程涉及将探针退火至靶序列(rRNA),然后使用磁铁将其去除。
与所有涉及RNA操作的方法一样,该方法也面临着污染核糖核酸酶造成降解的挑战。
保持常用的实验室操作方法以避免引入污染的核糖核酸,并且将RNase抑制剂掺入。
剩下的是代表转录活性基因的其他mRNA的富集群体。
对于大规模并行序列分析,需要将这些RNA进行分离、合成cDNA、并将接头序列连接到cDNA末端(末端修复后),生成一个可扩增并测序的文库。将序列读长比对到参考基因组,并基于覆盖这些区域的序列读长数量来定量表达的基因。
Computational Analysis of Metatranscriptomics data
一个典型的宏转录组数据集包含数百万个已测序的mRNA分子,称为RNA-seq。此外,随着宏转录组实验的规模和数量不断增加、自动化、高效、高通量分析,对于这些数据集推断生物学意义至关重要。在过去的几年中,已经开发了一些综合分析流程(例如HUMAnN和MG-RAST),这些流程得到了广泛使用,并提供了完整的解决方案。这些工具与专门的生物信息学工具(例如序列比对工具BOWTIE和GEM,用于质量过滤的Trimmomatic和用于差异基因表达的CuffDiff)结合使用,以达到推断基因表达水平和基因表达水平变化的目标。
所有宏转录组分析中都存在在一些固定的分析步骤。这些步骤包括过滤非mRNA和宿主序列,过滤和修剪低质量的序列和核苷酸(类似于高通量宏基因组学分析中的质量控制过程),识别开放阅读框(ORF,编码区),与标准数据库对比,基因表达水平的标准化和计算以及其他统计信息。
可选的分析步骤是将序列组装为重叠群,可以在初始过滤后执行。如果执行,则在组装步骤之后将重叠群比对到参考基因组。
虽然组装步骤在计算上具有挑战性,并且需要更高质量的实验测序数据,它具有发现相关的基因表达信息的能力,例如相邻基因与起始和终止位点之间的关系。
为了进行组装,需要更深的测序,因此,通常只能从一组序列中组装高度丰富的区域。
如果没有参考基因组和后续基因注释,则组装步骤必不可少 。
这在肠道菌群中不太常见,但与非模型生物的RNA序列有关。在没有参考基因组的情况下,通常通过与测序和注释蛋白的序列相似性进行对比获得测序转录物的注释。换句话说,使用软件(例如Blast2GO)将组装的转录数据与大型注释蛋白质数据库进行比对,如果发现高度相似的蛋白质,通常可以推断出相似的生物学功能。
从宏转录组学数据分析和推断生物信息中的另一个重要问题是将RNA序列数据和宏基因组学相结合。
同时分析样本的这两种数据,使我们能够推断出实际表达的基因与可能存在的基因。无论组装步骤是否存在,在RNA-seq分析和标准化过程结束时, 数据被转换为基因表达相对数值,然后可以进行类似于16S和宏基因组测序中的统计分析(例如,样品内的基因表达水平,样品内的丰富度以及样品之间的相似性)。
Utilization of Metatranscriptomics in Health and diseae
Assessment of microbial activity
在混合细菌的微生物组中鉴定功能活跃的细菌,可能会突出显示无活性微生物库中由疾病驱动的细菌。Gosalbe利用16S rRNA转录的结果来确定胃肠道中活性细菌的系统发育结构(将菌群定位为主要具有活动性的微生物)。在健康个体中,mRNA的表征揭示了碳水化合物代谢路径、细胞合成和能量产生所涉及的途径和激活现象。
共生细菌对异种生物的影响突出表明了,宏基因组学-宏转录组学相结合的方法对微生物表征研究的重要性。
如前所述,肠道菌群通过产生和分泌一系列酶从而在碳水化合物和蛋白质的代谢中起重要作用。这些代谢过程可能会影响异型生物质的稳定性。
有超过40种异型生物质受到了肠道菌群的影响,但当前并未充分理解其机制。
肠微生物菌群使名为索利夫定(sorivudine)的化合物转变成一种化合物,该化合物抑制抗癌药物5-氟尿嘧啶(5fluorouracil)的代谢,从而引起其积累,导致毒性。
在短时间内,索利夫定和5-氟尿嘧啶联用的18名患者死亡。
尽管已经确定肠道细菌是许多药物代谢的原因,但确切的细菌和涉及的分子途径常常是未知的。
Maurice等人的研究实施了流式细胞术方法,从肠道中分离出了活跃的细菌种群,然后通过16S rRNA基因测序和宏转录组学对其特征进行了确定,以确定对异型生物质反应的基因表达图谱。这项研究表明,肠道中有不同种类的活性细菌(主要由厚壁菌门组成),并且超过一半的肠道菌群表现出高水平的代谢活性。他们还表明,大约三分之一的肠道菌群是受损的细胞(没有活性,但是可以通过宏基因组学分析检测到)。外源物质的暴露被认为对活性肠道微生物组的结构及其基因表达图谱有影响。
可以看到另一个重要的例子,心脏病药物地高辛(digoxin)由于被肠道微生物代谢失活。
转录谱分析表明,肠道细菌的特定菌株,其细胞色素编码操纵子受地高辛的调控,并预示着心脏药物的失活。
使用无菌的(gnotobiotic)小鼠,表明饮食中蛋白质的增加可显着降低地高辛的微生物代谢并导致血清中药物的浓度增加。总体而言,这强调了肠道微生物在药物功效方面重要性。
Assessment of microbiome–immune interactions
微生物对粘膜免疫系统的影响被认为是影响宿主生理的关键。TLR5敲除KO小鼠的研究的例子,使用宏转录组作为宏基因组和16S rRNA的补充。TLR5在肠粘膜中表达并识别鞭毛蛋白,细菌鞭毛的主要成分。缺乏TLR5的小鼠表现出代谢综合征和结肠炎,其特征是肠道菌群失调。在TLR5-缺乏小鼠中发现的另一种损害与屏障功能的维持有关。粘膜免疫系统通过多种机制在微生物控制中发挥着多种作用,例如调节保护性粘液产生和分泌高浓度的IgA,从而能够覆盖局部侵入性共生细菌,从而抑制炎症反应。在缺乏对鞭毛蛋白的先天性识别的情况下,抗鞭毛蛋白抗体的浓度会降低,这些抗体在控制微生物群方面起作用,这可能会对微生物群和粘膜屏障功能产生整体影响。缺乏TLR5的小鼠肠道消化不良( 并显示代谢综合征)通过16S rRNA测序方法进行了验证。尽管对粪便样本进行分析表明存在生物功能异常,但只有使用宏转录组学方法才能在缺乏TLR5的情况下,探究影响和发生细菌群落的潜在机制。TLR5 KO小鼠的宏基因组学分析表明,这些小鼠和野生型小鼠之间存在微生物群功能基因没有显着差异。相比之下,宏转录组学分析显示,与野生型小鼠相比,TLR5 KO小鼠共生菌群与鞭毛运动相关基因发生上调。
在该模型中,TLR5鞭毛蛋白识别并产生抗鞭毛蛋白抗体,从而导致多种细菌的鞭毛运动基因下调,从维持保持微生物群。因此,缺少TLR5会降低抗鞭毛蛋白抗体的产生,从而引起细菌鞭毛运动基因的上调,增加胃肠道环境中的细菌运动,破坏粘膜屏障。
Studying microbiome antisense RNA
尽管传统的转录组分析涉及在特定环境条件下mRNA转录,并根据确定激活的代谢途径的数据进行分析,但细菌转录组却表现出很高的复杂性。
随着RNA-seq方法的成熟,允许构建链特异性文库,人们发现细菌转录组编码出惊人数量的顺式RNA,称为反义转录,从DNA编码基因的相反链转录而来。这种相互作用已通过实验证明,例如,蓝藻集胞藻(Syechocystis sp.72)和单核细胞增多性李斯特氏菌(Listeria monocytogenes)下。实际上,已经提出这些反义RNA不仅可以靶向其相应的RNA,而且还可以靶向mRNA。 不同细菌中发现的反义RNA数量有所不同。
例如,据报道大肠杆菌具有反义基因的22%,金黄色葡萄球菌仅占基因的1%以上。
反转录物参与多种调节作用,例如转录调节物的调节和毒性蛋白合成的抑制。
反义RNA在原核基因调节中起着重要作用,可以进一步丰富我们对微生物群基因潜在机制的理解。
尽管许多关于原核反义RNA的研究主要是在单培养菌株上进行的,但在全球微生物群规模上进行此类分析可以补充传统的mRNA的转录组学分析,并可以更深入地了解影响这些表达谱的调控机制。
在分析人类肠道菌群中反义RNA的过程中发现了明显且动态的存在例子。
个体及具有反义RNA的基因中的个体之间的反义RNA的转录存在差异(菌株特异性反义RNA的数量) 。具有反义RNA转录物的常见基因包括转座酶,防御机制基因以及细菌管家基因。
Studying microbiome small noncoding RNAs
细菌转录组包括小的非编码RNA(sRNA),通常大小在50到500 bp之间,并参与基因调控。
它们通过碱基配对与靶标mRNA序列的5’非翻译区(UTR)相互作用来调节转录物的翻译或稳定性,从而发挥作用。参与调节细菌的重要过程,例如铁代谢,毒力和群体感应,可以快速适应不断变化的环境。
sRNA已在多种细菌中得到鉴定。下一代测序方法的出现加速了对各种细菌(如沙门氏菌和枯草芽孢杆菌)的鉴定。下一代测序方法也为在群体水平上研究细菌sRNA提供了机会。例如,对海洋中不同深度的细菌进行的转录组学分析表明,sRNA对环境适应的潜在作用。
尽管没有阐明它们在肠道微生物群落中的作用,但人类活跃的肠道菌群的转录组学鉴定了许多sRNA。基于群落分析的转录组学方法是有限的,sRNA的分析通常仅限于单个细菌种类。在口腔中进行了一个有趣的例子,该例子采用了一种综合转录组学方法来分析复杂群落中的sRNA。将群落mRNA表达谱与sRNA谱相结合,以了解影响牙周炎口腔微生物组动力学的活性代谢途径和潜在调控机制。
牙周炎是一种由生物膜引起的炎症性疾病,会影响牙齿周围的组织(牙周膜),其特征是细菌群落营养不良,被认为是该疾病的病因。口腔中的微生物组代表一个复杂的微生物群落,该群由于摄入食物不同而发生频繁变化,而食物需要微生物快速适应这些变化的环境条件。通过使代谢过程适应这些环境波动来实现这一点,而sRNA在实现这一过程中起着重要的调节作用。
了解可能促进牙周炎特征的营养不良的调控机制,已在牙龈下生物膜上实施了转录组学研究方法。群落mRNA表达谱鉴定了病菌的特定代谢特征。有趣的是,不仅已知的牙周病原体还包括正常情况下与疾病无关的病毒,细菌,显示出促病能力。将微生物群落sRNA表达谱与mRNA表达数据相关联表明,sRNA潜在地参与调节口腔微生物组的代谢活性,并以此方式,使口腔微生物组从共生向营养不良转变。
Limitations and challenges of Metatranscriptomics Analysis
与宏转录组分析相关的几个挑战值得一提。从一些生物样品(例如粪便)中分离高质量的RNA样品是困难的。样品中的宿主RNA污染可能会在不同程度上发生(例如,活检样品中的污染很高)。在这些情况下,无法通过将探针退火以靶向细菌rRNA序列,然后使用磁铁将其退火的策略来去除宿主中的rRNA。并且它们作为污染物存在,会增加总体处理成本,并使下游分析复杂化。另一个要考虑的问题是,mRNA的半衰期很短,因此可能难以检测到对环境刺激的快速/短暂反应。此外,mRNA的存在并不总是与蛋白质的存在相关联(或与此相关的蛋白质活性)。这样,整合宏基因组学、宏转录组学、代谢组学和宏蛋白质组学数据集的流程,可能获得微生物组组成和功能的整体视图。最后,即使在分析中使用相同的数据库,多种宏基因组学分析方法有时也会产生可变的结果。因此,有必要对RNA分离、加工、测序和分析进行标准化,以进一步推广宏转录组学方法并将其整合到微生物组研究中。
最后要说明的是传统上,大规模的表达研究,如基因表达芯片和测序分析,都伴随着一个独立的技术验证结果,定量聚合酶链反应(qPCR)被认为是金标准。现在,大规模表达方法已经转向利用下一代测序(NGS)方法,即RNA-seq,使用该技术与qPCR进行验证不容忽视。
conclusion
宏转录组学具有发现生物信息的巨大潜力,而其他基因组方法可能会掩盖这些信息。它可以在特定条件下提供准确信息,而不是基于宏基因组数据推断出的潜在基因表达图谱。因此,对微生物组的转录组数据进行解读可以更好地阐明不同环境下功能的改变。其与宿主的相互作用以及伴随着健康微生物组向疾病驱动构型转化而发生的功能改变。此外,宏转录组学可能会开启基因表达调控机制的窗口,从而揭示宿主-微生物和微生物-微生物之间的相互作用如何调控微生物组的活性。在预算和样品可用性不容忽视的情况下,采用全球整合的16S rRNA方法,包括宏基因组学,宏转录组学,宏蛋白质组学和代谢组学。虽然宏转录组学微生物组分析有助于我们对微生物组的复杂群落行为的理解,但为了提高宏转录组分析的可重复性和普遍适用性,还需要解决几个挑战。尽管存在这些挑战,但是微生物组的转录组学分析,更深入地了解微生物对稳态和疾病易感性的因果关系。将宏转录组学整合到微生物组研究中可以更好地了解其在哺乳动物生理学中的各种作用,并将这些数据整合到临床领域 。
Stavros Bashiardes, Gili Zilberman-Schapira & Eran Elinav. Use of Metatranscriptomics in Microbiome Research. Bioinformatics and Biology Insights. 2016, 10: BBI.S34610. doi:10.4137/bbi.S34610
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑
系列教程:微生物组入门 Biostar 微生物组 宏基因组
专业技能:学术图表 高分文章 生信宝典 不可或缺的人
一文读懂:宏基因组 寄生虫益处 进化树
必备技能:提问 搜索 Endnote
文献阅读 热心肠 SemanticScholar Geenmedical
扩增子分析:图表解读 分析流程 统计绘图
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
在线工具:16S预测培养基 生信绘图
科研经验:云笔记 云协作 公众号
编程模板: Shell R Perl
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
点击阅读原文,跳转最新文章目录阅读