病毒组研究新进展 | 当三代测序邂逅宏病毒组研究

        微生态研究已经大踏步迈入“病毒组”时代。高通量技术的发展为人们获取数据提供了便捷高效的途径,然而,基于短读长测序的NGS技术未能很好的解决复杂微生态群体中病毒组的研究难点——以往的研究手段,人们对病毒基因组数据的获取和组装效果的提升依旧没有更大的突破——大量碎片化的数据和信息无法展现噬菌体基因组全貌,想要从复杂环境中获取完整的噬菌体基因组依旧存在挑战,这也使得病毒组“暗物质”的研究成为新一轮聚焦的热点。

       如何才能更高效的获取更完整的病毒组信息的?华中科技大学陈卫华和刘智、复旦大学赵兴明、欧洲分子生物学实验室Peer Bork及团队的文章《Efficient recovery of complete gut phage genomes by combined short- and long-sequencing》为破解宏病毒组研究难点提供了新思路。

       研究主要介绍了一种新的混合分析的方法来检测人类肠道中的噬菌体:通过结合短读和长读测序技术来获取完整的噬菌体基因组。该研究从180个健康的中国参与者的粪便样本中获得了23,513个噬菌体基因组,其中有34%被认为是完整的。此外,还发现了一些在人类肠道中更为普遍的噬菌体,这些噬菌体的存在之前并未被发现。这些数据汇总为中国人类肠道病毒组(Chinese Human Gut Virome, CHGV)数据库集合。

       首先,来一睹新方法的研究流程:

病毒组研究新进展 | 当三代测序邂逅宏病毒组研究_第1张图片

该研究中,研究者利用人粪便样本首先进行了病毒组的富集,以获得更高比例的病毒基因组数据,之后借助二代和三代测序获得short-reads和long-reads,对两部分数据进行联合组装分析,与已有的病毒组数据库GVD和 GPD+相比,新方法显著提升了病毒基因组组装的完整性。

病毒组研究新进展 | 当三代测序邂逅宏病毒组研究_第2张图片

       不同的组装策略得到的病毒组组装结果可以明显看出,short-reads和long-reads混合组装的方法与单独二代或三代数据组装相比,获得的病毒contigs更多(上左图),完整的病毒基因组也更多(上右图)。

       在新物种发现中,不难看出,本研究中的CHGV库在新物种发现中也有极大的提升(GVD的更高可能与其纳入统计的样本量有很大关系,该库收录了2k+样本),这对病毒组“暗物质”的研究有积极影响,组装完整性的提升,也为人们认识病毒提供了更加详实的数据基础。

病毒组研究新进展 | 当三代测序邂逅宏病毒组研究_第3张图片

        对大噬菌体(≥100kb)的研究(下图),一直有各种方法,而本研究中(CHGV)组装出第一个Mb级别病毒基因组MBphage比以往报道中获得的病毒基因组的大小更大。

病毒组研究新进展 | 当三代测序邂逅宏病毒组研究_第4张图片

        系统发育学研究表明,这个Gut-MBP1病毒株与其他已知的大型噬菌体形成了彼此独立的分支(下图)。同时这一研究结果拓展了人们对病毒基因组大小认知的上限。病毒组研究新进展 | 当三代测序邂逅宏病毒组研究_第5张图片

       利用新技术开展的研究还揭示了人类肠道形态在以下两个方面隐藏的多样性:

1)通过马尔可夫聚类算法将CHGV基因组分组为1,982个非单例病毒簇(VC),研究中确定了比对应于crAssphage和Gubaphages的所有VC更多样化的VC_1(即包含更多的噬菌体基因组),以及比大多数其他VC更多样化的VC_4。两种VC都含有NCBI病毒RefSeq数据库中未发现的新型噬菌体,并在由前10个VC中的基因组组成的系统发育树中形成了自己的分支。在本研究样本样本中,它们的成员数量高(与crAssphage和Gubaphages相当)和普遍存在(在任意相对丰度临界值为1e-6时,中位流行率为16.3%和26.6%),大小分别为40和50 kb。在GPD和MGV数据库中可以鉴定出另外81种潜在的VC_1噬菌体,它们具有很高的总体序列相似性。

 2)本研究鉴定了至少数十种噬菌体,这些噬菌体比本研究样本中最普遍的crAssphalles和Gubaphrates更普遍。

病毒组研究新进展 | 当三代测序邂逅宏病毒组研究_第6张图片

        综上,不难看出,三代测序技术应用于人体宏病毒组的研究,大幅提升了从人粪便样本中回收完整的噬菌体基因组的效果,研究结果显著扩展了对人类肠道噬菌体的多维度上隐藏多样性的认识。

参考文献

Efficient recovery of complete gut phage genomes by combined short- and longsequencing. bioRixv, 2022.

你可能感兴趣的:(测序,组学)