测序技术的发展,在微生物基因组研究领域涌现出各种类型的项目:基因组扫描图、完成图、精细图、染色体水平组装……这么多的项目类型,怎样做选择呢?每种项目又可以给我们的研究提供什么样的支持呢?做完了基因组的测序和组装,又如何能讲好一个微生物故事呢?今天,就给大家分享下微生物基因组研究常见的项目类型,一般思路和一些凌恩的经典微生物基因组研究案例——
首先,用一张表来汇总下目前常见的基于高通量测序的微生物基因组研究策略及
适用的研究类型:
项目类型 |
测序策略推荐 |
预设指标及适用方案 |
细菌基因组扫描 细菌基因组重测序 病毒基因组 |
NGS 1-2Gb |
低成本的细菌/病毒基因组研究方案,可获得细菌基因组的框架信息,研究细菌/病毒的基因组结构及功能潜能。适用于一般要求的细菌基因组或大批量的细菌基因组研究。 |
细菌基因组完成图 |
NGS 2Gb + PacBio 100x |
获得0N、0Gap的完整的细菌基因组圈图,同时可获得该细菌的质粒基因组完成图。适用于针对单菌的基因组结构及深入的功能研究开展,或者有重点针对质粒、内源性噬菌体等的研究类型,可覆盖复杂区域,针对单菌的研究较为深入。 |
真菌基因组扫描 真菌基因组重测序 |
NGS 5Gb |
低成本的真菌基因组研究方案,可获得真菌基因组的框架信息。适用于一般要求的真菌基因组或作为真菌精细图的前期评估方案。 |
真菌基因组精细图 |
NGS 5Gb + PacBio 100x |
较高质量真菌基因组测序组装研究方案,可获得较大scaffold组装结果,可实现对真菌基因组结构和功能较深入系统的研究。 |
真菌基因组染色体水平组装 |
NGS 5Gb + PacBio 100x + Hi-C 100x |
高质量真菌基因组研究方案。结合三代长读长测序与三维基因组技术,可实现染色体水平组装,获得真菌的染色体信息,深入挖掘真菌的基因组结构功能并可用深入泛基因组、系统进化等研究。 |
接下来,我们重点来聊一聊微生物基因组常用的研究思路;
单一微生物(细菌/真菌/病毒)基因组的研究,无外乎两种典型的应用方向:一种是针对具有某种特定性状特点的微生物个体,如具有某种特定致病性,或具有某类型特异生理生化功能的菌株,开展功能层面研究,通过基因组研究切入,寻找跟特定的性状特点相关的基因或突变;另一种则是针对微生物群体,选择遗传背景较为一致的大量菌株为对象,研究与物种的起源进化或功能相似性及差异性来源为研究目的。
针对上述两类研究目的,可以整理出微生物基因组研究的一般思路:
(1) 通过三代+二代测序构建高质量的参考基因组;
(2) 通过功能注释及基因家族富集分析,解析单一菌株在环境中的生存机制,结合CAZymes、次生代谢产物注释等,为探讨菌株的生理生化相关功能及其生产意义提供依据;下游可开展目的基因的筛选及验证,为相关功能的开发利用提供参考。
(3) 通过进化树研究或比较基因组、泛基因组分析等,对多个个体基因组进行分析,解析菌株的起源、进化历史、分化时间、传播规律等,探求其基本基因功能单元和特异性特征,为解释相应的研究目的提供证据。
下面,来看看凌恩生物的合作老师们都发表过哪些精彩的微生物故事吧!
→经典案例1(凌恩客户实例-细菌基因组完成图)
比较基因组分析揭示YJN-5菌株异丙二酮降解分子机制
Comparative genomic analysis of iprodione-degrading Paenarthrobacter strains reveals the iprodione catabolic molecular mechanism in Paenarthrobacter sp. strain YJN-5
期刊:Environ Microbiol
影响因子:5.491
发表时间:2021年
研究背景
异菌脲是二甲酰亚胺类高效广谱杀菌剂,适用于防治多种蔬菜、瓜果类作物的早期落叶病等病害,但土壤和作物中残留的异菌脲也给食品安全及人类的健康带来了隐患。在之前的研究中发现类节杆菌属菌株YJN-5可以降解异菌脲。本研究中分离并鉴定了另一株异菌脲降解菌YJN-D,它与菌株YJN-5具有相同的代谢途径。
方法流程
*YJN-D菌株分离培养
*Illumina+PacBio测序,组装出YJN-D的基因组
*比较基因组研究两种不同菌株的基因组的共性及差异
研究结果
1.YJN-5基因组特征:基因组大小为4526515 bp,GC含量为64%,预测含有4256个ORFs。
2. YJN-5菌株关于异菌脲分解代谢相关基因的报告
3. 对两种异菌脲降解菌株比较分析和实验验证,确定了编码保守的异菌脲分解代谢途径的基因。
4. 降解异菌脲的基因包括酰胺酶基因ipaH、脱乙酰酶基因、ddaH等。这些基因分布在菌株YJN-5的三个质粒上,并且在YJN-D与YJN-5菌株之间高度保守。
5. 构建携带可降解异菌脲基因的质粒,在其他菌中进行表达验证。
图1 YJN-D与YJN-5菌株基因组信息
→经典案例2(凌恩客户实例-细菌基因组完成图)
第二条染色体促进 Flammeovirga 属对复杂环境的适应
The Second Chromosome Promotes the Adaptation of the Genus Flammeovirga to Complex Environments
期刊:Microbiol Spectr
影响因子:7.171
发表时间:2021
研究背景
大约 10% 的细菌菌株含有多于一条染色体;然而,与第一条染色体相比,第二条染色体的形成机制及其存在的意义仍不清楚。Flammeovirga属是典型的多糖降解细菌,本研究组装了该属的完整基因组图谱。
方法流程
*获得Flammeovirga sp. MY04单菌
*通过Illumina+PacBio测序,组装出单菌的完整基因组
*基因预测--基因功能分析--基因水平转移--进化分析
主要结果
1.Flammeovirga属的基因组包含第二染色体。第二条染色体比质粒大得多,具有 rRNA 并且与第一条染色体的GC含量差异为 1%。
2. Flammeovirga属的两条染色体编码基因存在功能差异。第一条染色体携带着细胞过程的核心基因,而第二条染色体则富含参与无机离子和碳水化合物转运和代谢的基因,特别是编码糖苷水解酶和多糖裂解酶的基因,这些基因构成了菌株优异性能的遗传基础利用多糖。
3. Flammeovirga属的第二染色体富含水平转移的基因、重复基因。
4. 第一条染色体在进化上更加保守,而第二条染色体更具可塑性,进化的突变率高于第一条染色体,这可能与它们在细菌生存过程中的不同作用有关。
研究意义
一直以来,人们普遍认为典型的细菌基因组包含一条染色体和一些携带非必需基因的小质粒。然而,已经在各种细菌中鉴定出越来越多的次级染色体。该研究报告了多糖降解海洋细菌 Flammeovirga 属的完整基因组,揭示了它们含有两条染色体,并进一步确定了多复制子系统的存在是 Flammeovirga 基因组完整的特征。这些序列将增加了人们对次级染色体的了解,尤其是在拟杆菌中。本研究可作为实例解释第二染色体可能的形成机制和功能,为同行研究第二染色体提供参考。
表 Flammeovirga 属基因组特征
图2 Flammeovirga 属基因组圈图和进化树
→经典案例3(凌恩客户实例-真菌基因组精细图)
内生菌共生体对海洋真菌生物合成基因簇的调节作用
Upregulation of a marine fungal biosynthetic gene cluster by an endobacterial symbiont
期刊:Commun Biol
影响因子:4.165
发表时间:2020
研究背景
真菌-细菌联合存在于自然界中,在生态、进化和医学过程中发挥着重要作用。本研究介绍了来自海洋沉积物的真菌-细菌共生体SCSIO F190/B001。
方法流程
*获得共生体SCSIO F190/B001、细菌SCSIO B001
*16s多样性分析*
*Illumina+PacBio测序,组装细菌SCSIO B001的基因组
*系统发育分析、GFP定位、代谢分析
主要结果
1.共生体SCSIO F190/B001的互惠关联。这种细菌生活在真菌菌丝体内,足够强壮可以独立于宿主生存;独立生长的细菌可以在体外感染真菌宿主并继续繁殖生长。
2. 细菌共生体可以合成一种抗菌剂—螺旋霉素,该抗菌剂可以赋予共生体一种防御手段来抵御竞争生物。
3.基因组分析显示螺旋霉素生物合成机制不是由细菌编码,而是由真菌宿主编码。
主要结论
本研究揭示了这种独特的真菌-细菌共生关系,极大地扩展了人们对海洋微生物多样性的认识,并为内共生体和真菌-细菌关系提供了重要见解。
图3 共生体SCSIO F190/B001的共生关系模型
→经典案例4(凌恩客户实例-真菌基因组染色体水平组装)
致病性Penicillium digitatum的完整基因组
The completed genome sequence of the pathogenic ascomycete fungus Penicillium digitatum
期刊:Genomics
影响因子:5.736
发表时间:2021
研究背景
P.digitatum是一种青霉菌属的病原真菌,是柑橘产业中最具破坏性的病原体之一。本研究对该病原菌基因组进行了深度组装和注释,为深入了解该病原菌提供参考。
研究方法
研究者利用 Illumina、PacBio 和 Hi-C 测序技术组装了 P. digitatum 菌株PDW03的完整基因组序列。
研究结果
1. 本研究得到完整的 P.digitatum 基因组。基因组大小为26.336Mb,共6条染色体。
2. 本研究组装的 P.digitatum 基因组注释得到9000多种编码蛋白。
3. 基因组分析确定了302 种碳水化合物活性酶、420种分泌蛋白和39种次级代谢物 (SM) 基因簇。
研究结论
本研究通过测序得到 P. digitatum 完整基因组,为进一步研究提供最佳资源,为研究真菌宿主开关和在植物-病原体相互作用提供驱动力。
图4 P. digitatum 的组装结果
更多测序知识,欢迎关注凌恩生物公众号。
相关链接: