基因组测序在真菌基因组中的应用

更多案例分享:

比较基因组在细菌基因组中的应用

基因组测序在细菌基因组中的应用

微生物基因组研究文章解读-(耐药基因)

微生物基因组研究文章解读-2

今天给大家介绍基因组测序在真菌基因组中的应用,

l 应用范围:

1、判断物种是什么?即新种/未知种鉴定,相似性判断

2、探讨基因组中有没有目标序列或基因?不关注基因组整体情况,只关注局部,如某个基因或路通。

3、判断样本是否有研究的潜力,如是否具有感兴趣的基因或通路。

4、多样本宏观分析,如系统进化分析、溯源分析等。

5、可在基因层面对多个样本进行比较分析,也可在局部范围内(scaffold水平)进行样本间结构的比较。

6、 基础研究,挖掘基因组中的基因资源、作用机制、重要元件等,可满足绝大部分的研究需求(二代+三代)

l 研究文献示例

1

Whole-genome sequencing of the endemic Antarctic fungus Antarctomyces pellizariae reveals an ice-binding protein, a scarce set of secondary metabolites gene clusters and provides insights on Thelebolales phylogeny

Genomics

Volume 112, Issue 5, September 2020, Pages 2915-2921

https://doi.org/10.1016/j.ygeno.2020.05.004

主要结论:使用Illumina HiSeq 2500平台对Antarctic fungus Antarctomyces pellizariae UFMGCB 12416进行了测序ice-binding protein-coding基因,绘制了次级代谢物基因簇,并从数百个直系同源单拷贝蛋白的比对中重建了a.pellizariae与其他Leotiomycetes的系统发育关系,加深了对微生物ice-binding proteins和嗜冷真菌基因组方面的理解。.

相关研究结果:

1.1 A.Pellizariae基因组中,APELLI_8493IBP与I型冰结合蛋白相似,它由235个氨基酸组成,作为信号肽(间隔1-19),含有未知功能域(DUF)3494结构域(P FAM11999,间隔34-218,e值3.55e-46)

1.2. Antarctomyces pellizariae具有一个环化的线粒体基因组,大小为30121 bp,编码17个tRNA,确定了rRNA的大小亚基(rnlrns)和14个编码氧化磷酸化链中已知蛋白质的基因。这些蛋白质包括7个复合I NADH脱氢酶基因(NAD1-6和NAD4L)、复合III基因cob、3个复合IV细胞色素C氧化酶基因(cox1-3)、2个复合V ATP合酶基因(atp6和atp8)和核糖体基因rps3

1.3使用系统发育组学方法,使用GenBank和JGI数据库中可用的基因组,以及外部网状结构群 NRRL 1823,分析来自12个家族和3个不确定分类组的60个成员之间共享的137个单拷贝直向同源物。结果表明Johnston等人(2019)发现的Thelebolales与以Thelebolus属和Antarctomyes属为代表的两个Thelebolace科之间的关系,这两个科与以Pseueudeurotiaceae属为代表的Pseudeurotiaceae科有共同的祖先。

Fig. 3. Phylogenetic tree reconstructed from alignment of 137 orthologous Antarctomyces pellizariae UFMGCB12416 proteins compared with those of 60 other Leotiomycetes species plus Reticulascus tulasneorum NRRL 18230 (Sordariomycetes) as outgroup

2

Large-scale genome sequencing of mycorrhizal fungi provides insights into the early evolution of symbiotic traits

Nature Communications volume 11, Article number: 5125 (2020)

doi: 10.1038 / s41467-020-18795-w

主要结论:基因组测序使用Illumina或Pacific Biosciences(PacBio)技术或者二者结合对基因组进行测序。对来自73种腐生,内生和致病物种的135种真菌基因组和62种菌根物种的组合分析,包括29种新的菌根基因组。该研究选取了以前没有共生基因组的生态优势真菌群落,包括外生菌根Russulales,Thelephorales和Cantharellales。该结果分析表明,从腐生到共生的转变涉及(1)作用于木质素和纤维素的降解酶的广泛损失,(2)腐生祖先中存在的基因的共同选择以实现新的共生功能,(3)新颖的多样化,谱系特异性共生诱导基因,(4) 转座因子的增殖和(5)不同遗传创新是构成外生菌根菌株趋同起源的基础。

相关研究结果:

2.1 比较了菌根真菌的62个草图基因组草案,包括29个新发布的基因组,并预测了每个物种9344–31,291个蛋白质编码基因,该组包括来自Russulales,Thelephorales,Phallomycetidae和Cantharellales(Basidiomycota)以及Helotiales和Pezizales(Ascomycota)中早期散布的真菌进化枝的新基因组,将这些菌根真菌基因组与来自木材腐烂病,土壤/枯草腐生物和根内生菌的73个真菌基因组结合在一起。

2.2. 基因组变大的主要驱动因素似乎是重复序列(P<0.05 GLS),如长末端重复反转录转座子(LTRs),其范围为组装的0.01%至46.4%。TE类别的分布在外生菌根真菌类群之间变化,即使在相同的真菌目或属内,表明不同TE家族的入侵在不同的进化枝中独立发生。然而,ectomycorrhizal Ascomycota 和Glomeromycota基因组的总TE覆盖率显着高于Basidiomycota(P<0.05,GLS)。在 Ascomycota中,最丰富的TE家族是LTR,例如Gypsy and Copia, and non-LTR I,而在Basidiomycota中,Gypsy and Copia LTRs, Tad1, helitrons, and Zizuptons最丰富。生活方式对TE覆盖率的影响大于系统发育,外生菌根共生体中TE含量显着高于其他几种TE类别的生活方式(总方差的14-35%,P值<0.05;PERMANOVA);在Agaricales中,大部分LTR插入发生在过去500万年(Mya)的Amanita rubescens,Laccaria bicolor,Laccaria amethystina和Cortinarius glaucopus,而主要爆发在更古老的Tricholoma matsutake中。

2.3 重建的系统发育关系和估计的分歧日期通常与先前研究恢复的日期一致。Agaricomycetidae最近共同祖先(MRCA)的年龄为132MYA(图4a),而Floudas等和Kohler等系统发育基因组分析的估计年龄为149或125MYA。但是,Varga等人在多基因系统发育中发现了191-176MYA。我们估计Agaricomycetes,Agaricales,Polyporales,Russulales和Boletales的MRCA年龄分别为280,116,104, 88和82MYA。Pezizomycotina的MRCA为326 Mya,而Floudas等的平均年龄为344 Mya。下图为Basidiomycota与 Ascomycota 中编码PCWDEs的基因家族的进化关系(左,a Basidiomycota. b Ascomycota.);热图包含编码现存物种的底物特异性PCWDEs的基因数量。基因的相对丰度由色标表示,从每个物种的最小(蓝色)到最大(红色)拷贝数,外生菌根真菌以黑线框定。

2.4 使用系统发育学方法来表征基于现存生物体中基因功能的外生菌根谱系的进化起源。通过定义系统发育年龄(phylostrata)来检查在外生菌根建立的不同阶段诱导的基因的年龄分布,即所谓的共生诱导基因。在Ascomycota 和 Basidiomycota门中,平均74%和67%的外生菌根诱导基因分别早于外生菌根共生的进化。这些基因中大约6%和18%已经分别存在于Ascomycota 和 Basidiomycota的MRCA中。这些观察意味着共生诱导的基因在从腐生祖先进化过程中大部分被选择用于外生菌根发育。

2.5 为了测试系统发育结果,评估了135个研究的真菌基因组中10个不同的外生菌根相互作用中鉴定的5917个外生菌根诱导的转录物的进化保守性。发现5917个共生诱导基因中有15.2%是我们数据集中所有物种共享的(IV和V簇)。大多数编码参与核心代谢或信号传导功能的蛋白质。来自簇III的基因仅在担子菌门内保守,而来自簇VII的基因仅由 Basidiomycota门共享。它们中的大多数没有已知的功能(即,没有KOG域)。总之,这些共生诱导基因中有31.2%是物种特异性的(第VI组)。这些基因中的大多数编码具有未知KOG功能的蛋白质或菌根诱导的小分泌蛋白质。因此,物种特异性外生菌根诱导基因的比例是相当大。

你可能感兴趣的:(基因组测序在真菌基因组中的应用)