基因组与群体进化,解析物种进化历程-02

案例二

研究背景

    大多数谷物,蔬菜是通过种子进行有性繁殖的,而大多数果树,块茎和某些观赏植物是通过嫁接,组织培养等无性繁殖的。有性繁殖的物种在驯化过程中经历了数百至数千代的同源重组选择,并在基因组中留下了明显的特征。相反,无性繁殖作物的驯化既取决于营养繁殖,又取决于有性繁殖,它甚至可以是一步操作,一旦选择了克隆,选择就完成了。因此,无性繁殖的作物可能在驯化后经历了零到几次重组和选择周期,这与有性繁殖的一年生作物形成鲜明对比。而菠萝是一种无性繁殖水果作物,起源于南美,并在6000年前就已被驯养。那么菠萝的驯化是否是“一步操作”到位还是其他,至今仍然未明确。

方法流程

研究结果

红苞凤梨CB5基因组的组装注释

    通过测序及组装红苞凤梨(Ananas comosus var.bracteatus) 的基因组CB5,组装了513 Mb的基因组序列,挂载到25个染色体上,共预测了29412个蛋白编码基因。生成了第二个Ananas属的参考基因组。

图1 CB5基因组的基因组特征

纤维合成、颜色形成、糖分积累以及果实成熟的基因组基础阐明

    通过比较CB5、F153以及MD2的基因组,作者鉴定了基因组上有关纤维合成、颜色形成、糖分积累以及果实成熟相关的区域。

菠萝驯化期间有性繁殖的选择性清除

    对89个菠萝个体进行了重测序。由于体细胞突变是: 塑造克隆繁殖植物驯化和多样化的主要驱动力。体细胞突变的一种来源是转座因子(TEs)的跳跃。研究发现菠萝中TE插入位点的高变异性可能是驯化过程中通过体细胞突变导致的新性状的驱动因素。此外,研究还发现三个主要品种中的两个中缺乏菠萝染色体的terminal runs of homozygosity,表明有性重组和体细胞突变都促进了菠萝的表型多样性。

图2品种样品的原始采集地点

有丝分裂选择和克隆繁殖的基因组标记

    菠萝栽培种无刺卡因类和皇后类中存在古老与近代的混合,而西班牙Spanish类则符合"one-step oper-ation”驯化。作者鉴定了25个选择性清除区域,包括一个强烈的清除区域包含一对串联重复的菠萝蛋白酶抑制因子。四个自交不亲和性候选基因在F153中连锁,但在自交亲和的CB5中不具功能。支持了有性重组和“one-step operation”方式在无性系作物的驯化历史中共同存在。

图3 菠萝的种族结构
图4  3号、4号和5号染色体的祖先起源分布

总结

    栽培植物是野生植物经人工培育后适合人类需要的植物。对栽培植物基因组进行研究不仅能揭示其起源和演化,还能解析其特有的生物性状的遗传和分子机制。菠萝(凤梨)是一种原产于南美的热带水果,目前 全世界的热带地区均有种植。明瑞光研究组与合作者对红苞凤梨(Ananas comosus var. bracteatus)的基因组进行了分析,并将之与80多个菠萝栽培品种和野生祖先进行比较,追溯了菠萝驯化史,发现其既经历了有性生殖过程,也有“一步到位”的无性繁殖过程,还找到了基因组中与菠萝特异农艺性状相关的人工选择区段, 为菠萝的遗传育种奠定了科学基础。

参考文献


 案例三

研究背景

    栽培甘蔗相比其它主要作物与众不同,因为它是多倍体种间杂种,具有极其复杂的基因组。目前甘蔗是世界上收获量最大的第一作物和第五价值作物,种植在90多个国家的约2600万公顷土地上,作为主要的糖和生物燃料原料作物,提供着80%的糖和40%的乙醇。而甘蔗基因组的缺乏将很大程度上限制其育种进程。

方法流程

研究结果

基因组测序组装与特异等位基因注释

    作者通过BAC文库测序,利用ALLPATH-LG, SPAdes和SOAPde-novo三款软件,结合295 Gb(87X)的三代PacBio数据,90X Illumina 数据,最终组装出3.13 Gb甘蔗基因组。结合Hi-C数据,利用研发的ALLHIC算法成功的将甘蔗基因组组装到染色体水平。32条染色体中包含了8个同源组群和4组单倍型A, B, C和D。

比较基因组学分析

    作者利用了两轮MAKER,结合着手动注释对基因和等位基因进行分离。共计鉴定注释了35,525个等位基因,包含4,289个四等位基因,9,792个三等位基因,14,797个二等位基因和个单等位基因。甘蔗与水稻,高粱,玉米和拟南芥的比较分析,1,278个基因家族是甘蔗特有,且发生了两次间隔较短的全基因组复制事件。在甘蔗中发现了参与NADP-MEC4光合作用途径的24个基因,7种关键酶,由于串联重复,蔗糖转运蛋白基因家族发生了扩张,并对抗病基因进行了鉴定。

图2 比较基因组研究

S. spontaneum的起源与遗传多样性分析

    作者对世界种质资源库的64份S.spontaneum材料进行重测序,发现其核苷酸多态性(π)远远低于其它克隆繁殖的作物,通过PCA主成分分析及群体结构分析发现64份材料分为3个群,不同的倍性可能是从祖先独立进化而来。S.spontaneum重排区具有高度的遗传多样性将更适应环境压力,例如对各种非生物胁迫(干旱,盐度,碱性,金属离子等)的反应,这些受到次生细胞生物合成和代谢,跨膜转运和离子结合的控制的基因在这些区域可以检测到。在多倍化事件后,重排区域经历了更强的平衡选择。

图3 群体结构进化分析

总结

  本研究利用百迈客复杂基因组Hi-C建库测序技术,并结合明瑞光课题组独立研发ALLHiC算法成功组装了高复杂同源多倍体甘蔗基因组AP85-441,高质量的甘蔗基因组的获得,为后续研究其蔗糖含量,抗性等性状及农业育种基础奠定了基础。

参考文献

你可能感兴趣的:(基因组与群体进化,解析物种进化历程-02)