文章解析 | 萝卜泛基因组揭示萝卜属种间种内的遗传变异和基因渗入

2021年8月10日,中国农业科学院蔬菜花卉研究所在期刊《Molecular Plant》在线发表了题为“Pan-genome ofRaphanushighlights genetic variation and introgression among domesticated, wild and weedy radishes”的研究成果。

萝卜是一种具有经济和生态重要性的十字花科蔬菜兼油料、饲料或药用作物,也是研究多倍化后基因组进化和渗入的模式系统。虽然已有利用二代和三代测序技术构建的萝卜基因组图谱,但单个基因组不能代表萝卜属中不同种、亚种和变种的全部遗传信息。为深入了解萝卜属物种间和物种内的遗传变异和基因渗入,本研究使用PacBio、Illumina、Bionano和Hi-C技术对11份覆盖萝卜属资源的典型材料(7个栽培萝卜品种、2个野生萝卜亚种、1个半野生萝卜和1个种间杂种衍生的杂草萝卜)进行了高质量基因组组装,并构建了基于基因座、基因家族和图形方法的泛基因组,深入解析了驯化、野生和杂草萝卜之间的遗传变异和基因渗入,阐明了多倍化后基因组进化、萝卜的遗传改良以及杂草生物防治和野生种质的保护的重要性。

一、萝卜的驯化

系统进化分析表明R. sativus R. raphanistrum 在不同的分枝上,日本半野生种可能是驯化萝卜的后代。萝卜(RR基因组)和芸苔(AA基因组)在6.33百万年前(Mya)发生了分歧。之后萝卜至少被独立驯化了四次。R. sativus var. niger 和var. radicula 在欧洲被独立驯化,R. sativus var. caudatus 在南亚驯化,原产于中国、日本和韩国的各种形态的萝卜都是从一个共同的祖先开始驯化的。分歧时间和冰川作用的共同发生表明气候变化可能影响了这个属的进化。

图1 11份萝卜种质的地理来源、基因组特征和系统发育树 A,材料的地理来源。B,心里美基因组的全基因组互作矩阵。C,心里美基因组的基本特征。D,萝卜属的系统发育。(图片引自文献[1])

二、萝卜属物种间的基因流动

亚洲萝卜与欧洲萝卜具有不同的基因交换历史。不同的亚种及其参与基因交流的程度可能是导致欧洲和东亚萝卜品种分化的原因。材料间间接的基因渗入可能反映了印度次大陆经历了几轮来自欧洲的人口和贸易流入。Moriguchi daikon 和Yangzhou-Yanzhong的基因流动揭示了自唐以来扬州城与日本的持久交流。此外,只有两个大倒位显示了与系统发育树完全匹配的模式,而不同分支上显示的倒位源于基因渐渗。4个倒位显示了从欧洲品种到东亚品种的基因流动。一个倒位基因座显示野生型和栽培型之间的基因流动。值得注意的是,加州杂草萝卜基因组由野生和驯化基因组组成,表明驯化作物的基因以意想不到的大规模侵入了野生近缘物种的基因组。

图2 萝卜属基因组中的基因流动A,基于ABBA-BABA分析的萝基因流。B,染色体倒位及其渐渗。C,加州杂草萝卜的基因组组成。(图片引自文献[1])

三、萝卜亚基因组间的重排和偏向性保留

在11个基因组中,祖先核型(AK)区块的总体排列是一致的,但在14个非冗余位点观察到总共28个整区块易位事件。在显示区块变异的27个非冗余位置中,分别有16、7和4个位于MF2、LF和MF1亚基因组中,表明MF2亚基因组仍然是最不稳定的。这些发现进一步表明了多个基因组从头组装的有用性。

在萝卜属形成后,AK区块继续经历丢失。每个基因组中有17-27%的pan-AK基因通过偏向性保留丢失。相比之下,11-19%的pan-AK基因通过基因组重排从原始区块转移到其他位置。广泛和持续的基因组重排和偏向性保留是六倍体基因组二倍体化的基本进化驱动力,这使得数千种十字花科植物在经历了几轮基因组复制后在全球范围内进化并占据了几乎所有类型的生态位,同时保持了相对较小的基因组。

图3 萝卜属基因组中24个祖先核型构建模块的定位(图片引自文献[1])

四、基于基因座和基因家族的泛基因组构建

将11个基因组构建成包含150,757个非冗余基因位点的泛基因组,其大约是单个基因组的三倍。核心基因座和不饱和泛基因座的相对小的比例表明萝卜基因组的高度可塑性。为了排除来自古多倍化的多拷贝基因的影响,进一步用基于基因家族的方法重建了泛基因组。两种方法共有97.3%的核心家族和94.3%的核心基因座重叠。然而谱系特异性家族和谱系特异性基因座的交集分别减少到75.3%和70.2%。核心基因在单个生物过程、生物调控、发育过程和其他基本生命过程中富集,而非必需基因在特定的代谢过程、许多细分过程的调节网络以及对生物和非生物胁迫的反应中富集。此外,与野生萝卜相比,驯化品种特有的亚核心基因与光合作用过程和脂质代谢过程相关基因等被富集,表明驯化萝卜经历了趋同进化,获得了更高的碳同化能力。

核心、非必需基因、特异性基因和单拷贝基因的百分比在染色体上分布不均匀,非必需基因、材料特异性基因和单拷贝基因在着丝粒周围区域的积累比例比核心基因高得多。特别是Chr.3上观察到显著的特异基因富集的岛。

图4 萝卜属的泛基因组组成和进化(图片引自文献[1])

A,基于基因座的泛基因组的假染色体。B,泛基因组基因座组成统计。C,每个基因组的基因座组成的统计。D,泛基因座和核心基因座的统计。E,泛基因组家族组成的统计。F,核心、非必需和特异基因的CDS长度。G,每个基因组中核心基因和非必需基因的Ka/Ks统计。H,泛基因组和和亚泛基因组的统计。I,基于基因座和基于家族的方法的核心基因和特异基因韦恩图。J,基因突变率。K,基因易位率。L,直系核心基因和非核心基因的共线性。

五、图形结构泛基因组构建

随着更多基因组的加入,非冗余插入和缺失的数量增加最终趋于平缓。相反,共享的SVs随着更多基因组的加入而下降。此外,材料间特异SVs的数量差异明显大于高频SVs的数量,野生萝卜比驯化品种含有更多的特异性SVs。特异性和低频SVs偏向于插入,表明插入而不是缺失在萝卜基因组的结构变异中起着更大的作用。以心里美基因组为参考构建了一个基于整合图的泛基因组。这种基于图的泛基因组将作为SVs水平的全基因组关联研究的有用参考。

图5 11个萝卜基因组中的结构变异A,两到十一个基因组中共有非冗余插入和缺失变异的总数。 B,每个基因组的结构变异与频率的对应关系。(图片引自文献[1])

六、抗病基因位于非必须和特异性位点

抗病基因在所有染色体的末端富集,而且材料之间的抗性谱具有高度的多样性。大比例的嵌合片段表明R基因重排和基序的获得和丢失在不同材料中频繁发生,从而驱动了差异抗性的进化。除了这些局部重排之外,还观察到了四个包含五个NBS簇和七个单基因座的长距离易位。长距离易位可以将两个区块连接在一起,促进新抗性基因的进化。这些结果证明了基因组重排、基因融合、结构变异、有偏性丢失和保留以及串联重复在抗性基因进化中起着重要作用。

七、赤霉素代谢途径的变化有助于萝卜表型变异和环境适应

与GA12形成相关的基因具有较高的保守性,而激活和失活GA1的氧化酶被增殖和分化以微调萝卜的发育。其中RsGA20ox9只在都开花很早的RS01和RS02中发现,表明RsGA20ox9是这两种萝卜类型的早花特性的候选调节因子。此外,通过基因组比较鉴定出1个GA20ox、1个GA3ox和8个GA2ox突变体。涝、盐、旱和低温处理RS03和RS00以及对不同地理来源的材料分析表明突变体RsGA2ox7有利于植物在次优或不利条件下的恶劣环境中生长,而且萝卜在不同的栽培区域实施了不同的进化策略。

图6 萝卜赤霉素失活基因的突变(图片引自文献[1])

A,RS03和RS09中RsGA2ox1的突变。B,三种RsGA2oxs的组织模式。C,RS02中RsGA2ox12的突变。D,四种萝卜中RsGA2ox12的突变率。E,RS03中RsGA2ox7的突变。F-I,胁迫条件下RsGA2ox12表达的荧光定量PCR分析。J-M,对照和胁迫处理幼苗。N,干旱条件下RsGA2ox12野生型和突变体植株的萎蔫率。O,RsGA2ox7突变的地理分布。P,适应不同环境的RsGA2ox12野生型和突变型植株。

参考文献

1. Xiaohui Zhang, Tongjin Liu, Jinglei Wang et al. Pan-genome of Raphanus highlights genetic variation and introgression among domesticated, wild and weedy radishes[J]. Molecular Plant, 2021.

你可能感兴趣的:(文章解析 | 萝卜泛基因组揭示萝卜属种间种内的遗传变异和基因渗入)