文献
2023
Nature Genetics
Genome assembly and genetic dissection of a prominent drought-resistant maize germplasm
研究背景
干旱是作物生产的巨大环境限制,造成的作物年产量损失比所有病原体的总和还要高。由于全球气候变化等气候问题,培育高产和抗旱强的品种需求迫在眉睫。
玉米是一种世界范围的作物,每年因干旱导致玉米减产越39.3%。
玉米基因组有超过85%区域是重复序列,在玉米基因组中准确和完整的鉴定结构变异具有极大的挑战性,因为它严重依赖高质量参考基因组和更准确的鉴定方法。
B73和Mo17是玉米两个杂种优势群体的代表,它们的高质量参考基因组组装已经完成,为玉米基因组的探索提供了宝贵的资源。
之前的研究中,鉴定到一种热带玉米种质CIMBL55,具有突出的抗旱性,并且挖掘到了许多重要的抗旱基因,如ZmVPP1,ZmNAC111和 ZmABH2.
本文亮点
本研究中作者组装了一个高质量的CIMBL55基因组。
高质量参考基因组为抗旱遗传基础的挖掘、结构变异的鉴定、表观基因组分析和抗旱性基因克隆提供了基础。
结论1 CIMBL55的基因组组装及注释
CIMBL55来自于热带/亚热带地区,抗旱性显著。超过70%的CIMBL55幼苗在干旱处理下存活,而B73和Mo17幼苗只有约
20%的幼苗存活(Fig 1a),CIMBL55植株生长发育正常,与大多数优良玉米种质相似(Fig 1b)。在田间缺水条件下,B73叶片开始出现卷叶和萎蔫现象,而CIMBL55植株表现正常健康(Fig 1c),在田间相同干旱胁迫下,CIMBL55的产量损失(约40%)明显小于B73(约98%)和Mo17 (约70%,Fig 1d)。
Fig 1e
Fig 1f
为了探索CIMBL55的抗旱机制,我们对其基因组进行了测序,并利用60× RSII和100× PacBio的Sequel 2单分子实时测序、160× BioNano单分子光学定位和35×Hi-C 测序进行了从头组装。最终组装得到116个scaffolds,覆盖约99.0%的基因组,最终组装的基因组大小为2159.5 Mb,scaffold N50为223.6 Mb (Fig 1e)。
与B73和Mo17基因组比较发现,CIMBL55和SK (另一种热带/亚热带种质) 的Chr7缺失约440 kb, Chr8插入约560 kb (Fig 1f),表明这些差异在热带/亚热带种质中可能是共同的。另外CIMBL55的Chr9 存在一段2.2Mb的倒位 (Fig 1f),在其他三份材料中没有发现,但是在另外25份材料的15份中发现了这段倒位,说明这是玉米种质资源中常见的遗传变异。
Fig S3
在CIMBL55中共注释了38439个高置信度基因,平均基因长度为4289 bp,对CIMBL55基因组的注释显示,约83.95%的序列为转座子。圈图揭示了DNA-TEs和蛋白质编码基因在染色体上的相似分布模式,并且RNA-TEs的分布与在着丝粒附近突出的高水平的CG和CHG甲基化有关(Fig S3)。
Fig 2a
基因的共线性反映了不同基因组间基因含量及其在染色体上排列的一致性。CIMBL55和B73的基因共线性分析表明,73%的CIMBL55基因位于共线性块中,27%的基因被认为是非共线性基因(Fig 2a)。
Fig 2b
共线性基因进一步分为三类:第1类基因 (42%) 位于B73和CIMBL55的同源染色体上,大部分为单拷贝基因 (一对一);第2类基因 (29%) 是位于各自基因组中两条不同同源染色体上的重复基因(多对多),例如,在Chr8上 (B73: 171.42-172.37 Mb vs CIMBL55: 173.94-174.66 Mb)和Chr3上 (B73: 179.45-177.61 Mb vs CIMBL55: 185.75-183.78 Mb)(Fig 2b);第3类基因 (2%) 位于CIMBL55基因组未挂载到染色体的contig中,但与B73中的对应基因处于共线性块中。
非共线性基因包括第4类 (16%) 和第5类 (11%) 基因:第4类基因有同源基因,但与B73中的对应基因不同,它们没有在共线性块中;第5类基因(e值<1e-20)未发现同源蛋白序列,但其中97%的基因在B73中具有DNA同源物,这表明这类基因可能经历了显著的基因结构多样化或功能丧失。
Fig 2c-d
相对于第1类基因,第2类基因倾向于出现在较小的共线块中(小于1000个基因,Fig 2c)。基于从叶片样品中获得的转录组数据,共线性基因的转录丰度高于非共线性基因,表明基因组重排可能损害了基因的表达(Fig 2d)。
Fig 3a
为了发掘CIMBL55高抗旱性的遗传因素,作者在泛基因组水平上研究了遗传变异,包括25个NAM起始自交系和SK 、Mo17、k0326Y、A188基因组,这些基因组的contig N50均大于5.0Mb. 为了确定发掘遗传变异信息,将30个组装好的玉米基因组序列与B73_v5参考基因组进行比对,并通过以下四个程序:SyRi、Smartie-sv、CuteSV和Sniffles进行比较。一共鉴定到17,581,014个非冗余结构变异,包括16,311,409个插入/缺失变异、2,396,11个重复、496,685个倒位、499,973个易位和33,336个拷贝数变异。
SyRi(基于组装的基因组序列比较)在识别各种类型的变异方面表现出有效性,Smartie-sv(基于组装的基因组序列比较)和CuteSV(基于长序列比对)在识别InDels (>50 bp)方面比其他程序表现更好(Fig 3a)。
在368份玉米种质的中成功分型了544,853个结构变异,并根据干旱后幼苗成活率分析了这些结构变异与抗旱性的关系。
Fig 3b-c
之前的研究通过GWAS和孟德尔随机化分析分别鉴定到42和97个候选的抗旱基因。为了解析CIMBL55突出的抗旱性,我们对CIMBL55中这些位点的基因型进行了研究。
根据之前的SNP信息,CIMBL55中有108个基因的基因型。CIMBL55中含有79个优势等位基因,其定义为携带该等位基因的种质在干旱后的平均存活率明显高于携带对应等位基因的种质(Fig 3b)。 由于许多候选基因根据其基因表达的变化被预测与抗旱性相关,因此我们寻找与抗旱性密切相关的潜在结构变异,这些结构变异可能在影响基因表达方面发挥潜在作用。
分析结果显示,69个基因与耐旱性相关,且与79个通过SNP鉴定的基因存在强烈连锁不平衡(r2 > 0.5,Fig 3c)。
值得注意的是,在CIMBL55中发现了65个基因的优势单倍型(SNP和SV均为抗旱等位基因),解释了CIMBL55在群体中的优势抗旱性。此外,108个基因中有11个候选基因在非CIMBL55等位基因中被鉴定出优越的单倍型,表明其他种质可能具有与CIMBL55互补的玉米抗旱性遗传资源。
Fig S6a
Fig 3d-e
ZmABF4基因的第二内含子上发现了与抗旱显著关联的SNP和SV(Fig S6a),ZmABF4编码一个bZIP转录因子,是拟南芥ABA响应因子的同源物,被认为是ABA和干旱诱导基因表达的主要调控因子。与携带ZmABF4 (B73)等位基因的种质相比,携带ZmABF4 (CIMBL55)等位基因的种质具有明显更高的基因表达水平和抗旱性。
Fig 3f-h
与非转基因野生型(WT)植株相比,转基因ZmABF4植株在干旱胁迫下的存活率显著提高,叶片水分流失率显著降低(Fig 3f-h)。这说明ZmABF4正调控玉米抗旱性,ZmABF4 (CIMBL55)基因表达水平较高,可能是有利等位基因。
Fig S7
通过对B73、Mo17和CIMBL55进行全基因组亚硫酸盐测序,能够准确评估和比较3种种质的DNA甲基化状态。mCG和mCHG的总体水平在整个基因组中相当高,但在基因边界明显降低,相比之下,整个基因组(包括RNA-TE区域)的mCHH含量普遍较低,而DNA-TE元件的mCHH含量相对较高,这表明在这两种类型的te中,不同的机制调节CHH甲基化 (Fig S7a-c)。有趣的是,24nt sRNA优先定位到基因边界和DNA-TE区域内,类似于mCHH的模式,表明这些区域可能参与了RNA导向的DNA CHH甲基化(Fig S7d)。
Fig 4a-c
基于组装的CIMBL55和B73参考基因组序列,作者确定了结构变异相关差异甲基化。在CIMBL55中鉴定出5346个插入片段,可以双向确认,用于结构变异相关的DNA甲基化分析。
基于mCG、mCHG和mCHH水平的分层聚类方法,将插入序列(包括其0.5 kb-侧翼区域)的DNA甲基化模式聚为5组 (Fig 4a-c)。属于cluster1-3的插入显示出相当高的mCG, mCHG和mCHH水平,而属于cluster5的插入显示出普遍低水平的DNA甲基化。
值得注意的是,与侧翼序列相比,cluster4 插入片段中的mCG、mCHG和mCHH水平明显更高(Fig 4b、c)。
DNA-TE,特别是DTH在这一插入簇中富集(Fig 4b)。
Fig S8
插入长度集中在100 - 1000 bp的范围内,并且相对靠近邻近基因的转录起始位点,说明基因附近的DNA-TE,尤其是DTH,倾向于甲基化CHH(Fig 4b,Fig S8a、b)。
Fig 4d-f
ZmNAC075是一个含有NAC结构域的转录因子,在它的启动子区域发现了差异DNA甲基化。据报道该基因家族的几个成员在几种植物的水分亏缺耐受中起着积极的作用。
比较CIMBL55和B73的基因组序列,发现ZmNAC075 (B73) 上游区域有两个插入,S-9041 (182 bp)和S-1425 (5123 bp),这导致了相对于ZmNAC075 (CIMBL55)的CG、CHG和CHH的高甲基化。
这两个插入在3‘-UTR中显示出与先前鉴定的SNP的强连锁不平衡,这被预测为基因表达的局部eQTL(Fig 4d)。携带ZmNAC075 (B73)等位基因的种质在干旱胁迫下的表达水平明显低于携带ZmNAC075 (CIMBL55)等位基因的种质(Fig 4e-f)。
Fig 4g
Fig 4h-l
为了揭示这两个结构变异的高甲基化对ZmNAC075 (B73)表达的影响,我们构建了携带ZmNAC075 (B73)等位基因的LH244遗传背景下玉米DRD1基因敲除系。在拟南芥中,DRD1可促进RNA介导的DNA甲基化,可能对邻近基因的表达起表观遗传调控作用。全基因组甲基化数据显示,与WT (LH244)相比,Zmdrd1突变体S-9041和S-1425的mCHH水平显著降低,而mCG和mCHG水平没有变化(Fig 4g-k)。同时,ZmNAC075 (B73)的表达显著增加(Fig 4l),表明ZmNAC075 (B73)上游两种新鉴定的结构变异的高CHH甲基化可能导致基因表达受到抑制。
Fig 5a-c
编码网状样蛋白的ZmRtn16是在CIMBL55中鉴定的65个优越等位基因之一。据报道,该蛋白家族的成员在种子萌发过程中参与糊粉细胞的膜自噬以及蛋白质从内质网运输到高尔基体。在不同条件下,ZmRtn16内或附近的几个遗传变异与基因表达水平存在显著相关性,表明该基因表达具有很强的局部调控作用(Fig 5a-c)。
Fig 5d
我们发现,在3‘-UTR中新发现的插入S2290 (28-bp)与干旱暴露后的植物存活率密切相关,并且它与位于内含子和最后外显子的其他重要非同义SNP处于强LD状态(Fig 5d)。
Fig 5e-f
携带ZmRtn16 (CIMBL55)等位基因(无28 bp)的种质比携带ZmRtn16(B73)等位基因(插入28 bp)的种质表达水平和抗旱性显著提高,表明该变异可能影响该基因的表达和抗旱性(Fig 5e-f)。
Fig 5g
为了确定该变异是否真的影响ZmRtn16的转录本丰度,我们克隆了B73和CIMBL55的3‘-UTR序列,其中包含先前发现的显著SNP (S2181)和28-bp SV (S2290)。将这两个片段融合到ZmRtn16 (B73)编码序列的下游,并将构建的质粒转染到玉米叶片原生质体中。结果表明,含有CIMBL55克隆序列的构建体产生的ZmRtn16转录本的丰度显著高于B73构建体。此外,将S2181的核苷酸从B73基因型改变为CIMBL55基因型未能在ZmRtn16表达中产生任何明显差异,而从B73序列中删除28 bp显著增加了转录本丰度至与CIMBL55序列相似的水平(Fig 5g)。这些数据表明,ZmRtn16 B73 3′-UTR中的28 bp插入,而不是SNP,是影响zm RTN 16表达的原因变异。
Fig 5h-i
通过过表达ZmRtn16基因发现相对于野生型,在ZmRtn16过表达植物中观察到更强的抗旱性(Fig 5h),相反,在两个CRISPR靶向基因敲除系中ZmRtn16功能的中断导致了损害的干旱胁迫抗性(Fig 5i)。
Fig 5j
ZmRtn16过表达植株的产量在干旱条件下显著高于野生型,但在充足的水可用性条件下它们是相当的(Fig 5j)。以上数据表明ZmRtn16在植物抗旱性中发挥积极作用。最后作者通过一系列分子生化实验解析了ZmRtn16的相关机制,由于这部分与生信分析无关,不再具体展开。
总结
通过组装抗旱性强的玉米品种CIMBL55高质量参考基因组,结合SNP和SV的全基因组关联结果,发掘到一系列与抗旱相关的基因,并且强调了结构变异导致的DNA甲基化变异对抗旱的影响。
本文使用 文章同步助手 同步