三维基因组 | 棉花 《Nature Plants》 2018

转自:https://www.sohu.com/a/220053461_761120

写在前面—— 什么是三维构象?

大家比较熟悉蛋白质的一级结构决定高级结构,高级结构决定蛋白质的功能。对于染色体来说,也是同样的道理。目前基因组测序获取了大量物种的染色体的一级结构(通俗讲DNA序列),对于基因功能研究起到了重要的作用,但染色体的高级结构(3D结构)对于基因功能研究也是不可或缺的。下面小编介绍一讲3D结构,首先得讲Hi-C技术。Hi-C技术主要将空间结构临近的DNA片段进行交联,下染色体3D结构是啥模样。

并将交联的DNA片段富集,然后进行高通量测序,对测序数据进行分析即可揭示全基因组范围内的染色体片段间的交互作用。利用Hi-C技术可以揭示基因组的三维结构基本特征,包括从隔室(A/B Compartments,)到拓扑相关结构域(TAD),最后再到环(loop)的染色质的这种层级结,从而阐明染色体三维结构。

目前在植物中,染色质相互作用尚未被广泛研究。在拟南芥中,3D基因组结构的全基因组分析揭示了染色质相互作用和表观修饰基的相关性,但在拟南芥中未鉴定到明显的与哺乳动物类似的TAD结构。但在拟南芥中,具有数百个TAD-like结构。随后在拟南芥单基因高分辨率的Hi-C图谱中分析揭示了基因Loop的结构,推测这可能是拟南芥中的基因组折叠的一个主要特征。水稻3D基因组分析,鉴定了1,763个TAD结构。

image

最近华中农业大学在Nature Plants发文阐述了棉花基因组的三维结构及其多倍化过程中三维结构的变化。下面小编详细解读一下

1 摘要

多倍体的形成显着增加了转录调控的复杂性,这可能与染色体的三维(3D)结构有关。但目前,关于多倍体化过程中三维基因组的结构及其亚基因组发生的变化研究仍然较少。作者因此在本文中描述了二倍体和四倍体棉花的3D基因组体的结构,并发现A / B隔室和拓扑结构域(TADs)的存在。通过比较四倍体中的每个亚基因组与其二倍体祖先基因组的三维结构,作者发现了基因组多倍化过程中发生了A / B隔室的切换和两个亚基因组中的TAD的重组。同时作者研究还表明,在多倍化过程中TAD边界的形成主要发生在开放染色质中,这与活性染色质表观遗传修饰标记相一致。此外,对亚基因组间染色质相互作用的结果分析表明了了同源基因的空间邻近性,可能与其协调表达有关。这项研究提高了对植物染色质三维结构的理解,将为3D基因组进化与转录调控之间的关系提供新的视角。

2 测序材料

1.三个棉种:雷蒙德氏棉,亚洲棉和海岛棉的叶片(分析中陆地棉来源公共数据)
2.测序平台:Illumina HiSeq 3000,PE150,两个生物学重复
3.各组学测序数据量:

image

单位Gb;

3 长距离交互片段鉴定(Loop)

在雷蒙德氏棉,亚洲棉,海岛棉中分别鉴定了 38,713, 16,921 和 51,475个基因间区的DNAase I 敏感位点(DHSs),这些位点通过Hi-C鉴定的相互作用片段与增强子进行关联,总共在亚洲棉中获得了13,418个推测的增强子, 雷蒙德氏棉中10,358 个推测的增强子,海岛棉中 23,256个推测的增强子。

在鉴定的增强子中 22.6% 参与了单一的交互,77.4% 的增强子参与了多个交互作用, 暗示了大多数增强子可能调控多个基因。通过RNA-seq 分析, 鉴定到了 3,879个增强子有转录活性,增强子作用的RNA中有43.8% 是长链非编码 RNAs,这可能暗示长链非编码RNA的在维持基因组三维结构潜在的功能。

4A/B compartment 分析

分析鉴定了54.2%的亚洲棉基因组,52.9%和52.4% 的陆地棉和海岛棉At亚基因组属于 A compartments,比例高于雷蒙德氏棉(45.1%) ,陆地棉Dt亚基因组(45.5% )和海岛棉Dt亚基因组(45.2%);染色体臂相比于着丝粒区域更加倾向于 ( 69% Vs 20%)分布在与开放染色质关联的Acompartment (图1), 着丝粒区域更加倾向于分布在 B compartments;A compartments区域基因转录活性显著高于B compartments (图 2a).

Fig. 1 不同棉种的染色体交互作用图

5 TAD鉴定

范围:300 kb–2Mb,鉴定个数亚洲棉1,343个,雷蒙德氏棉为913个,海岛棉At为1,331个,海岛棉Dt为852个。TAD的边界倾向于分布于转录活跃的基因(Fig. 2b),暗示了TAD的形成与基因转录之间的存在关联。

image

6 A/B compartment 转换

二倍体棉花与四倍体棉花之间的差异分析表明,二倍体和四倍体亚基因组之间的差异大于两个四倍体之间的差异(图3a,b)。A/B compartment比较分析,相比于二倍体亚洲棉,在陆地棉和海岛棉中分别鉴定了50.6Mb和52.5Mb基因组的区域存在A到B的转换,而存在27.1Mb和27.8Mb的基因组区域存在B到A的转换(图4a)。在Dt亚基因组中,通过与雷蒙德氏棉比较,在陆地棉和海岛棉中分别仅鉴定到了4.9Mb和5.6Mb的基因组区域存在A到B隔室的切换,6.5Mb和7.9Mb的B到A的转换(图4a)。这些结果表明,在多倍化的过程中,compartments倾向于A到B的转换(由常染色质转变为异染色质);同时相对于祖先基因组,亚基因组发生不同程度的compartment的转换,At亚基因组转换明显高于Dt。

image
image

7 TAD边界与保守性分析

在TAD 水平, 比较了保守的TAD边界和非保守的TAD的边界基因表达的差异。 非保守的 TAD 边界中基因倾向于存在差异表达( P<0.01). 在两个亚基因组中总共鉴定了1,329个差异基因。

棉花TAD边界的表观遗传修饰,以及探讨多倍化形成过程中的影响机制。通过分析发现每个棉花的TAD边界都具有高水平的DNase I敏感性(图5),表明TAD的边界是富含开放的染色质。染色质修饰使用三个染色质标记的ChIP-seq数据进行了研究(图5)。发现TAD的边界富含丰富的H3K4me3(活性染色质标记),缺少H3K9me2(异染色质表观遗传标记)。值得注意的是,H3K27me3(无活性染色质标记)在任何棉花种质中的TAD边界富集。此外,TAD边界周围的DNA甲基化(CG,CHG和CHH)分析表明,TAD边界的DNA序列CG和CHG甲基化水平较低,CHH甲基化在TAD内部与之间无显著差异(补充图6)。这些表观遗传修饰有助于在TAD边界上富集活性基因(图2b),表明活跃的转录可能有助于形成的TAD边界。

image

比较它们在保守TAD边界和非保守的TAD边界中的分布。使用二倍体的TAD边界作为参考,发现在四倍体棉种中的At和Dt亚基因组保守的TAD边界比非保守的边界显著富集DNase I的超敏感性信号(图5)。在H3K4me3表观遗传标记中观察到类似的分布模式。 H3K9me2在保守边界的信号低于非保守的边界。但H3K27me3的水平在在保守与非保守的TAD边界没有显着差异(图5)。除此之外,发现CG和CHG甲基化水平在保守的TAD边界上低于非保守的TAD边界(补充图6)。这进一步说明了在棉花多倍化过程中TAD形成和的基因组表观修饰存在关联。

image

8 同源基因的相互作用分析

At和Dt亚基因组如何在亚基因组水平上相互作用?为了调查这个现象,在陆地棉中确定了总共22,738个染色体间相互作用,在海岛棉中确定了21,749个相互作用。发现了亚基因组间的相互作用占据了大约四倍体棉花中所有这些相互作用的一半(陆地棉45.5%,海岛棉47.1%)。At亚基因组中染色体间相互作用的比例(At-At)高于Dt亚基因组(Dt-Dt),可能是由于At亚基因组大比Dt亚基因组大的原因。

亚基因组间普遍的相互作用,暗示了其可能对同源基因(每个亚基因组分布为1:1)的转录调控产生影响。通过与15,456个同源基因对分析,在陆地棉确定了3,339(21.6%)对基因存在相互作用,在海岛棉中发现了2,784对(18.0%)基因存在相互作用。通过RNAseq分析,发现有些高表达基因偏向于具有弱的染色质交互作用(补充图7b)。存在表达偏好(2倍)的基因在陆地棉中有25.9%,海岛棉有27.2%具有染色质相互作用。这些数据为揭示了多倍体中同源基因的协调表达一个新机制。

image

小编总结
本文通过雷蒙德氏棉(DD)和亚洲棉(AA)以及四倍体栽培种海岛棉(AADD)进行Hi-C测序,解释了棉四倍化过程中的三维构象变化。Hi-C技术现在的应用方向主要在两个方向,一是基因组染色体挂载,是二染色体互作(三维构象)。

参考文献
Maojun Wang etal. Evolutionary dynamics of 3D genome architecture following polyploidization in cotton[J].Nature Plants,2018

你可能感兴趣的:(三维基因组 | 棉花 《Nature Plants》 2018)