Cell | 基因组的自组织:结构和功能原理
原创 骄阳似我 图灵基因 今天
收录于话题#前沿分子生物学机制
撰文:骄阳似我
IF:41.582
推荐度:⭐⭐⭐⭐⭐
亮点:
基因组具有复杂的三维结构。遗传,生物化学,生物物理和细胞生物学方法的最新融合揭示了基因组组织的几个基本原理。基因组功能是基因组结构的主要驱动力,染色质的结构特征是基因组活性的调节剂,而不是二元决定因素。这些原则在自组织背景下的相互作用可以解释染色质特征的出现,细胞类型和组织中核结构的多样性和单细胞异质性,并解释基因组的进化保守功能特征,包括可塑性和稳健性。
真核生物中绝大多数生物体的遗传信息存储,转录和复制在细胞核中。为了将基因组容纳在细胞核的受限空间中,必须在多个水平上组织和压缩遗传物质—人类细胞中约2 m的DNA。
除了解决这个具有挑战性的拓扑问题之外,基因组的组织必须能够在正确的时间和正确的组织和细胞类型中执行正确的基因表达程序。遗传,生物化学,生物物理和细胞生物学观察的融合为基因组如何在3D空间中组织提供了前所未有的见解。之前,有研究者在Cell杂志上发表了一篇名为“The self-organizing genome: principles of genome architecture and function”的文章,总结了影响基因组组织和功能的几个主要原则。
真核生物基因组通过几种无处不在的结构特征进行组织。基因组的基本组织元素是染色质形成的纤维,环,结构域和区室,以及染色体。这些特征在多个水平和长度尺度上组织基因组。染色质纤维由包裹在核小体周围的146个碱基对(bp)的DNA单元组成,核小体由核心组蛋白的八聚体组成。染色质纤维通常在整个核中直径为5-24 nm,并且不规则地折叠成更高阶的特征,例如环和结构域。推测观察到的染色质纤维的小直径和柔韧性有利于动态状态,允许调节蛋白和RNA容易地进入染色质。然后染色质纤维自相互作用形成环。染色质环是大多数生物体中基因组的普遍特征,它们以各种大小存在,范围从kbs到Mbs,并具有多种功能。在最小规模上,环在距离上介导调节元件(通常是增强子与基因启动子)的相互作用通常为10到几百kb。多个增强子可以循环形成被认为整合信号事件或在靶基因上冗余作用的超增强子簇。更大的循环,长度可达MB,有助于基因组的3D压缩,并且经常用于通过上游元件与单个靶基因的顺序关联以精确的时间和空间方式调节基因簇。这种类型的调节在发育调节的基因中特别常见,其需要协调和准确的时间和空间控制。基因组组织的下一个层次是染色质结构域。它们被称为拓扑关联域(TAD)。它们通常为几百kb大小并通过环挤出机制形成,其中cohesin复合物通过其ATP依赖性分子运动活性驱动染色质环的形成。然后挤出的环折叠到自身上形成一个结构域,其边界由结构染色质蛋白CTCF定义。染色质结构域不是基因功能的重要决定因素,但主要为基因的准确调控和促进染色质-染色质相互作用提供了结构框架。了解染色质结构与基因组功能的相关性可以说是该领域当前工作的主要优先事项之一。单个染色质结构域倾向于组装成更高级的染色质区室。这种组织水平在异染色质和常染色质的空间分离中在形态学上是明显的。根据细胞学观察,基于远程相互作用的频率,全基因组生物化学分析已将每个基因组基因座分配给两个核区室A或B中的一个,其分别大致对应于常染色质和异染色质。结构域的高阶组织也可以通过生物化学映射检测相邻TADs之间的相互作用来表明,成像研究已经记录了多个结构域合并成高阶结构。染色体是基因组组织的主要单位,它们以染色体区域的形式存在于细胞核中。在整个间期,组成单个染色体的DNA占据了细胞核相对紧凑、空间受限的区域,而不是通过核空间分散。在哺乳动物细胞中,染色体区域的直径通常为2-3毫米,无定形球形,并且具有高表面积与体积比的特征,因为其内部被复杂的吻合通道网络渗透,这些通道被认为有助于获得调节因子染色质。相邻染色体的染色质纤维通常在它们的外围混合但不缠结,从而在整个核空间中产生连续的染色质,尽管已经报道了染色体界面处染色质密度较低。基因组组织的最终水平是染色体和基因位点在细胞核三维空间中的位置。染色体和基因的非随机位置的简单测量包括它们相对于核中心或外围的位置以及它们相对于其他基因座或染色体或核体的位置。图1:真核生物基因组的组织。
如上所述,基因组的结构特征现已得到很好的表征。但是他们怎么来呢?有几个一般原则,它们的相互作用导致基因组主要组织特征的出现。如聚合物-聚合物相互作用、基因组动力学、基因组组织中的相分离、作为基因组约束的架构元素、基因组组织和功能的随机性和异质性。图2:基因组组织原理。
如上所述,基因组的特征在于高度有序,由普遍保守的结构特征表示,例如染色质环,结构域和核体,以及非随机模式,例如基因和染色体的位置。此外,给定细胞的转录程序是稳定的并且定义其整体状态。同时,基因组组织和基因表达也是高度动态的,可变的和随机的。如何调和基因组组织稳态稳定性和内在变异性这两个明显矛盾的方面?一个暗示来自于认识到基因组组织的主要特征,包括动态,稳定的稳态和高度的异质性和可变性,是自组织系统的标志。自组织原则在自然界中无处不在,当应用于基因组时,提供了统一的机制来解释其许多结构和功能特征。图3:基因组组织中的驱动因素和制约因素。
应用于基因组,自组织可以解释基因组许多最突出的结构特征的形成,包括环,结构域,区室以及基因和染色体的3D位置。这些特征是由于自组织背景下驱动因素(特别是聚合物-聚合物相互作用和相分离)和基因组结构的约束(特别是核结构元素)的综合作用而产生。图4:染色质自组织特征的形成。
单个细胞类型由特定的基因表达程序定义。细胞类型还以全球基因组组织的不同模式为特征,例如异染色质结构域的范围和位置。一些考虑表明,细胞类型中活性基因表达程序的性质决定了基因组组织的局部和全局。活性和非活性基因组区域的模式在不同的细胞类型之间有很大差异。在细胞类型之间使用不同的基因集产生不同的细胞类型特异性染色质-染色质相互作用网络。由于这些相互作用推动了高阶基因组组织,染色质结构域和隔间的细胞类型特异性配置出现。基因组功能作为基因组组织的驱动因素的一个预测是,基因组的整体形态外观在细胞类型之间应该有所不同,并且基因组形态应该随着谱系分离的增加而有所不同。与这些预测一致,胚胎干细胞(ESC)具有全能性,在低水平上表达基因组的大部分,其特征是染色质大部分同质,几乎完全没有抑制性异染色质,而表达不同基因组的分化细胞根据细胞类型表现出广泛的基因组形态。不同的局部和全局染色质拓扑结构已根据形态学特征和众多分化和发育过程中的相互作用图谱记录,包括造血、心脏发生、ESC分化、小鼠发育和衰老。基因活性也影响局部染色质结构。基因的活动和不活动的随机脉动周期在染色质组织中产生周期性改变。在转录活跃期,染色质保持开放,但在基因转录停止时浓缩,表明活跃转录使染色质保持开放状态。作为支持,类固醇受体靶基因在用转录抑制剂处理后经历快速冷凝,并且需要持续转录以在转录后维持开放的染色质结构甲型流感感染。此外,转录的急性抑制导致局部启动子-增强子相互作用的全基因组丢失,而不影响结构域或隔间水平的高阶组织。这些结果支持这样一种观点,即转录过程不仅反映转录活性,而且在局部和全局上塑造染色质结构。图5:基因组功能驱动基因组结构。
基因组生物学的一个核心问题是结构特征如何与单个基因和整个基因组的功能相关。基因组结构和功能之间存在大量的相关性。最突出的是,异染色质的存在通常与转录抑制相关,启动子增强子环的形成与靶基因的转录激活有关。然而,这些相关性大多是不完整的,一些观察结果指出了理解结构和功能相互作用的两个重要但仍然未被充分认识的概念:第一,基因组功能是基因组结构的驱动因素;尽管基因组的结构特征影响其功能,但基因组的局部和全局活动也通过反馈机制形成其结构。其次,很明显,结构特征不是作为二进制开关,而是作为功能的调制器。结构和功能之间的双向反馈以及结构基因组特征的调节作用(而非确定性作用)的结合使基因组功能成为一个整体概率过程。图6:基因组的可塑性。
几十年的实验观察最近汇集在一起,形成了一个统一的模型,用于形成基因组最显著的结构特征,并解释了在单个细胞中观察到的基因组组织的变异性。现有数据支持以下概念:高阶基因组结构的主要特征是由基因组功能状态驱动的自组织系统中的涌现属性。自组织解释了空间基因组组织的主要特征的形成,从局部环和染色质域到基因和染色体的三维定位。它还解释了在单细胞水平上基因组结构特征的显著变化,同时确保了基因表达程序的可塑性和鲁棒性。在这一观点中,基因组组织的非随机结构特征是多个驱动事件叠加的结果,特别是聚合物-聚合物相互作用和相分离,以及约束,例如与细胞核结构元素的物理相互作用。重要的是,细胞中基因组的整体形态最终取决于基因组功能状态的双向动态相互作用,由其转录程序和结构特征确定。基因组自组织的一个关键特性是,结构基因组特征仅仅调节功能,而不是二元决定功能。尽管我们对基因组组织的非随机特征有了更好的理解,但挑战依然存在。可以说,基因组生物学的下一个前沿是全面阐明结构与功能的关系。这将需要开发新的工具,而不是像目前在突变和敲除实验中所做的那样仅仅依赖于结构与功能的关联。这些新方法可能包括纳米操纵工具,如光遗传学方法、非侵入性纳米力发生器,或用于在活细胞中创建和操纵染色质结构的合成生物学方法。
总之,这些方法将有助于有针对性地探索建筑特征的功能相关性,同时揭示驱动它们的分子和生物物理机制。我们对基因组组织的理解已经有了长足的进步。成像和生化方法的有力结合导致了基因组组织的基本特征和原理的表征。这些努力是现在开始阐明结构如何与基因组在健康和疾病中的功能有关的基础。随着认识到基因组结构是自组织系统的一个新兴属性,研究基因组的下一个阶段就在我们面前。
教授介绍:
Tom Misteli, Ph.D.
Tom Misteli是基因组细胞生物学领域的国际知名先驱。是美国国立卫生研究院杰出研究员
是受体生物学与基因表达实验室指导员,他在英国伦敦大学和纽约冷泉港实验室接受培训,在那里他开始使用成像方法研究活细胞中的基因组。他的实验室率先使用成像方法研究基因组和基因表达。他的实验室使用细胞生物学,分子,生物化学和成像方法来揭示基因组结构的基本原理,并将这些知识应用于癌症和衰老的新型诊断和治疗策略的开发。他因工作获得了多项奖项,担任多个国家和国际机构的顾问,并担任众多编辑委员会成员。他获得了许多奖项,包括Gian Tondury奖,查尔斯大学黄金奖章,2012 Flemming奖,Wilhem Bernhard奖章和Herman Beerman奖。
基因组组织和核结构的缺陷导致许多人类疾病,包括癌症,神经退行性疾病和肌营养不良症,并且它们与人类衰老有关。我们正在使用几种分化和疾病模型来阐明基因组组织如何促成生理过程和疾病,特别是在癌症和衰老中。他的实验室研究基因组的细胞生物学。将分子技术与活细胞显微镜结合使用,以了解基因组如何在完整细胞中组织,以及基因组的空间组织如何促进其功能。这些研究提供了对基本生物学机制的见解,并为癌症研究中的新型诊断和临床应用奠定了基础。
参考文献:
Misteli, T. The self-organizing genome: principles of genome organizationand function. Cell 183, 28–45 (2020)
Shopland, L. S. et al. Folding and organization of a contiguous chromosomeregion according to the gene distribution pattern in primary genomic sequence. J. Cell Biol. 174, 27–38 (2006)