文献阅读 | GAM:基于ligation-free方法捕获基因组中增强子间的复杂互作 (Part I:文章梳理)

原文链接
Beagrie RA, Scialdone A, Schueler M, et al. Complex multi-enhancer contacts captured by genome architecture mapping. Nature. 2017 Mar 23;543(7646):519-524. doi: 10.1038/nature21411. Epub 2017 Mar 8. PMID: 28273065; PMCID: PMC5366070.
https://www.nature.com/articles/nature21411

文章概述

背景

在过去的十年里涌现出来大量的高通量测序的染色质构象捕捉技术,如3C,4C, 5C,GCC,HiC,ChIA-PET等。这些方法有一个共同的特点,即依赖于近端连接。近端连接仅能将空间上靠近的2段DNA连接在一起,因此不利于检测发生在染色质的多位点间的互作。

为了更好地检测发生在基因组中的多位点间的互作,本文的作者提出了一种不基于近端连接的全基因组染色质三维结构捕获方法,作者称其为 genome architecture mapping (GAM),这也是首个ligation-free的高通量三维结构检测方法。

Extended Data Figure 1c

方法原理

Figure 1

GAM将超薄冷冻切片DNA测序2种技术相结合。
具体而言,GAM首先对细胞结构进行固定,然后使用激光纤维切割从随机方向对细胞核进行冷冻切片。然后对每一片切片中的DNA分别进行提取、扩增和测序。

GAM的核心假设是:在空间中彼此靠近的基因组位点有更大的概率在同一片切片中被检测到。因此,对于基因组上的任意2个位点,可以通过计算2个位点出现在同一片切片的概率来推测它们在空间中的距离远近,并由此在全基因组范围内鉴定染色质位点间的互作。

与Hi-C的contact matrics相类似地,根据GAM数据可以计算得到 linkage disequilibrium matrics(下一节《文献阅读 | GAM:基于ligation-free方法捕获基因组中增强子间的复杂互作 (Part II:文章梳理》),LD值越高代表两个位点有更倾向于出现在同一个切片中,意味着更有可能在三维空间接近。

此外,作者还开发了SLICE 算法,专门用于从GAM数据中识别interaciton。

方法验证

作者将GAM应用于mESC细胞系鼠胚胎干细胞(mouse embryonic stem, mES)

数据基本情况概述
作者共产生了408张高质量DNA图谱(nuclear profile),称为mES-400 dataset),平均1.1 M read / 细胞核。以30kb 分bin,大约每个nuclear profile 能覆盖全基因组 6 ± 4% 的30kb bin。

比较GAM 与 Hi-C

Figure 2

首先,作者通过比较GAM与传统Hi-C方法来证明GAM数据的可信度。
在 1Mb 分辨率下,GAM与Hi-C的染色质互作矩阵(contact matric)的相关性高达0.63。并且之前在Hi-C数据
中观察到的2种(经典染色质结构compartment A/B和TAD)在GAM数据中也可以观察到(Figure 2)。

利用GAM数据研究启动子-增强子互作

作者开发了SLICE软件,用于从GAM数据中识别三维基因组中互作的染色质位点(作者称之为prominent interaction),并估计位点间的互作频率。图Figure 3b中展示了互作频率显著大于0的位点间的互作概率。

Figure 3b-d

接下来作者探讨了基因表达与染色质三维互作的关系
在30kb resolution下,作者根据一个30 kb window内检是否有活跃表达的基因(FPKM>1 [1])或增强子元件[2]的存在对所有的genomic bin进行分类,并发现染色质三维互作富集在-活跃表达的基因-基因、基因-增强子与增强子-增强子间(Figure 3c)。

与Hi-C相比,GAM最大的优势是是可以检测基因组内的多点互作(multivalent interaction)。作者通过统计学分析判断mES-400数据集在检测三点互作(triplet contact)时的分辨率最低可以在几百kb,这大约是TAD大小。因此,作者使用SLICE模型找出最有可能发生三点互作的 100k 个 top TAD triplets.
类似地,作者根据TAD内是否存在超级增强子(super enhancer, SE),以及表达量的高低对TAD进行分类,TAD triplets在3个均包含有SE的TAD中最为富集,此外在包含有SE的TAD和高转录TAD间也有富集。最后作者选取了2组发生在SE间的TAD triplets,使用CryoFISH进行了验证,一方面证实了使用SLICE model预测的interacting-TAD间的距离小于non-interacting-TAD; 另一方面,也在观察到了TAD triplets在同一个细胞中聚集。

Figure 4

Figure 5

下一篇:《文献阅读 | GAM:基于ligation-free方法捕获基因组中增强子间的复杂互作 (Part II:数据分析)》

参考文献

[1] Brookes, E. et al. Polycomb associates genome-wide with a specific RNA polymerase II variant, and regulates metabolic genes in ESCs. Cell Stem Cell 10, 157–170 (2012)
[2] Whyte, W. A. et al. Master transcription factors and mediator establish super-enhancers at key cell identity genes. Cell 153, 307–319 (2013)

你可能感兴趣的:(文献阅读 | GAM:基于ligation-free方法捕获基因组中增强子间的复杂互作 (Part I:文章梳理))