日期:2019年2月9日——2019-Week6
分类:「思路,方法」
题目:An integrated chromatin accessibility and transcriptome landscape of human pre-implantation embryos
DOI: https://www.nature.com/articles/s41467-018-08244-0.pdf
杂志: Nature Communications , 21 January 2019
关键词: LiCAT-seq, embryonic genome activation (EGA), chromatin accessibility (CA), gene expression (GE)
介绍
这篇文章研究的是植入前胚胎的染色质可及性和转录组图谱,这个生物学问题去年也发表过一些高质量的文章,如:
- Li L., et al. Single-cell multi-omics sequencing of human early embryos. Nat.
Cell Biol. 20, 847–858 (2018).- Wu, J. et al. Chromatin analysis in human early development reveals
epigenetic transition during ZGA. Nature 557, 256 (2018).- Gao, L. et al. Chromatin accessibility landscape in human early embryos and its association with evolution. Cell 173, 248–259. e215 (2018).
那么这篇文章有什么创新和独特的地方,以及有什么不足的地方?
- 首先这篇文章报道了一种新的方法 LiCAT-seq
LiCAT-seq可以用于微量细胞同时分析染色质的可及性和基因表达图谱的方法。 - 发现了在人类植入前胚胎发育过程中,DUX4诱导了EGA基因和 MLT2A1元件处染色质结构的重塑。
关于DUX4在EGA过程中扮演的重要作用,之前也有研究报道,这篇文章从数据分析的角度补充了DUX4调控的细节,揭示了DUX4结合的一些基因,并且发现了内源性逆转录病毒在与DUX4的结合,这个结果虽说不是新的发现,但是补充完善了以前的机制,但是缺乏实验验证,整篇文章没有实验验证得出来的结论,这是这篇文章的一个不足。 - 提供了完整的代码和数据资源
LiCAT-seq的介绍
首先裂解分离mRNA和细胞核,然后对mRNA和染色质可及性平行建库,之后转录组用Smart-seq2单细胞转录组测序,ATAC-seq建库测序的方法他们做了些优化,LiCAT-seq可实现最少可用于10个细胞的建库和分析的目的。
技术上的优化主要是以下两个方面:
- Tn5转座酶标记后充分裂解细胞核
- 预扩增后使用Tn5接头的引物纯化基因组DNA
转录组和染色质可及性图谱的整体变化
他们主要关注从受精卵( zygote)到囊胚(blastocyst )时期以及卵母细胞(oocytes)和精子( sperm)时期转录组和染色质可及性图谱的变化。受精卵到囊胚经历了2、4、8细胞和桑葚胚(morula),其中囊胚时期细分为内细胞团(ICM)和滋养外胚层(TE)。所以共包括9个时期。
他们通过对ATAC-seq peaks数目的统计观察到从2细胞到胚胎发育晚期,染色质可及性的区域逐渐增多,卵子时期染色质可及性区域非常少,只有54个peaks,但是精子的染色质可及性却明显不同,开放区域还是较多的,有趣的是受精卵时期的染色质可及性出现短暂的增强。他们进一步比较了精子和卵子时期染色质可及性的区域重合部分很少,而且精子的开放区域分布在gene-poor区域,与其他时期明显不同(fig 1d), 在卵子和胚胎发育其他时期reads数和gene数成正比,精子展现出相反的规律(fig 1e),精子染色质可及性区域的gene数目少的特征可能对母本的TFs的结合至关重要,从而促使完成父本的重编程。
另外他们也用Y叔ChIPseeker R包对开放区域的基因组分布特征做了统计,并用PCA对ATAC-seq和RNA-seq数据分析,观察胚胎发育每个时期变化的关系。
聚类然后分析每个模块的转录组和染色质可及性图谱
胚胎基因组的激活( embryonic genome activation ,EGA)是胚胎植入前发育的重要事件。为了探究染色质可及性对EGA的影响作用,作者采用Mfuzz的聚类方法,将2细胞到桑葚胚时期的CA图谱聚成6类。
他们主要关注EGA中上调的基因,并将上调的基因与CA每个cluster相匹配观测启动子与远端区域的染色质可及性的变化,总体上CA和GE动态变化展现出相似的趋势。另外他们还挑选出特定的基因展示了CA和GE的变化。
整合RNA-seq和 ATAC-seq分析转录因子
用Homer鉴定胚胎发育每个时期染色质可及性差异区域的关键转录因子,如图a所示,展示了每个时期特异的转录因子的富集信号和基因表达水平。之前的研究报道过DUX4在EGA过程中发挥着重要的作用,但是缺乏人植入前胚胎的表观数据,对DUX4如何调控其靶基因的机制并不是很清晰,因此,他们接下来主要关注DUX4在EGA过程中发挥作用的机制。
从转录组数据他们发现DUX4, NFY 和SP1在4细胞时期表达量高,在随后的时期急剧减少。那么DUX4的结合与染色质可及性有什么关系呢?他们接下来通过DUX4的ChIP-seq数据,发现DUX4在2细胞和4细胞时期富集信号强,随后减少。并且发现DUX4的结合区域与CA的cluster 1重合比例最大,这也表明了DUX4在EGA起始中扮演的重要作用。
作者将DUX4结合位置的上下游10kb内的基因定义为DUX4的靶基因,然后观察其靶基因的动态表达情况,并将表达模式归结为3类。第1类,基因的表达在4,8细胞时期短暂升高,第2类,基因的表达在胚胎发育过程中逐渐降低,表明这些基因最初可能是母系转录本,第3类,基因的表达在胚胎发育过程中逐渐升高,表明DUX4可能起始了其他TFs的结合。DUX4可能通过诱导染色质结构重塑来激活EGA基因。
这一部分选择哪个TF做进一步探究需要熟悉相关的研究进展,哪些因子的作用是已知的,哪些是未知的,是否真正发挥作用需要通过实验验证,文章的这一部分做的并不是很完善。
逆转录转座子的染色质可及性和基因表达图谱的分析
这一部分算是文章的一个亮点,探究了逆转座子的染色质可及性和基因表达图谱。
逆转座子认为是古病毒感染的残留物,占人类基因组的40%以上,包括LTR/ERV( long terminal repeats containing elements,termed “LTR retrotransposons” or “endogenous retroviruses (ERVs)”)和LTR-lacking elements(such as LINEs, SINEs, and SVA elements),可作为调控元件影响宿主基因的转录。
他们观察到ERV元件最早的开放出现在4细胞期(如:LTR12C 和MLT2A1),另外OTX4和DUX家族的TFs在MLT2A1处显著富集,在LTR12C未出现相同的的富集。接下来计算了人ESCs中OTX4和DUX4的结合位点与4细胞阶段可接近的MLT2A1元件的交叉点,他们发现在4细胞阶段30.2%的MLT2A1元件被DUX4结合,只有9.5%被OTX2结合,表面DUX4在激活MLT2A1发挥的作用强于OTX2。
以上的结果表明DUX4通过结合到MLT2A1元件来激活HERVL,这是EGA期间ERV激活的主要事件。
代码和数据
- 代码
https://github.com/single-cell-BGI/Human_Embryo_LiCAT - 数据
- CNP0000193; https://db.cngb.org/cnsa/project/CNP0000193/public/
- SRP163205; https://www.ncbi.nlm.nih.gov/sra/?term=SRP163205