TT-seq文献阅读(TT-seq maps the human transient transcriptome)

今天的笔记是关于另一种RNA测序的方法,称为TT-seq。其实这些测序方法在几年前被人们所使用了,但是因为自己并不了解这些知识,所以要慢慢的补起来。

文献题目:TT-seq maps the human transient transcriptome

发表时间:2016
杂志:Science

摘要

基因组的普遍转录产生稳定的和不稳定的RNA(瞬时的)。作者开发了一种瞬时转录组测序(TT-seq),这个方法可以估测RNA合成和降解的速率。使用TT-seq对人类K562细胞进行测序,除了复原了稳定的mRNA和长非编码RNA的map以外,还绘制了瞬时增强子、反义RNA和启动子相关的RNA。TT-seq分析显示增强子RNA寿命短,缺乏U1基序(motif)和二级结构。TT-seq还能绘制短暂RNA下游的聚腺苷酸化位点,并揭示转录终止位点。作者发现,平均四个转录终止位点分布在平均宽度为~3300个碱基对的window中。终止位点与一种与RNA聚合酶暂停相关的motif一致。

正文

真核基因组的转录产生蛋白质编码mRNA和多种非编码RNA(ncRNAs),包括eRNA。大部分的ncRNA会非常快速的被降解,因此不能完全的对它们进行map。然而对于瞬时RNA的绘制图谱对于分析RNA序列、功能和“命运”是非常有必要的。

作者开发了瞬时转录本测序(TT-seq),这个方法绘制转录的活性区域,可以估测RNA合成和降解速率。TT-seq是基于4sU-seq的一项技术,将细胞暴露在核苷类似物4-硫尿核苷中(4sU)(图1A)。4sU在转录过程中被整合到RNA上,被标记有4sU的RNA被分离出来并对其进行测序。4sU-seq比RNA-seq更加灵敏,可以测到瞬时RNA。然而,4sU不能很好的map到人类转录本上,因为只有新生转录本的3’端才可以在4sU暴露期间被标记上,而提前已经存在的5’端区域则优先被测序。为了去掉这个5'端的bias,TT-seq在分离被标记的RNA之前先将RNA片段化(图1A)。因此,TT-seq方法只测定哪些最新被转录的RNA片段,提供了聚合酶在基因组上5分钟内的转录位置。

图1A

当使用人类K562细胞时,TT-seq样品新转录区域是唯一的,而4sU-seq产生5'bias(图S1A)。在TT-seq测序中,短寿命的内含子的覆盖率大概有60%,而在4sU-seq和RNA-seq中分别只有23%和8%(图S1A和S2)。TT-seq是高度可重现的,可完整的mapping转录区域,弥补GRO-cap和CAGE的方法,后二者检测的是RNA的5’端(图1B)。TT-seq可监测RNA合成,而PRO-seq, NET-seq和mNET-seq检测的是RNA与聚合酶的结合。因此,后面几种的方法产生的信号峰在启动子附近(聚合酶停留的地方)(图1B),而TT-seq的峰并不是。对于暂停和激活基因,TT-seq更能揭示RNA在启动子相关的其他区域上RNA的合成(图S1B)。

图S1A:不同测序方法对内含子的覆盖率。
图S2:TT-seq能够均匀地捕捉pre-mRNA,高灵敏度的检测到ncRNA。图是对2500个mRNA表达量最高的转录本的覆盖谱,根据长度进行排序,并对所有测量样本通过平均合并到每10个mRNA的bin中。基于位置的read计数的多少用颜色深浅表示。上面和下面分别代表sense和antisense的覆盖
图1B:比较TT-seq和其他转录谱分析方法。图里展示的是2323个缺少暂停、活化基因的转录unit的平均覆盖,左边是第一个TSS区域,中间是5’端内含子>10kb(包含第一个内含子)的区域。右边是polyA区域。最大信号位于相对于第一个TSS的第一个kbp中。
图S1B:在第一个TSS附近比较TT-seq和其他测序方法。

利用TT-seq数据和分割算法GenoSTAN,作者确定了21,874个明显非间断的基因组间隔转录(转录单位,TUs)(图2和图S4A)。TT-seq高度敏感,可复原GRO-cap的65%的转录起始位点(TSSs)。共有8543个TUs与GENCODE注释在正义方向的转录重叠。该分析检测到7810个mRNA, 302个长非编码RNA (lincRNAs)和431个反义RNA(asRNA)。与编码注释共享长度不到50%的2916个TUs未被分类。剩下的10415(48%)代表了作者新鉴定的ncRNA。

图2:

转录产物来自启动子,也来自增强子,增强子是具有特征染色质修饰的调控元件。为了检测包含潜在的增强子和启动子的染色质区域,作者使用GenoSTAN算法对共激活因子p300和一系列组蛋白修饰(H3K27me3、H3K36me3、H4K20me1、H3K4me1、H3K4me3、H3K9ac和H3K27ac)的 ENCODE ChIP-seq(染色质免疫沉淀测序)数据分析,并对脱氧核糖核酸酶I超敏数据进行分析(图S5A)。在强增强子状态的区域中,81%与至少一个TSS(从GRO-cap)和68%与聚合酶Pol II的峰重叠(图S5, B到D)。

图S5:染色质状态和相应的转录活性的基因组区域。(A)每个染色质Mark和状态(Txn,转录)的平均reads数。(B)累积的FDR与ChromHMM-ENCODE的关系。(C)部分恢复(重叠)GRO-cap测序结果中TSS在4种不同的状态(强启动子,强增强子、弱启动子、弱增强子)与ChromHMM-ENCODE的比较。(D)部分(启动子和增强子)染色质状态与Pol II和TAL1结合的标注,与ChromHMM注释相比较。

TT-seq的动态模型和RNA-seq 数据使我们可以估测RNA合成的降解的速率(图3和图S7)。作者估算在每一个转录位置上磷酸二酯键的形成和断裂,并在TUs内把这些平均,因此获得相对的转录速率和RNA的稳定性。作者发现mRNA和lincRNAs有着最高的合成速率和最长的半衰期。mRNA的平均半衰期是50分钟。其他类型的转录本合成速率比较低,半衰期也更短。这就解释了为什么ncRNA非常难以检测。eRNA的半衰期只有几分钟。短的RNA半衰期也伴随着缺少二级结构(图S7)。eRNA的折叠能量与其他RNA相比,它们的序列只有10%是具有结构的。

图3:不同RNA的半衰期
图S7

TT-seq还可以让我们能够发现转录终止位点(TTSs)。TT-seq检测了瞬时RNA下游的聚腺苷酸化(pA)位点(图S9)。

图S9

这种RNA由于RNA在pA位点裂解而难以检测,导致无保护的5 '端和外切酶降解RNA。总共6977个mRNA基因里作者平均得到4个TTSs,TTS是位于一个终端window,从最后一个pA位点延伸,直到最终的TTS,在最终的TTS处,RNA覆盖率会降到背景水平(图4,a到C)。终止窗口的平均宽度3300 bp,最宽可达10kb宽(图S10),与Pol II占用位置是一致的数据(图4 d),说明Pol II在TTS处暂停。

图4
图S10

没有对该文献进行全文翻译,只是翻译了一些我觉得应该了解的内容。有兴趣的同学可以自行下载原文阅读~

你可能感兴趣的:(TT-seq文献阅读(TT-seq maps the human transient transcriptome))