众所周知,细胞对缺氧的适应是癌症的hallmark之一,但缺氧诱导因子(HIFs)对肿瘤发生的相对贡献尚不清楚。因此,今天小编要和大家分享的是今年3月2日发表在Nature Communications(IF:12.121)杂志上使用多组学数据分析急性缺氧反应与肿瘤的文章。
多组学分析揭示急性缺氧反应中相关的肿瘤抑制和致癌基因模块
一.研究背景
缺氧不论是在人体的生理和病理过程中都起着重要作用,缺氧也是实体瘤快速增殖和异常血管形成的共同特征。其中,低氧诱导的转录因子HIF1A和HIF2A是众所周知的低氧应答调节因子,其会诱导基因参与代谢重编程、血管生成、组织重塑、干性和免疫调节。在癌症中,HIFs在不同的环境中被描述为致癌基因或肿瘤抑制因子。HIF活性与死亡率升高、转移、干细胞形成、免疫逃避和治疗抵抗有关,这也为靶向这些转录因子治疗癌症提供了理论基础。今天小编介绍的文章使用精确测序来测量观察缺氧转录变化,定义了急性缺氧的早期转录反应。
二.数据及方法
1.细胞培养:研究培养了HCT116, RKO, A549及 H460 四种细胞。其中HCT116 HIF1A-/-细胞通过病毒介导的同源重组,干扰HIF1A位点的外显子3和4,导致三个阅读框中包含翻译终止密码子的226 bp缺失。所有的细胞开始保持在37℃含5% CO2湿气氛中,接着保持在上述常氧或暴露在含1% O2、5% CO2和94% N2的湿气氛中。
2.蛋白质印迹:通过裂解细胞球制备蛋白质样品,然后进行超声波处理,并进行热变性处理,测定蛋白质浓度等。
3.荧光检测活细胞缺氧:使用Image-iT红色缺氧试剂观察活细胞的缺氧情况。
4.PRO-seq文库的准备和测序:包括核的制备、核run-on和文库准备等步骤。
5.PRO-seq数据分析:文章将读数转换为fastq格式,每个样本合并两次测序运行的数据。采用FASTQC和FastQScreen评估数据质量,接着对低质量读数进行裁剪和过滤。对人类参考基因组进行比对;获得TSS和基因体区域的基因水平计数数据;自定义注释文件以单一独特的TSS每个基因和基因体区域生成。使用DESeq2包对基因体区域的差异表达进行分析。使用自定义R脚本和用于可视化的ggplot2包对RNAPII暂停进行分析。基因体和TSS计数标准化,并以TSS标准化读数(cpm/bp)与基因体标准化读数 (cpm/bp)之比计算暂停指数(PI)。排除样本中小于0.5cpm的基因。
6.RNA-seq文库的制备和测序:RKO、A549和H460细胞电镀并处理24小时,使用TRI试剂从细胞微球中提取总RNA,评估RNA质量,接着进行Poly-A(+) RNA富集和链特异性文库制备。
7.RNA-seq数据分析:对于RKO, A549和H460细胞的RNA-seq数据,使用FASTQC评估数据质量,并使用FastQ Screen检查常见的测序污染物。然后使用SAMtools过滤对齐的读数以删除低质量的映射读数。使用RSeQC对最终映射读数进行质量评估,使用R中的DESeq2评估差异基因表达。
8.ChIP-seq文库的准备和测序:各细胞系(HCT116、RKO、A549和H460)的次融合在常氧或缺氧条件下培养24小时。经过处理后,细胞裂解并超声生成DNA片段。离心样品,用BCA蛋白测定试剂盒测定收集上清中的蛋白浓度,过夜孵育。处理后采用琼脂糖凝胶电泳筛选DNA片段,使用试剂盒制备条形码文库。
9.ChIP-seq数据分析:采用FASTQC和 FastQ Screen评估数据质量。使用FASTQ-MCF对低质量读数进行裁剪和过滤。使用Bowtie2对人类参考基因组进行比对。接着进行峰区识别、注释和基序富集分析。为了直接比较不同细胞类型的峰值信号,MAnorm被用于标准化和量化所有峰值位点的读数密度。第三方ChIP-seq数据被下载为原始数据,并进行处理。为了将近端HIF1A峰与假定的靶基因相关联,同时最小化假阳性和假阴性,作者根据峰的富集信号及其与TSS区域的距离对其进行评分。使用IGV从bedGraph文件生成基因组浏览器快照。
10.GSEA和IPA分析:研究使用 GenePattern服务器上的GSEAPreranked模块进行基因集富集分析(GSEA),以log2转化的PRO-seq基因体对数变化作为排名尺度。使用Ingenuity Pathway Analysis(IPA)预测差异表达基因的调控因子。使用metascape对指定的基因列表进行功能富集分析。
11.DepMap数据分析:修正了来自DepMap 公开发布19Q3的GERES基因效应分数。计算所有基因对HIF1A的基因效应得分的成对Spearman相关得分和p值。使用tidyverse和ggplot2软件包对每个基因与HIF1A的相关性进行排序和可视化。
12.TCGA数据分析:获得标准化TCGA患者临床数据,下载TCGA样本的RNA-seq表达数据。对于每种癌症类型,在至少50%的样本中未检测到的基因被移除。急性缺氧特征评分:首先根据每种癌症类型中每个基因的RSEM表达值计算Z-scores。急性缺氧评分计算为每个样本中急性缺氧上调基因的Z-scores之和;迭代Kaplan-Meier 、log-rank检验;Cox 回归分析。
三.研究的主要结果及内容
1.缺氧急性转录反应的识别
在研究的第一部分作者为了识别缺氧时转录活性的快速变化,对正常及暴露在低氧的HCT116野生型及HIF1A-/-细胞执行了PRO-seq(图1a),接着使用荧光性缺氧报告 Image-iT Red实时检测以及稳定HIF1A和HIF2A(图1b)。接下来作者定量了基因体区域内的PRO-seq信号,并使用DESeq2对进行了差异转录活性分析,观察到野生型细胞缺氧后,转录激活和抑制明显(图1c),这种早期转录反应很大程度上依赖于HIF1A的存在,因此可以观察到在HIF1A -/-细胞中激活和抑制都减少(图1c, d)。作者进一步分析在HIF1A-/-细胞中观察到残余变化可以由HIF2A驱动,HIF2A在HCT116细胞中表达并在缺氧时稳定(图1b)。急性转录反应的基因集富集分析(GSEA)也发现缺氧和糖酵解相关基因的正富集(图1e)。作者分析观察到,相对于它们的基因体,急性缺氧诱导基因在TSSs的转录活性上表现出相对适度的变化,随后暂停指数(PI)下降,HIF1A−/−细胞反应受损(图1f, g)。研究也发现在常氧或缺氧期间,HIF1A缺失对转录没有明显的整体影响,野生型和HIF1A -/-细胞在TSSs和基因体上都显示出高度相关的转录活性。然而,HIF1A -/-细胞的metagene谱显示TSS处信号轻度降低(图1g)。这些观察结果促使作者探索HIF1A的基础水平是否有助于缺氧诱导基因在常氧状态下的表达。结果发现107个急性低氧诱导基因的子集在HIF1A -/-细胞中表现出较低的基础表达,包括特征明确的HIF1A靶点(图1h-i)。
图1 HIF1A驱动的缺氧急性转录反应的识别
2.急性反式激活与强HIF1A结合相关
在文章的第二部分,作者研究了急性激活和抑制之间的关系,并通过ChIP-seq测量HIF1A染色质结合。结果发现HIF1A ChIP-seq峰在缺氧反应元件基序中富集,基本上在缺氧时都表现出信号增加(图2a)。研究也发现尽管在缺氧时,所有类型的基因在TSSs中都增加了ChIPseq富集信号,但与转录无显著差异的基因相比,只有那些在缺氧时被急性上调的基因在TSS周围表现出更强的结合(图2b)。作者也发现尽管缺氧诱导HIF1A在数百个启动子区域附近结合,但与被抑制或未受影响的基因相比,与急性转激活基因相关的峰值往往显示出更强的富集信号(图2c)。接着对远端HIF1A峰的研究表明,那些与上调基因相关的峰(被称为生产结合位点)在常氧条件下也表现出双向转录活性(图2d)。相比之下,与上调基因无关的远端峰(称为非生产性结合位点)表现出低得多的转录活性,且大多不受缺氧或缺乏HIF1A的影响(图2d,e)。当分析HCT116细胞时,发现与非生产性位点相比,生产性远端位点增加了DNaseI可及性,并增加了与增强子相关的组蛋白修饰的富集(图2f),且HIF1A富集信号近端和远端峰均与上调基因的基因体转录倍数变化呈正相关,近端峰相关性更强(图2g,h)。总体而言,与近端或远端HIF1A峰相关的基因占急性反式激活事件的52%(图2i),且具有两种峰型的基因往往在高效转录中表现出更大的增长(图2j)。分析也发现将近一半的急性反式激活事件表现出依赖HIF1A(图2 i, j)。IPA上游调控因子分析预测这些基因中的一些受到信号通路、转录因子和染色质调控因子的调控,而这些调控因子本身是直接由HIF1A诱导的(图2k, l)。
图2 急性反式激活与HIF1A结合有关
3.急性反式激活需要CDK8激酶活性
在这一部分由于作者先前的研究识别了媒介相关激酶CDK8作为HIF1A的转录辅助因子。然而研究是采用稳定状态mRNA的测量,这不能正确地定义CDK8在急性缺氧期间对转录程序的直接或间接贡献。因此,作者在用DMSO或3MB-PP1处理并暴露于21%或1% O2下90分钟的HCT116 野生型和CDK8as/as细胞中重复了PRO-seq分析。对DMSO-和3MB -PP1处理的HCT116细胞的基因体转录活性分析表明,缺氧驱动的反式激活普遍需要CDK8激酶活性(图3a)。研究也发现缺氧后显著反式激活的1547个基因中,有405个基因在3MB-PP1完全抑制CDK8后表达量显著降低,99个基因表达量增加(图3b)。通路分析显示,需要CDK8激酶活性的缺氧诱导基因富集于缺氧、糖酵解和细胞外基质重塑相关的通路(图3c)。上游调控因子分析发现,在那些需要CDK8进行转激活的基因中,富集了由HIF1A调控的基因,而在“CDK8抑制基因”中没有明确的上游调控因子(图3d)。进一步分析发现依赖CDK8的基因包括参与糖酵解的显著HIF1A靶点(图3e)。同时在需要CDK8激酶活性才能反式激活的缺氧诱导基因中,CDK8抑制显著降低了生产伸长,对TSSs转录的影响较小(图3f,g)。因此,在CDK8抑制下,这些基因在缺氧期间的暂停指数没有下降,这也说了HIF1A和CDK8协同作用刺激RNAPII伸长(图3g)。
图3 缺氧的急性转录反应需要CDK8激酶活性
4.急性反式激活与mRNA表达的相互作用
在这一部分作者研究了急性反式激活与缺氧24小时后稳态mRNA水平变化之间的关系。研究发现大多数急性反式激活事件对应于稳态多腺苷化mRNA在稍后时间点的显著增加(460个基因,图4a),作者将这组基因定义为急性反应基因。缺氧在较晚的时间点诱导了更多的mRNA水平的变化,而这些变化并不对应于早期的转激反式激活事件,作者将这些基因称为晚期反应基因(1672基因,图4a)。此外,研究发现与急性反应基因相关的HIF1A峰相对于晚期反应基因相关的峰往往表现出更强的HIF1A结合水平(图4b)。上游调控因子分析表明,在急性反应基因中,HIF1A靶点富集,而在晚期反应基因中,大量转录调控因子靶点富集(图4c)。当比较基因体PRO-seq信号和急性反应基因mRNA RNAseq信号时,作者发现RNA输出水平和fold-change在这两种测量之间都呈正相关,这表明早期转录输出是较晚时间点稳定mRNA水平的重要驱动因素,缺氧诱导基因的表达水平覆盖几个数量级(图4d)。例如,相对于低转录基因 HIF1A靶点在早期产生的大于100倍的新生RNA和稳定状态的mRNA(图4e)。为了研究转录输出强度的调节机制,作者分析了染色质环境、RNAPII占用和HIF1A结合的变化。结果发现缺氧90分钟的转录输出与基因活性相关的组蛋白标记水平呈正相关,但与H3K9me3不相关(图4f)。
图4 急性转录输出形成了对缺氧的稳态转录反应
5.缺氧对急性反式激活的保护
在这一部分作者为了研究缺氧对急性反式激活的保护作用,对另外三种类型的癌细胞:RKO(结直肠癌),A549(肺癌)和H460(肺癌)重复了RNA-seq和HIF1AChIP-seq分析。结果发现尽管在缺氧24小时后,RNA-seq检测到的低氧诱导mRNA总体多样性很高,但HCT116细胞中90%以上的急性反应基因是由一个或多个额外的细胞系诱导的(图5a,b)。进一步观察发现与较保守或HCT116特异性基因相比,在所有四种细胞系中上调的基因倾向于在新生RNA和稳定状态mRNA中表现出增长(图5c, d)。然而,研究也发现常见的HIF1A峰表现出更强的HIF1A结合(图5e),与核心基因相关的峰在不同细胞类型中大多是保守的(图5f),并显示出明显高于非核心基因相关峰的HIF1A信号(图5g)。总的来说,这些结果表明,急性反应基因在不同类型的癌细胞中比晚期反应基因更保守,因此更有可能在多种癌症类型的细胞适应缺氧中发挥作用。
图5 HIF1A表达的急性反应基因的上调在多种细胞类型中是保守的
6.HIF1A的肿瘤抑制作用与mTOR抑制有关
在识别了急性缺氧转录反应后,在这一部分作者开始研究这些急性反应基因对癌细胞中HIF1A依赖过程的贡献。首先,作者分析了来自 Cancer Dependency Map项目的625个癌细胞株的全基因组CRISPR介导的敲除数据。研究发现在这个数据集中,肿瘤抑制基因的消耗导致了细胞适应性的提高和阳性基因效应评分的提高,而癌基因的消耗则有相反的效果(图6a)。接下来,为了评估急性反应基因在体外对HIF1A抑制作用的贡献,作者在这个庞大的数据集中分析了相互依赖关系。结果发现HIF1A辅因子ARNT与HIF1A表现出强烈的正相关性,而HIF1A抑制因子EGLN1-3、VHL和HIF1AN/FIH表现出强烈的负相关性(图6b, c),证实了该方法识别功能关系的有效性。此外,对于VHL而言,与HIF1A负相关最强,而HIF1A抑制因子EGLN1和EGLN3以及VHL辅因子ELOB和CUL2呈正相关(图6d,e)。作者也注意到与HIF1A最强的正相关是DDIT4 (REDD1)(图6b, c),这是一个核心的急性反应基因之前被认为是一个直接的HIF1A靶标。之前的研究表明,DDIT4通过TSC1-2复合体抑制mTOR信号,文章的分析也发现DDIT4与TSC1-2呈正相关,与mTOR和LAMTOR1呈负相关(图6f,g)。总之,这些结果表明,在缺氧发生之前,HIF1A具有细胞自主的抗增殖作用,可能是通过诱导对HIF1A基础水平敏感的靶基因DDIT4来抑制mTOR信号(图1h, i)。
图6 HIF1A在常氧条件下抑制癌细胞活力
7.与癌症进展相关的急性反应基因
在这一部分 ,作者开始研究急性反应基因的预后价值,通过分析27种癌症类型的约1.1万例人类肿瘤,这些肿瘤的基因表达可通过TCGA获得,并获得了患者的生存数据。作者首先测试无进展间隔(PFI)和该数据集中所有急性反应基因的总表达得分之间的关系。结果发现高表达评分主要与存活率降低相关,在胃腺癌(STAD),宫颈鳞状细胞癌(CESC),低级别胶质瘤(LGG),肾乳头状细胞癌(KIRP),尿路上皮膀胱癌(BLCA)等六种癌症类型中都达到了统计学意义(图7a, b),这表明低氧诱导基因作为一个群体的高表达优先与较差的预后相关。接着,作者分析在不同癌症类型中与PFI降低显著相关的急性反应基因中富集的通路,发现仅与ECM重构相关的基因富集增加(图7c,d)。同时,当作者使用总生存期(OS)作为终点而不是PFI重复这个分析时,发现这些ECM相关基因的高表达也与死亡时间较短相关。此外,这些基因在不同类型的肿瘤中高表达与不良预后相关(图7e),cox分析结果如图7f所示。总的来说,这些结果强调了急性缺氧反应的多变性,通过不同的HIF1A靶点的作用,在不同的环境下具有肿瘤抑制和致癌作用,同时也揭示了缺氧诱导的ECM重构在癌症进展中的重要作用。
图7 被HIF1A激活的急性反应基因参与ECM重构与癌症进展相关
到这里这篇文章的主要内容就介绍完了,可以看出文章将研究目光聚焦于缺氧,有分析有实验其工作量非常大。总的来说,文章综合分析多个基因组数据集,数据来自600多个癌症细胞系和11000人类肿瘤样本,研究发现了HIF1A急性缺氧在转录中的驱动作用。文章内容丰富无论是研究角度还是方法都值得我们学习。
生信分析定制服务可填写生信分析意向表单
更多精彩文章可关注生信人