今天和大家分享的是2020年3月发表在Oncogene(IF:6.634)上的一篇文章,“Integrative analysis of genomic amplification-dependent expression and loss-of-function screen identifies ASAP1 as a driver gene in triple-negative breastcancerprogression”,作者利用TCGA等公共数据库和自己的细胞系数据筛选基因扩增依赖的过表达基因,通过siRNA实验、DEGs功能富集及生存分析确定三阴性乳腺癌的驱动基因。
Integrative analysis of genomic amplification-dependent expression and loss-of-function screen identifies ASAP1 as a driver gene in triple-negative breastcancerprogression
基因扩增依赖性表达及功能失活的综合分析确定ASAP1为三阴性乳腺癌进展的驱动基因
https://space.bilibili.com/400148106
一、研究背景
三阴性乳腺癌(TNBC)为乳腺癌(BC)的一种增殖和侵袭性亚型,预后不良,缺乏有效的临床靶向疗法。基因拷贝数改变(CNA)是癌症基因组中的标志,是导致肿瘤发生的重要体细胞基因组变异。拷贝数和表达增加的致癌驱动基因可作为肿瘤靶向治疗的潜在药物靶标,作者希望通过在TNBC基因组中对基因扩增及其驱动的过表达进行综合分析,确定TNBC驱动基因。
二、分析流程
三、结果解读
1.ADMIRE分析确定具有CNGs相关表达上调的TNBC候选驱动基因
复发性CNA已被认为是肿瘤进化过程中自然选择的结果,因而recurrent CNA regions可能包含癌症的驱动基因。作者使用ADMIRE(一种用于发现broad and focal recurring events的算法)来检测TCGA(n = 118)和Metabric(n = 104)TNBC数据集中包含recurrent CNA的基因组区域。
首先检测222例TNBC患者基因组的总拷贝数分布(图a,上),ADMIRE算法进行平滑处理及多尺度分析,确定其中显著的recurrent CNA regions(图a,下),然后确定其中focal recurrent CNG包含的基因,最后对基因进行拷贝数和表达量的相关性分析,将显著正相关的基因作为候选驱动基因。图b,c,d展示了8q处focal recurrent CNG中的癌基因MYC的筛选过程。
经过上述流程作者最终选出138个基因作为TNBC的候选驱动基因,并且进行了KEGG通路富集,结果显示这些基因显著富集在与癌症相关的多个通路,包括中心碳代谢、蛋白聚糖,黑色素瘤、前列腺癌和子宫内膜癌相关途径以及ErbB,PI3K-Akt,Ras,MAPK和Wnt等致癌信号通路。
图1:TNBC基因组中拷贝数和表达量增加的候选驱动基因筛选示意图
2.Loss-of-function研究验证候选驱动基因在TNBC细胞增殖中的功能
作者通过siRNA实验在间充质样BT549和基底样SUM149两个TNBC细胞系中进行138个候选驱动基因的增殖表型loss-of-fuction研究。
使用磺酰罗丹明B(Sulforhodamine B,SRB)比色法检测细胞增殖情况,图a展示两次实验SRB原始值的相关性,显示出很好的可重复性。
图b,c,d:将无靶向siRNA的细胞增殖情况作为对照计算增殖百分比,靶向KIF11作为阳性对照,将基因沉默后增殖百分比<60%的基因作为primary hits,两细胞系实验结果分别得到41和20个基因,其中有15个共同基因。
图2:TNBC细胞中siRNA介导的候选驱动基因loss-of-function
接着作者检测了46个primary hits在20个不同分子亚型TNBC细胞系中的CNG频率,选出其中在≥8个TNBC细胞系中发生CNG的10个基因(图a,下),还使用20个细胞系的RNA-seq数据分析了46个基因的表达水平(图a,上)。
图b:进一步在BT549、SUM149和Hs578T(间充质样TNBC细胞系)中使用siRNA沉默10个CNG基因,结果显示ASAP1,CCT5,IRF2BP2,DRD1,MYC,EGFR六个基因在三种细胞系中均显著抑制了增殖(>50%)。
图c,d:作者使用包含四个siRNA的SMARTpool siRNA进行基因沉默,此处对6个基因的siRNA结果进行了去卷积验证,确定单个siRNA对靶基因的沉默效率,排除SMARTpool siRNA的脱靶效应,并且比较了SMARTpool(p)siRNA和单个siRNA(1,2,3,4)的细胞增殖结果,针对6个候选基因SMARTpool siRNA进行优化,优化后的增殖结果同样显示出显著的抑制增殖功能。
图e展示6个基因在三个细胞系中的CNA,+表示拷贝数增加,/表示无CNA,-表示拷贝数丢失,比较图d,e三个细胞系的结果可以看到沉默对细胞增殖的抑制作用与细胞系中的CNA状态一致。
图三:验证候选驱动基因在TNBC细胞中具有CNG和过表达
3.TNBC中ASAP1的频繁扩增与不良预后相关
图a:使用52个BC细胞系的RNA-Seq数据分析6个基因在TNBC和non_TNBC细胞系中的表达水平,MYC,EGFR, ASAP1,CCT5在TNBC细胞系中表达量较高,而IRF2BP2在所有细胞系中高表达,DRD1低表达,其中EGFR的表达差异具有显著性。
图b:使用cBioPortal中的1904例BC患者样本的mRNA数据分析6个基因的表达水平,结果显示MYC, EGFR, ASAP1,IRF2BP2在TNBC样本中显著高表达,CCT5低表达。
图c:1904例BC样本中CNA与基因表达水平之间的相关性。以每个基因的不同CNA分组(deep deletion, shallow deletion, diploid, gain, and amplification),结果显示样本中很少出现拷贝数缺失,而EGFR,MYC,IRF2BP2,ASAP1,CCT5的拷贝数扩增常见且与表达量增加相关,显示出基因在BC样本中的CNA驱动表达。
图d:2173例BC样本中基因的扩增频率(all BC,TNBC),在所有样本中MYC,ASAP1,IRF2BP2扩增频率> 20%,在TNBC中MYC和ASAP1扩增频率> 30%,提示TNBC亚型相关的MYC和ASAP1扩增。
作者进一步在BC患者队列中进行了生存分析,显示MYC和ASAP1与患者OS不良有关。图e显示在TNBC患者中ASAP1高表达组的MRFS显著更差,而在ER+BC患者中无显著差异。以上,MYC和ASAP1在BC患者中频繁扩增且高表达,并与TNBC进展相关,作者将两基因作为CNA驱动的过表达基因进行进一步研究。
图四:ASAP1扩增和过表达与TNBC不良预后有关
4.转录组学分析ASAP1消耗对TNBC细胞基因表达的影响
基因拷贝的扩增或缺失可能通过间接机制影响位于扩增/缺失区之外的基因的表达。已有研究显示位于染色体8q24.21的ASAP1基因编码一个Arf GTP酶激活蛋白,诱导与Arf蛋白结合的GTP水解,ASAP1参与信号转导、膜运输和细胞骨架重塑,并促进各种癌细胞的增殖、侵袭和转移,而CNA驱动的ASAP1过表达在癌细胞全基因组水平上的影响尚未有相关研究,作者在具有ASAP1扩增和高表达的三种TNBC细胞系BT549,Hs578T和SUM149PT中进行了基于TempO-Seq的全基因组靶向测序。
RNA-Seq:作者以一式三份分别用靶向ASAP1(siASAP1)或无靶向(siCtrl)的siRNA转染细胞,Pearson相关系数超过0.95。
作者接着进行了差异表达基因筛选。热图展示了ASAP1消耗对TNBC细胞中基因表达的不同影响(图a),图b展示siASAP1对ASAP1基因表达的靶向作用,TNBC细胞中ASAP1 mRNA表达的降低> 45%,确保转录组中ASAP1的有效敲除。火山图展示三细胞系中表达上调及下调的DEGs,Venn图展示三细胞系DEGs的交集。
作者选出在≥2/3TNBC细胞中存在差异表达的95个下调DEGs和79个上调DEGs,作为表达水平普遍受ASAP1消耗调控的DEGs。
图五:全转录组分析TNBC细胞中ASAP1消耗诱导的转录重编程
5.ASAP1调控TNBC预后相关的细胞因子和凋亡信号转导成分
最后作者对174个DEGs进行了Metascape通路富集和生物学过程富集分析,整合了GO,KEGG,Reactome基因集,Canonical Pathways和CORUM的数据。
图a,b:展示前20个显著富集的通路及生物学过程,包括细胞因子信号传递途径,脂质代谢过程的调控,凋亡信号转导通路,MAPK信号转导通路和细胞周期阻滞等通路,并使用Cytoscape可视化通路网络。其中免疫系统中的细胞因子信号转导,脂质代谢过程的调控和凋亡信号通路的调控富集最显著,蛋白质-蛋白质相互作用聚类算法确定了基因网络中的相邻节点。展示出ASAP1在多种分子途径中的生物学功能。
约45%的ASAP1调控基因(78/174)参与细胞因子信号转导相关途径,包括细胞因子信号转导的相互作用,对白介素1的反应,TNF信号转导通路和炎症反应的调节等。在凋亡信号和细胞死亡途径的调控中,ASAP1消耗调节了33个基因。
图c:无监督聚类热图,在细胞因子信号转导、脂质代谢和细胞凋亡信号通路中将DEGs分为正向和负向调节因子,可以看到三个通路中基因之间存在广泛的crosstalk,凋亡基因中有23个基因(约70%)在细胞因子信号转导中具有相互作用,脂质代谢相关基因中有17个(约50%),进一步表明ASAP1作为驱动基因在细胞存活和增殖中的意义。
图d:生存分析,以ASAP1调控的富集基因在TNBC样本中的平均表达水平将样本分为高低表达组分析无复发生存(RFS)差异。结果显示ASAP1敲除后下调的基因中,低表达组的RFS显著优于高表达组,而上调基因中高表达组RFS显著更好。以上数据表明,通过负调控细胞死亡通路,ASAP1的基因扩增是TNBC进展的关键驱动力。
图六:ASAP1调节的DEGs功能富集分析和TNBC预后相关性
小结
本篇文章中作者使用TCGA,Metabric,cBioPortal的乳腺癌数据以及自己的细胞系数据鉴定出TNBC的驱动基因ASAP1。首先在222例TNBC样本基因组中确定频繁发生CNG的区域,鉴定出138个CNG与过表达相关的候选基因,然后基于siRNA进行TNBC细胞系增殖表型的loss-of-function实验,筛选出敲除后显著抑制细胞增殖的基因。之后在cBioPortal的大样本中分析CNG与基因过表达的关系,对其中扩增频率高的ASAP1进行生存分析。接着在三个TNBC细胞系中敲除ASAP1进行了全基因组测序分析其下游基因,DEGs的富集分析显示与细胞因子、细胞凋亡信号转导及脂质代谢通路有关,生存分析显示下游上调、下调基因的高低表达组间均具有显著差异,表明ASAP1是扩增依赖的TNBC驱动基因,促进TNBC细胞增殖,是多种凋亡相关基因的上游基因并与TNBC患者的预后相关。