生信分析 7+lncRNA表观修饰

                           Comprehensive landscape of epigenetic-dysregulated 

                 lncRNAs reveals a profoundrole of enhancers in carcinogenesis in 

                                                  breast cancer subtypes

                                                         表观遗传调节异常的lncRNA图谱揭示了增强子在乳腺癌亚型中预后作用


期刊情况

< MOL THER-NUCL ACIDS> ISSN:2162-2531

2018_IF:5.919;2019_IF:7.032

中科大类:医学2区

中科小类:医学:研究与实验2区

今天这篇文章以生信分析为主,通过发掘lncRNA表达及其与表观修饰之间的关系,为乳腺癌三种亚型的预后提供了资料。具体来说,就是通过对比lncRNA启动子和增强子上的赖氨酸H3K27乙酰化和三甲基化(H3K27ac和H3K27me3)、H3组蛋白第36位赖氨酸的三甲基化(H3K36me3)、H3组蛋白第4位赖氨酸的单甲基化(H3K4me1)、H3组蛋白第4位赖氨酸的三甲基化(H3K4me3),以及H3组蛋白第9位赖氨酸的三甲基化(H3K9me3)的变化,鉴定出一批在 Luminal型、 Basal型和低Cluadin亚型乳腺癌中表观修饰异常的lncRNA。而增强子表观修饰异常的lncRNA在调控亚型特异的生物功能中具有重要作用。因此,本研究进一步分析鉴定出了6种增强子发生组蛋白差异修饰的lncRNA(LINC00393,KB-1836B5.1,CASC11, RP1-140K8.5, AC005162.1, and AC020916.2)和三种在增强子或启动子上具有DNA甲基化水平差异的lncRNA(CTC-303L1.2, RP11-738B7.1, and SLC26A4-AS1),这些lncRNA可作为 Basal型乳腺癌的预后生物标志物;而甲基化水平发生变化的LINC01983和四种lncRNA调控元件(UCA1, RP11-221J22.2, RP11-221J22.1和RP1-212P9.3)可作为 Luminal型乳腺癌的预后生物标志物。

通过上述分析,作者深入挖掘并发现了乳腺癌中发生的lncRNA表观遗传变化及其在癌症预后中的重要价值,希望能给大家提供数据分析的思路呀~


数据来源:乳腺癌细胞系(MCF-7,HCC1954,MDA-MB-231)的六种组蛋白修饰(H3K27ac, H3K27me3, H3K36me3, H3K4me1, H3K4me3 and H3K9me3)的数据下载自ENCODE和GEO(GSE29069,GSE85158);转录组数据下载自TCGA;RNA-seq数据下载自GEO。


乳腺癌亚型中表观遗传差异的lncRNA和蛋白编码基因(PCG)分析

差异lncRNA分析结果显示,三种乳腺癌亚型(Luminal、 Basal和Cluadin-low)与正常乳腺组织或细胞之间差异表达的lncRNA分别有318(2.5%),2493(19.59%),和3414(24.62%)种;差异表达的PCG分别有2141 (11.54%), 7582 (40.85%)和 9851 (51.87%)种。由于在乳腺癌亚型的许多PCG中会发生表观遗传学的变化,研究人员对三种乳腺癌亚型的组蛋白修饰和DNA甲基化进行了系统分析(Fig. 1A),并分别在 Luminal型、 Basal型和Cluadin-low三种亚型中鉴定出65,553和1197种组蛋白差异修饰的lncRNA;在 Basal型和 Luminal型乳腺癌中分别鉴定出196和36种甲基化修饰差异的lncRNA。Luminal型、 Basal型和Cluadin-low三种亚型中分别有370,884和4139种表观差异的PCG;乳腺癌样本中lncRNA(12.16%)的异常程度低于PCG(26.23%)(Fig. 1B)。表观修饰异常的lncRNA在 Luminal型、 Basal型和Cluadin-low三种亚型中分别有13, 69和96种被认为与人类癌症相关(Fig. 1C)。在Luminal亚型中异常的lncRNA有RMST, CASC8和RP11-65J3.1,在 Basal亚型中的有SNHG12, CASC11和HOTAIRM1,在Cluadin-low亚型中的有GAS5, HOTTIP, HAS2-AS1和HO×D-AS1。例如,LINC01016近端增强子区域的H3K27ac、H3K4me1和H3K4me3水平显著升高,并引起LINC01016表达显著上调(图1D-1E);在Basal亚型SNHG12的增强子区域H3K4me3信号的显著增强,这导致SNHG12的显著上调(图1D-1E)。这些结果表明,有些lncRNA在增强子区域受到表观遗传学调节。此外,本研究在 Luminal、 Basal和Cluadi-low亚型的乳腺癌中鉴定分别鉴定出98、25和87种lncRNA调节因子,其中几种是已知的癌症基因,例如,牛磺酸上调基因1(TUG1)在Basal型中被显著上调。与已知乳腺癌发生和转移的MALAT在Cluadin-low亚型中被显著下调。

表观修饰异常lncRNA(epi-lncRNA)的基因组特征

通过对比表观修饰的异常lncRNA的基因、外显子、内含子、异构体数量和长度发现,相比于正常lncRNA(non-epi-lncRNA),epi-lncRNA的外显子、内含子和基因的长度更长,外显子、内含子和异构体数量更多。除了外显子和内含子长度外,epi-PCGs的结构特征与epi-lncRNA相似。根据epi-lncRNA与PCG的关系可将epi-lncRNA分为五类:基因间的,重叠,部分重叠,内含子或外显子。其中,1516859(53.1%)和27(1.6%)种epi-lncRNA分别属于基因间和重叠lncRNA。结构分析显示表观修饰异常的重叠lncRNA外显子、内含子和异构体数目更多,内含子和基因长度更长,基因和外显子长度越短。这些结果表明lncRNA具有复杂的剪接模式,可能表观修饰的调控。

本研究比较了epi-lncRNA与其他lncRNA基因的表达水平和表达变异情况,来分析表观修饰异常lncRNA的表达模式。三种乳腺癌亚型中,lncRNA的表达均明显低于PCG,表观修饰异常的lncRNA表达水平更高和表达变异水平更低。同时,表观修饰异常的PCG在Basal和Cluadin-low亚型中的表达水平较高,表达变异较低(P<0.05)。这些结果表明,表观修饰异常的lncRNA在乳腺癌中稳定表达,可作为乳腺癌的潜在生物标志物。


增强子区表观修饰异常的lncRNA与癌症亚型有关

增强子区H3K27ac异常的lncRNA和H3K4me1异常的lncRNA都与细胞周期、免疫系统过程和细胞通讯的调节有关(Fig. 2A)。Luminal型乳腺癌epi-lncRNA主要与H3K27ac(26.41%)、H3K36me3(25.90%)和H3K4me3(19.49%)增强子(53.46%)有关,主要影响参与坏死过程的ripoptosome的组装(Fig. 2B)。Cluadin-low亚型的乳腺癌epi-lncRNA主要受增强子区的H3K27ac(78.27%)和H3K27me3(14.98%)的调控(60.85%),影响大分子代谢、细胞大分子生物合成和细胞蛋白修饰等基本生物学功能(Fig. 2C)。综上所述,不同乳腺癌亚型中的epi-lncRNA主要与增强子区H3K27ac失调(67.16%)有关(Fig. 2D)。然而,H3K27ac失调的lncRNA在不同的乳腺癌亚型中影响不同的生物学功能,如Luminal型的坏死过程,Basal型的细胞通讯、细胞增殖和免疫系统过程,以及Cluadin-low型的大分子生物合成和蛋白修饰过程(Fig. 2D)。

那么这些增强子区表观修饰异常的lncRNA有哪些作用呢?通过对乳腺癌样本进行无监督的层次聚类分析发现,这些lncRNA的表达,特别是H3K4me1-、H3K4me3-和H3K27me3异常的lncRNA,可用来区分PAM50亚型乳腺癌样本,这表明增强子的epi-lncRNA可能有助于这些亚型的独特生物学特性,但是这些epi-lncRNA不能用于区分ER-driven Luminal型A和 Luminal型B亚型。然而,增强子区发生H3K4me1-、H3K4me3-和H3K27me3表观调节异常的lncRNA能够区分Luminal型与Basal型和Cluadin-low亚型(Fig. 2E)。总之,增强子表观修饰异常的lncRNA对不同亚型具有特异的生物学功能,在乳腺癌不同亚型的发病机制中发挥重要作用。


表观修饰异常的lncRNA针对癌症亚型具有特异性

有92.59%的epi-lncRNA表现出亚型特异性(Fig. 3A-3B),尤其在 Luminal型中,75.38%的epi-lncRNA具有亚型特异性。以已知的乳腺癌lncRNA—RMST为例,其远端增强子的H3K27ac、H3K4me1和H3K4me3水平升高,H3K27me3降低(Fig. 3C),进而上调该lncRNA的表达。有79.02%的epi-lncRNA在Basal型中表现出亚型特异性,例如,已知的乳腺癌lncRNA TUG1、SNHG12和SO×2-OT在Basal型中特异性的表观修饰异常:SNHG12增强子上的H3K4me3信号的显著增强,这有助于上调其表达,SNHG12可调节三阴性乳腺癌细胞增殖、凋亡与迁移,本研究发现SNHG12的SO×2-OT增强子区H3K36me3减少,进而显著下调其表达;有研究表明,异位表达SO×2-OT可以减少乳腺癌细胞的增殖并促进其生长。在Cluadin-low亚型中,89.81%的epi-lncRNA具有亚型特异性:LINC00152、AFAP1-AS1、NNT-AS1和SNHG15是已知的乳腺癌LncRNA,在Cluadin-low亚型中受到特异性的表观遗传学调控,例如LINC00152的远端增强子处H3K27ac升高;据报道,LINC00152在MDA-MB-231和MCF-7细胞系中被显著上调,被认为参与乳腺癌细胞的上皮向间充质转化和化疗耐药的过程。

少数lncRNA在多种乳腺癌亚型中表观遗传失调,这表明这三种亚型共有一些分子机制,但是,三种亚型中都有的lncRNA在不同类型中的表观遗传调控具有亚型特异性。Basal型和Cluadin-low型共享大部分epi-lncRNA(Fig. 3A)。例如,AC006262.5、LINC00704和LUCAT1在Basal型和Cluadin-low亚型中都存在。AC006262.5是一种与乳腺癌风险相关的lncRNA,在Cluadin-low亚型中下调,并通过下调IGFL1来调节细胞迁移。本研究发现AC006262.5启动子区的H3K27me3升高,导致其在Cluadin-low亚型中表达水平显著降低,而在基础亚型中AC006262.5增强子区的H3K27ac升高,H3K27me3降低,导致其表达水平上调。RP11-395G23.3、CASC8、APCDD1L-AS1和RP11-154D17.1是三种癌症亚型中常见的lncRNA,在Luminal型中,它们启动子区的H3K27ac和H3K36me3降低,而在 Basal型中,它们增强子的H3K27ac、H3K4me1和H3K4me3升高,在Cluadin-low亚型中,它们增强子区的H3K27ac升高,H3K27me3降低。综上所述,大量表观修饰异常的lncRNA,包括许多已知的乳腺癌lncRNA在不同的乳腺癌亚型中表现出不同的表观修饰异常模式,研究这些lncRNA可能为乳腺癌的亚型特异性治疗提供途径。



增强子区发生表观遗传调节的lncRNA与乳腺癌亚型的疾病预后相关

本研究使用多变量Co×回归分析来进一步分析增强子区发生H3K27ac或DNA甲基化的lncRNA及其调节因子的预后价值。在Basal亚型中,有6个增强子组蛋白修饰相关的epi-lncRNA(LINC00393、KB-1836B5.1、CASCA11、RP1-140K8.5、AC005162.1和AC020916.2)能够在总生存率方面显著区分高危组和低危组的患者(Table 1)。



本研究发现LINC00393和KB-1836B5.1的增强子区有H3K27ac和H3K4me1的升高,从而上调其表达(Fig. 4A-4D)。KB-1836B5.1高表达与肿瘤晚期有关,LINC00393或KB-1836B5.1高表达的乳腺癌基础亚型组的存活时间明显缩短(Fig. 4C)。这些结果与先前的研究一致,其中LINC00393的上调被认为是基础亚型的生物标志物。本研究发现CASC11增强子区的H3K27ac、H3K4me1和H3K4me3信号显著增强,导致CASC11显著上调(Fig. 4B-4D)。高表达CASC11的组存活时间明显低于低表达CASC11的组(Fig. 4C)。也有研究表明,CASC11是结直肠癌和肝细胞癌的危险lncRNA。在结直肠癌中,c-MYC与CASC11的启动子结合并增加H3K27ac信号以增强CASC11的表达。大肠癌中CASC11表达上调与肿瘤大小、浆膜浸润、淋巴转移和肿瘤淋巴结转移(TNM)分期有关。在肝细胞癌中,CASC11的高表达与肝细胞癌患者的预后不良相关。此外,本研究还确定了三种乳腺癌基本亚型的生物标志物,包括保护因子RP1-140K8.5、AC005162.1和危险因子AC020916.2,它们增强子区H3K27ac和H3K4me1升高,这两种表观修饰有助于上调其表达(Fig. 4B-4D)。RP1-140K8.5或AC005162.1的低表达与基础亚型的不良预后相关(Fig. 4C)。功能分析表明,RP1-140K8.5通过调节IL12A、ADAM15和IL5参与T细胞介导的免疫应答和防御反应。AC005162.1通过调节CD6、CD47和GSTP1参与调节免疫系统过程、T细胞受体信号通路和肿瘤坏死因子水平。本研究发现AC020916.2增强子区H3K27ac和H3K4me3升高,导致其显著上调(Fig. 4B-4D)。对数秩检验显示,AC020916.2高表达时预后较差(Fig. 4C),功能分析表明,AC020916.2通过调节PARP1、CD44、CD48等参与免疫系统和细胞凋亡过程。这些结果可提示 Basal型乳腺癌存在严重的免疫浸润。Basal型乳腺癌中增强子发生表观修饰的epi-lncRNA或许可以作为改善免疫治疗的靶点。因此,本研究进一步研究了组蛋白乙酰转移酶CREBBP/EP300抑制剂C646对人乳腺癌(MDA-MB-468)细胞中6个H3K27ac表观修饰异常lncRNA表达的影响。结果显示,抑制组蛋白乙酰转移酶CREBBP/EP300的活性导致增强子区H3K27ac减少(F.ig. 4E)。实时荧光定量PCR结果显示,20µM C646处理MDA-MB-468细胞中24小时可显著降低LINC00393、KB-1836B5.1、RP1-140K8.5、AC005162.1和AC020916.2的表达水平(Fig. 4F),CREBBP/EP300基因敲除显著抑制MDA-MB-468细胞的生长,且呈剂量依赖性(Fig. 4G)。这些结果表明,H3K27ac可以调节LINC00393、KB-1836B5.1、RP1-140K8.5、AC005162.1和AC020916.2的转录,这些基因在乳腺癌基础亚型中具有潜在的促肿瘤活性。此外,本研究还鉴定了三个(SLC26A4-AS1、CTC-303L1.2和RP11-738B7.1)具有差异DNA甲基化的epi-lncRNA,它们可以显著影响Basal型乳腺癌患者的生存(Fig. 4B-4C)。SLC26A4-AS1的上调与其启动子甲基化有关(FC=2.36,FDR=0.02),高表达的SLC26A4-AS1的总生存期显著延长。据报道,SLC26A4-AS1与甲状腺乳头状癌患者的无病生存率和胃癌患者的总生存率显著相关。RP11-738B7.1增强子低甲基化上调其表达,高水平的RP11-738B7.1表达与不良预后相关。CTC-303L1.2增强子区域的高DNA甲基化下调其表达,而CTC-303L1.2低表达显著缩短总生存期(FDR=0.03)。功能分析表明,SLC26A4-AS1、CTC-303L1.2和RP11-738B7.1分别与肿瘤中的趋化因子信号通路、白细胞介素15介导的信号通路和转录失调有关。本研究对42例三阴性乳腺癌临床样本和21例癌旁非肿瘤组织(GSE58135)的RNA序列数据进行分析,结果显示77.8%(7/9)的epi-lncRNA的表达变化得到验证(FDR<0.05)。


在Luminal型中,本研究鉴定了一个具有差异DNA甲基化的epi-lncRNA(LINC01983)和四个lncRNA调节因子(UCA1、RP11-221J22.2、RP11-221J22.1和RP1-212P9.3),对患者的生存率具有显著影响(Table1; Fig5A-5B)。LINC01983的上调与其启动子的低甲基化有关,LINC01983的高表达显著降低总生存率(FDR=0.03)。LINC01983参与淋巴细胞趋化、T细胞迁移和趋化因子介导的信号通路。UCA1在Luminal型中表达降低,并与C×CL6和MAP3K8与肿瘤坏死因子(TNF)信号通路相关,从而介导炎症免疫反应。UCA1低表达是总生存率低的独立预后因素(FDR=7.70 ×10-3)。UCA1已被发现在乳腺癌等许多癌症类型中差异表达。RP11-221J22.1和RP11-221J22.2的低表达与总生存率降低独立相关(FDR=2.56×10-2; FDR=1.94×10-2)。功能分析表明,RP11-221J22.1和RP11-221J22.2均与Th1和Th2细胞分化以及STAT6、MAPK10和STAT3介导的MAPK信号通路和Th17细胞分化有关。RP1-212P9.3的高表达与总生存率下降相关(FDR=2.56×10-2)。此外,在Basal型乳腺癌中,没有发现任何与生存相关的组蛋白修饰差异的epi-lncRNA。本研究探索了这些epi-lncRNA的预后价值,并最终确定了三个模块。模块1由2个epi-lncRNA(KCNC4-AS1和APCDD1L-AS1)和33个PCG组成;模块2由KCNC4-AS1和34个PCG组成;模块3由APCDD1L-AS1和74个PCG组成。功能分析表明,这两个lncRNA通过调节STAG2、JAG2、VAMP8、HMGB1和LITAF等基因参与炎症反应、凋亡、细胞分裂、细胞通讯和NF-κB信号的调节(Fig. 5C)。例如epi-lncRNA(KCNC4-AS1和APCDD1L-AS1)作为Luminal型的预后生物标志物(Table 2)。据报道,APCCD1L-AS1可显著区分肺鳞状细胞癌中的高表达组和低表达组。


在Luminal型的总生存率方面,这些模块中的每一个都能显著区分高风险组和低风险组的患者(Fig 5D)。本研究进一步分析了42个雌激素受体阳性(ER+)乳腺癌原发肿瘤和30个邻近乳腺组织(GSE58135)的RNA序列数据,结果表明66.7%的lncRNA的表达变化与独立临床样本中lncRNA的表达模式一致(FDR<0.05)。总之,这些结果证实了lncRNA生物标记物在独立样本中的重现性。


综上所述,本研究强调了H3K27ac和DNA甲基化修饰异常的lncRNA及其调节因子在 Basal型和 Luminal型乳腺癌发生中的关键作用及其潜在的预后价值。此外,组蛋白乙酰转移酶CREBBP/EP300抑制剂抑制增强子相关的H3K27ac失调的lncRNA提供了抑制乳腺癌生长的潜在途径,值得进一步研究。

更多精彩文献解读可手机端搜索生信人小程序,添加到手机桌面,方便随时阅读

pc端可关注生信人网站 生信人

更多个性化生信意向分析,可填写生信意向表单,五年生信从专注到专业,值得信赖 http://gaptechsxr.mikecrm.com/1vdMmqy

你可能感兴趣的:(生信分析 7+lncRNA表观修饰)