Comprehensive characterization of the alternative splicing landscape in head and neck squamous cell carcinoma reveals novel events associated with tumorigenesis and the immune microenvironment
全面表征头颈部鳞状细胞癌的选择性剪接景观,揭示了与肿瘤发生和免疫微环境相关的新事件
发表期刊:Theranostics
发表日期:2019 Oct 14
影响因子:8.579
DOI: 10.7150/thno.36585
一、研究背景
头颈部鳞状细胞癌(HNSC)是一种常见、多发、常致死的恶性肿瘤,全球发病率约60万例,每年约有38万例死亡。HNSC患者多在晚期诊断,且常伴有预后不良。
选择性剪接(AS),是转录后调控的最重要的机制之一,是RNA前体选择性拼接和连接的调节过程,可以产生巨大的生物多样性。拼接亚型的不平衡表达或未能表达正确的亚型被认为是癌症的另一个标志。越来越多的证据表明,AS在免疫微环境的形成中起着重要作用。AS的改变不仅可能影响免疫细胞的浸润,而且还可以调节肿瘤相关的免疫细胞溶解活性。目前很少有研究对AS及其在HNSC中的临床意义进行全面分析。
二、材料与方法
1 数据来源
1) TCGA:TCGA HNSC队列,包含RNA-Seq数据(n=464)
2) 一个独立队列(10个舌鳞状细胞癌(TSCC)和5个正常样本)的RNA-Seq数据:PRJEB14202
3) 结直肠癌中差异表达的AS事件的数据参考PMID:30243491
4) 从cBioPortal for Cancer Genomics数据库获取剪接因子(SF)的拷贝数(CN)和甲基化信息
5) 4个HNSC分子亚型和3个HNSC免疫分子亚群的数据分别来自PMID: 29628290和PMID: 30407504
2 分析流程
三、结果展示
01 - TCGA-HNSC队列中AS事件概述
本研究共确定了464名HNSC患者,在21.2个月的中位随访期间,131名患者出现复发/进展,203名患者死亡,3年OS和DFS分别为26.9%和24.8%。
相应的RNA-Seq数据被用于建立综合AS事件谱。初步从13862个基因中检测到95700个AS事件,约占蛋白质编码人类基因的67%。这些AS事件被分为七种拼接模式:交替接受位点(AA),交替供体位点(AD),交替启动子(AP),交替终止子(AT),外显子跳过(ES),互斥外显子(ME)和保留内含子(RI),如图1A所示。在这些剪接模式中,ES发生的频率最高。
为了确保高严格性,用一系列过滤器筛选AS事件(PSI值≥75的样品百分比,平均PSI值≥0.05),还剔除了与基质或免疫细胞含量有显著关联的AS事件,以特异性反映癌症相关的AS改变。因此,共获得了来自9,844个基因的32,309个AS事件(图1B)。过滤后,ES仍然是最常见的模式,其次是AT和AP。鉴于单个基因的多种拼接模式的可能性,创建了Upset图来定量分析7种类型的AS事件的交互集。如图1C所示,一个基因最多可以有四种不同的拼接模式,大多数基因有一个以上的AS事件。此外,Circos图的生成,以获得更直观的可视化的AS事件剖析的HNSC(图1D)。
02 - HNSC中癌症相关AS事件的鉴定
为了识别HNSC特异性AS事件,比较了40个配对肿瘤和相邻正常组织之间的PSI值,共鉴定出420个基因的473个癌症相关的替代拼接事件(CASEs)。在80个样本中,仅有1个正常样本被误分为肿瘤样本,准确率为98.6%,说明CASEs提供了准确区分肿瘤和正常组织的能力(图2A和2B)。在一个独立的队列中进一步评估了HNSC中的473个CASEs。经过筛选,共检测到101个CASEs,其中91个CASEs是差异表达的。虽然在HNSC队列中检测到大量的ES事件,但ES事件中被鉴定为CASE的比例较小,而AP事件占CASE的46.3%(图2C)。此外,几个基因在肿瘤和正常组织中表现出母基因AS事件的相反模式(图2D)。
在473个CASE中,54个在CRC中差异表达。例如,ISRL中外显子1的AP显著上调,而ISRL中外显子2的AP在HNSC和CRC中均下调(补充图S1A)。还发现,TNC中的ES事件一般在肿瘤中更为活跃(补充图S1B)。
鉴于异常的AS可能会影响其母体RNA的表达,特别是当某些拼接模式(AP或AT)发生时,作者评估了AS失调和mRNA的差异表达之间的关系。共有46个具有CASE的基因在HNSC中差异表达,其中39个是AP或AT事件。进一步研究了每个AP/AT事件与HNSC队列中相应基因表达之间的相关性。分析显示,45个AP/AT事件中,有40个AP/AT事件与母体基因表达显著相关,这表明CASE通过失调基因表达促进了肿瘤的发展(补充图S1C-D)。
03 - CASEs的潜在功能
为了更好地了解CASEs如何驱动癌症的发展,首先研究了影响癌症驱动基因的CASEs。在CASEs中,发现有26个事件在22个癌症驱动基因中产生新的亚型。与规范的转录物相比,从18个CASEs生成的转录物往往较短。受此证据的启发,作者研究了AS事件中涉及的转录本所编码的蛋白质。在26个事件中,有22个事件引起了蛋白序列的改变,由CASEs编码的注释蛋白往往比正常异构体的蛋白要短。为了确定CASEs潜在的功能影响,探讨了它们影响的蛋白质特征(Pfam域或Prosite模式)。介导相互作用或参与调节蛋白质活性的域家族都参与其中(图3A)。这些研究结果表明,CASEs可能通过失调蛋白功能发挥重要作用,为肿瘤发生机制的探索提供了线索。
接下来,通过生物功能富集分析,对CASEs的富集途径进行了分析。结果发现,与HNSC发育密切相关的GO类基因富集(图3B),还注意到一些生物功能受到较大影响。此外,一些与HNSC肿瘤发生相关的KEGG通路也被富集(图3B),与免疫相关的通路也有所富集,这表明CASEs也参与了HNSC患者HPV感染和免疫微环境的形成。基因组富集分析(GSEA)显示,在HNSC中差异表达的AS事件在细胞周期、病毒致癌和免疫相关途径中显著富集(图3C,补充图S2)。综上所述,这些研究结果表明,CASEs可能不仅在肿瘤发生中发挥重要作用,而且在肿瘤免疫环境中也发挥重要作用。
受这些发现的启发,作者评估了CASEs如何影响肿瘤微环境。一些CASEs与HPV感染和病毒致癌密切相关。相关性分析显示,IKBKG中AP的较高表达与CD8 T细胞的耗竭和细胞溶解活性受损有关,这可能是由NF-κB信号通路失调所解释(图3D)。还观察到,在IL1RL1中的AT,作为一个受体,以促进T细胞活化,与增强细胞溶解活性。此外,参与趋化因子信号通路的CASE也被确定。值得注意的是,ES和CXCL12中的AT与CD8 T细胞的招募有关,但与细胞溶解活性无关(图3D)。参与趋化因子信号通路的CASEs与不同免疫细胞(除CD8 T细胞外)的浸润之间也有显著的关联。因此,CASEs与HPV相关致癌以及肿瘤免疫微环境密切相关。
作者还研究了CASEs的蛋白质网络,以提供正常状态下相互作用的概况,并揭示CASEs在蛋白质水平上的潜在影响(图4A)。根据蛋白质-蛋白质相互作用(PPI)网络进一步确定枢纽基因和模块,分析了枢纽基因的蛋白质特征。在10个枢纽基因中,有8个基因的功能域家族受到CASE的影响(图4B)。还确定了PPI网络中的两个模块,与在富集分析中的发现一致,第一个模块中的CASEs富集在蛋白质泛素化的生物过程中(图4C),表明蛋白质泛素化可能经常受到HNSC中CASEs的影响。另一个模块包括富集在细胞粘附和迁移中的CASEs(图4D)。
04 - CASEs和拼接因子网络
拼接因子(SFs)是AS事件的关键调节器,通过选择性地包含外显子或去除内含子。作者分析了71个实验验证的SFs的表达和CASEs的PSI值之间的相关性,并根据显著的相关性建立了一个拼接调节网络(补充图S3)。共有91个CASEs与40个SFs相关。大多数SFs与一个以上的AS事件显著相关。此外,一个AS事件可以由多达18个不同的SFs调节,这反映了SFs之间复杂的合作或竞争关系,并在一定程度上解释了仅由少数因素创建的剪接异构体的多样性。图5A显示了一些高度相关的SFs和CSEAs的例子。
为了扩展到有助于改变拼接因子表达的潜在机制,首先研究了SF启动子甲基化和SF表达之间的关系。相关分析显示,在40个SF中,36个SF启动子的甲基化水平越高,与相应mRNA的表达量越低显著相关。图5B显示了TIAL1、HNRNPA3、TRA2B和HNRNPD启动子的甲基化水平与其表达水平之间的关系。进一步评估了CNA事件。在HNSC队列中,85.6%的病例拥有拷贝数(CN)丢失,94.0%的病例在至少一个SF中包含CN增加事件。29个SF的CN丢失与较低的SF表达相关,而30个SF的CN增益则显示出显著较高的SF表达(图5C)。这些研究结果表明,遗传和表观遗传调控可能导致SF表达的变化,并进一步调节异常AS事件。
05 - CASEs对HNSC的预后价值
接下来作者研究了CASEs与HNSC患者预后之间的潜在关系。对于每个CASE,根据每个AS事件的中位数PSI值将HNSC患者分为两组。单变量Cox回归分析显示,分别有59和53个AS事件与OS和DFS显著相关。在随后对这些候选事件的多变量回归分析中,发现分别有27和26个CASEs是OS和DFS的独立预后因素。18个AS事件同时与OS和DFS相关(图6A)。还研究了这些CASE是否独立于TP53或EGFR突变状态和分子亚型。在18个CASE中,分别有14个、15个和9个CASE与TP53突变、EGFR突变和分子亚型无关,说明这些CASE具有重要的生物学意义。
在18个CASE中,有11个事件预示预后改善,而7个事件牵连预后恶化。大多数与预后较好相关的CASEs产生了较长的转录本和蛋白质。在11个与预后较好相关的CASE中,有7个CASE至少有一个蛋白特征的增加、丢失或改变。
由于每个肿瘤获得多个改变的AS事件,为了检查是否可以收集多-CASE预后预测因子,评估了这些生存相关的CASE的共同发生和排他性(图6D-E)。相关性分析显示两组高度相关的CASEs。一组以GTF2IRD2为中心,伴随着IL1RL1、TOP1MT和MACROD2,与生存改善相关。另一组主要包括ADAMTS2、AQP1、CEP85L和EGFL7之间的相互作用,与生存率较差有关。
06 - 基于AS的集群与预后、分子特征和免疫特征显著相关
正如AS剖析所示,AS事件在HNSC患者中具有显著的异质性。CASE表达的变化可以预测个别患者的不同临床结果。为了更深入地了解HNSCC的分子异质性,进行了无监督共识分析,以探索AS是否呈现可辨别的模式。确定了以下不同的基于AS的分子簇(图7A,补充图S4A)。C1(n = 162),C2(n = 131),C3(n = 83)和C4(n = 88)。
为了进一步明确所确定的AS群的临床意义,首先探讨了群与临床病理特征之间的关系。如图7E所示,TNM阶段和生存状态(OS和DFS)在不同的集群中并不是随机分布的。此外,Kaplan-Meier分析各簇与预后的关联性,发现了不同的生存模式(图7B)。C3在OS和DFS中均与良好的预后相关,而C2和C4往往带有不良的预后。对于上述两个具有不同预后值的CASE组,预后较好的组高表达于C3,而另一组高表达于C2。
为了评估AS与其他分子特征之间的相关性,进一步比较了四个HNSC分子亚型(经典型、基底型、间质型和非典型型)、TP53突变和EGFR改变在各组之间的情况。基于AS的聚类和HNSC分子亚型之间存在高度显著的相似性。在C1-C4中,基底型、经典型、非典型型和间质型亚型分别占50%以上(图7C)。此外,C3往往携带较少的TP53突变和EGFR改变(补充图S4B)。
鉴于CASEs在免疫失调中的潜在功能表现为功能富集,研究了AS基簇是否呈现不同的免疫模式。结果显示,AS簇与HPV显著相关,这表明HPV感染的肿瘤(主要在C3)显示出特定的AS模式。对总突变和新抗原丰度的研究表明,C4与其他簇相比,体细胞突变和新抗原的数量都显著降低,而HPV相关簇C3和C1-C2之间没有显示出显著的差异(补充图S4C)。
此外,还研究了AS簇之间免疫微环境的差异,基于ESTIMATE算法计算免疫和基质评分。HPV相关簇C3与高免疫和低基质评分相关。与C1和C4相比,C2与较低的免疫和基质评分相关(图7D)。对免疫细胞成分和局部免疫细胞溶血活性的研究表明,与其他簇相比,C3显示出增强的细胞溶血活性(补充图S4B),而C2与较低的细胞溶血活性相关。为了全面描述AS簇的免疫特征,评估了AS簇与HNSC中三个免疫分子亚群的相关性。结果表明,AS簇与不同的免疫状态相关(图7C)。在C3内观察到活跃免疫类患者的频率明显更高。在C2群中非免疫类患者占73.3%,而C1和C4与耗竭免疫类患者的比例较高。
四、结论
本研究基于TCGA HNSC样本的大规模RNA测序数据,对HNSC的全基因组AS事件进行了系统的剖析,发现了HNSC相关的AS事件。进一步探讨了这些事件的潜在生物学功能和潜在调控机制。此外,对临床信息和RNA-Seq数据的整合为AS事件的预后价值提供了深入的认识。最后,根据AS事件分辨出不同的HNSC集群,并研究了基于AS的集群与临床病理变量、肿瘤细胞内在分子特征和免疫特征之间的关联。