这次分享的是来自癌症基因组图谱计划(TCGA)研究网络在2011年发表在nature(IF:49.962, 2020)上的文章Integrated genomic analyses of ovarian carcinoma。
摘要
一系列导致卵巢癌的分子畸变对于开发和部署改善患者生活的疗法至关重要。癌症基因组图谱项目分析了489例高级别浆液性卵巢腺癌的mRNA表达、microRNA表达、启动子甲基化和DNA拷贝数,以及其中316例肿瘤编码基因外显子的DNA序列。我们在此报告,高级别浆液性卵巢癌的特征是几乎所有肿瘤(96%)都有TP53突变;包括NF1、BRCA1、BRCA2、RB1和CDK12在内的另外9个基因的低患病率但在统计学上重复发生体细胞突变;113个显著的局灶性DNA拷贝数畸变;启动子甲基化事件涉及168个基因。分析描绘了四种卵巢癌转录亚型、三种microRNA亚型、四种启动子甲基化亚型和一种与生存期相关的转录特征,并揭示了BRCA1/2(BRCA1或BRCA2)肿瘤和CCNE1差异对生存期的影响。通路分析表明,在所分析的大约一半肿瘤中同源重组存在缺陷,NOTCH和FOXM1信号与浆液性卵巢癌病理生理学有关。
引言
卵巢癌是美国女性癌症死亡的第五大原因;2010年估计发生21,880例新病例和13,850例死亡。大多数死亡(~70%)患者表现为晚期、高级别浆液性卵巢癌(HGS-OvCa)。标准的治疗方法是积极的手术,然后进行铂类-紫杉烷化疗。治疗后,大约25%的患者在六个月内复发铂耐药癌,总的五年生存率为31%。大约13%的HGS OvCa归因于RCA1/2中的种系突变,而其他种系突变所占比例较小。然而,大多数卵巢癌可归因于越来越多的体细胞畸变。
由于缺乏成功的治疗策略,癌症基因组图谱(TCGA)研究人员对临床注释的HGS OvCa样本进行了全面的基因组和表观基因组异常测量,以确定影响病理生理学、影响预后和构成治疗靶点的分子异常。微阵列分析对489例HGS OvCa肿瘤的mRNA表达、microRNA(miRNA)表达、DNA拷贝数和DNA启动子甲基化进行了高分辨率测量,并通过大规模平行测序和杂交亲和捕获,为其中316例样本提供了全基因组DNA序列信息。
样本和临床数据
本文报告了489份临床注释II-IV期HGS OvCa样本和相应正常DNA的分析。患者反映了典型诊断为HGS OvCa患者的诊断年龄、分期、肿瘤分级和手术结果。截至2010年8月25日,临床资料是最新的。HGS OvCa标本在全身治疗前通过手术切除,但所有患者均接受铂类药物治疗,94%接受紫杉烷治疗。该队列的中位无进展生存率和总生存率与之前发表的试验相似。25%的患者没有疾病,45%的患者在最后一次随访时仍然活着,而31%的患者在完成铂类药物治疗后的六个月内出现疾病进展。中位随访时间为30个月(范围为0-179个月)。选择>70%的肿瘤细胞核和<20%坏死的样品用于TCGA分析。
如表1所示,在独立位置使用多个分子分析进行协调分子分析。此处分析的数据集可在TCGA网站上获得(http://tcga-data.nci.nih.gov/docs/publications/ov_2011),分为两层:开放访问和受控访问。开放访问数据集是公开的,而受控访问数据集(包括可识别个体的临床或基因组信息)需要上述网站所述的用户认证。
突变分析
我们对从316个HGS OvCa样本和每个个体的匹配正常样本中分离的DNA进行外显子捕获和测序(补充方法,第2节)。使用有针对性的试剂捕获,来自18500个基因的180000个外显子,总计33个百万碱基的非冗余序列。在Illumina Gaix平台(236个样本对)或ABI SOLiD 3平台(80个样本对)上进行大规模平行测序,每个样本产生14千兆碱基(总共931012个碱基)。平均而言,76%的编码碱基在肿瘤和匹配的正常样本中都有足够的深度覆盖,以便进行可靠的突变检测。我们注释了19356个体细胞突变(每个肿瘤~61个);这些在补充表2.1中进行了分类。通过搜索与背景相关频率显著增加的非同义或剪接位点突变,确定了在HGSOvCa病理生理学中可能很重要的突变,通过比较本研究中的突变与癌症体细胞突变目录和人类在线孟德尔遗传目录中的突变,并预测突变对蛋白质功能的影响。
两种不同的算法确定了9个基因(表2),其中非同义或剪接位点突变的数量明显多于基于突变分布模型的预期数量。与已发表的结果一致,在316份样本中的303份样本中TP53发生了突变(283份是通过自动方法,20份是通过手动审查),BRCA1和BRCA2分别有9%和8%的病例发生了种系突变,另有3%的病例出现了体细胞突变。我们鉴定了另外六个统计上反复突变的基因:RB1、NF1、FAT3、CSMD3、GABRA6和CDK12。CDK12参与RNA剪接调节,之前与肺和大肠肿瘤有关。九个CDK12突变中有五个是无义或缺失突变,提示潜在的功能丧失,四个错义突变(Arg882Leu、Tyr901Cys、Lys975Glu和Leu996Phe)聚集在其蛋白激酶结构域中。GABRA6和FAT3均出现显著突变,但在HGS OvCa或输卵管组织中似乎不表达,因此这些基因的突变在HGS OvCa中起重要作用的可能性较小。
我们将本研究中的突变与癌症体细胞突变目录中的突变以及Man数据库中的在线孟德尔遗传进行比较,以确定更多不太常见突变的HGS OvCa基因。这些比较分别产生477个和211个匹配,包括BRAF(Asn581Ser)、PIK3CA(Glu545Lys和His1047Arg)、KRAS(Gly12Asp)和NRAS(Gln61Arg)突变。这些突变已被证明具有转化活性,因此我们认为这些突变是HGS OvCa中罕见但重要的驱动因素。
我们结合来自蛋白质家族和整个脊椎动物基因组序列比对的进化信息,预测局部蛋白质结构和选择人类SwissProt蛋白质特征,以使用CHASM识别假定的驱动突变,在接受已知癌基因和肿瘤抑制基因突变方面的培训后。CHASM鉴定了122个预测致癌的错义突变。通过使用MutationAssessor比较已知或基于同源性的三维蛋白质结构中的蛋白质家族序列比对和残基位置,从所有已确认的体细胞错义突变的进化信息推断蛋白质功能的突变驱动变化。27%的错义突变预计会影响蛋白质功能。
拷贝数分析
对489个HGS OvCa基因组中存在的体细胞拷贝数改变(SCNAs)进行了鉴定,并与多形性胶质母细胞瘤数据进行了比较(图1a)。SCNA分为影响延伸染色体区域的区域性畸变和较小的局灶性畸变。区域异常的统计分析确定了8个经常性收益和22个损失,所有这些收益和损失都已在以前报告(图1b)。在50%以上的肿瘤中,有5个增加,18个减少。
图1 | 基因组拷贝数异常。a、 489例HGS OvCa的拷贝数谱,与197例多形性胶质母细胞瘤(GBM)肿瘤的拷贝数谱47进行比较。拷贝数的增加(红色)和减少(蓝色)是沿着正常基因组(纵轴,分为染色体)的距离的函数。b、 沿着基因组绘制重要的、局部扩增(红色)和删除(蓝色)区域。注释包括20个最重要的扩增和删除区域、具有8个或更少基因的良好定位区域,以及具有已知癌症基因或通过全基因组功能丧失筛查确定的基因的区域。括号中给出了每个区域包含的基因数量。错误发现率。c、 显著扩增(红色)和删除(蓝色)染色体臂。
我们使用GISTIC识别复发性局灶性SCNA。这产生了63个焦放大区域(图1c),包括编码8个或更少基因的26个。最常见的焦点放大编码DCCNE1、MYC和MECOM(图1c),每一个都在超过20%的肿瘤中高度扩增。HGS OvCa中新的紧密定位扩增峰编码活化C-激酶受体ZMYND8;p53靶基因IRF2BP2;DNA结合蛋白抑制剂ID4;胚胎发育基因PAX8;以及端粒酶催化亚单位TERT。三个数据源 -- 创新系统(http://www.ingenuity.com/),ClinicalTrials.gov(http://clinicaltrials.gov)和DrugBank(http://www.drugbank.ca) -- 用于确定扩增、过度表达基因的可能治疗抑制剂。从这项研究中,我们发现22个作为治疗靶点的基因,包括MECOM、MAPK1、CCNE1和KRAS,在至少10%的病例中被扩增。
GISTIC还确定了50个焦点缺失(图1c)。已知的肿瘤抑制基因PTEN、RB1和NF1在至少2%的肿瘤中处于纯合缺失区域。值得注意的是,RB1和NF1也是显著突变的基因。一个缺失仅包含三个基因,包括基本细胞周期控制基因CREBBP,该基因有五个非同义突变和两个阅读移码突变。
mRNA和miRNA表达及DNA甲基化分析
我们将来自三个不同平台(安捷伦、Affymetrix HuEx和Affymetrix U133A)的11864个基因的表达测量结合起来,用于亚型鉴定和结果预测。单个平台测量受到有限但具有统计显著性的批量效应,而组合数据集没有。对组合数据集的分析确定了1500个内在变量基因,用于非负矩阵分解共识聚类。该分析产生了四个聚类(图2a)。同样的分析方法应用于参考文献25中公开的数据集,也产生了四个聚类。这两组四个聚类的比较显示出明显的相关性。因此,我们得出结论,HGS OvCa中至少存在四种稳健的表达亚型。
根据集群中的基因含量和之前的观察,我们将四种HGS OvCa亚型称为“免疫反应型”、“分化型”、“增殖型”和“间充质型”。T细胞趋化因子配体SCXCL11和CXCL10以及受体XCR3是免疫反应亚型的特征。转录因子如AshMga2和Sox11的高表达、卵巢肿瘤标记物(MUC1和MUC16)的低表达以及增殖标记物如ASMCM2和PCNA的高表达定义了增殖亚型。分化亚型与MUC16和MUC1的高表达以及分泌性输卵管生成素LPI的表达相关,表明发育处于更成熟的阶段。HOX基因和标志物的高表达提示间质成分增加,如肌成纤维细胞(FAP)和微血管周细胞(ANGPTL2和ANGPTL1),这是间质亚型的特征。
与输卵管对照组相比,HGS OvCa样本中DNA甲基化增加和肿瘤表达减少导致168个基因表观遗传沉默26。DNA甲基化与所有样本的基因表达降低相关。AMT、CCL21和SPARCL1值得注意,因为它们在绝大多数肿瘤中显示启动子高甲基化。出乎意料的是,先前报道在卵巢癌中扩增和过度表达的RAB25在一部分肿瘤中似乎也被表观遗传学沉默。正如先前报道的,489例肿瘤中的56例(11.5%)BRCA1促进剂高度甲基化并沉默。肿瘤中可变DNA甲基化的一致聚类确定了四种亚型,它们与年龄、BRCA失活事件和存活率的差异显著相关。然而,集群仅表现出适度的稳定性。
在TCGA数据集中,转录亚型的存活时间没有显著差异。增殖组的myc扩增率和rb1减少率降低,而免疫反应亚型的3q26频率增加。2(MECOM)放大。DNA甲基化簇和基因表达亚型之间存在中度但显著的重叠(P<2.2 X 10-16,卡方检验,调整后的Rank index为0.07)。
使用215份样本的整合表达数据集,定义了预测总生存率的193个基因转录特征。经单因素Cox回归分析,我们发现108个基因与较差的生存率相关,85个基因与良好的生存率相关(P值截止值为0.01)。我们在255个独立的TCGA样本集(图2b)以及三个独立的表达数据集上验证了该基因表达特征的预测能力。每个验证样本都分配了一个预测基因评分,反映其表达谱与预后基因标志之间的相似性。该特征的Kaplan–Meier生存分析显示,在所有验证数据集中,与生存率存在显著的统计学关联(图2c)。
miRNA表达数据的非负矩阵分解一致聚类确定了三种亚型(补充图6.5)。值得注意的是,miRNA亚型1与mRNA增殖亚型重叠,miRNA亚型2与mRNA间充质亚型重叠(图2d)。miRNA亚型之间的存活时间存在显著差异:miRNA亚型-1肿瘤患者存活时间显著延长(图2e)。
图2 | HGS OvCa中分子亚型的基因和miRNA表达模式及结果预测。a、 TCGA和参考文献25中的肿瘤根据基因表达分为四个簇。b、 使用训练数据集,定义预后基因特征并应用于测试数据集。c、 Kaplan–Meier分析四个独立的表达谱数据集,比较预测的高风险患者与低风险患者的生存率。包括风险指数的单变量CoxPvalue。d、 肿瘤根据miRNA表达分为三个簇,与基因簇重叠,如图所示。e、 三组基于miRNA的患者生存率差异。
影响疾病的途径
几项分析综合了316例充分分析病例的数据,以确定导致HGS OvCa的生物学因素。对已知癌症相关途径中含有一个或多个突变、拷贝数变化或基因表达变化的频率分析表明,在67%和45%的病例中,RB1和PI3K/RAS途径分别被解除调控(图3a)。使用HOTNET在大型蛋白质-蛋白质相互作用网络中搜索改变的子网络发现了几种已知的途径,包括NOTCH信号途径,该途径在22%的HGS OvCa样本中发生了改变(图3b)。
图3 | HGS OvCa中的改变途径。a、 b、RB和PI3K/RAS通路(通过策展分析(a)确定)和NOTCH通路(通过HOTNET分析(b)确定)通常发生改变。改变是由体细胞突变、DNA拷贝数改变或在某些情况下,二倍体肿瘤表达的显著上调或下调来定义的。变更频率表示为所有情况的百分比;激活基因为红色,失活基因为蓝色。c、 在高达51%的病例中,同源重组(HR)途径中的基因发生了改变。RCA1/2状态的生存分析显示BRCA1/2突变病例(总生存率较高)的结果与BRCA1/2野生型不同,BRCA1基因沉默病例的结果较差。FA,范科尼贫血。d、 FOXM1转录因子网络在84%的病例中被激活。每个基因都被描绘成一个多环圈,其中其拷贝数(外环)和基因表达(内环)被绘制成这样,环中的每个“轮辐”代表一个患者样本,样本按FOXM1表达的递增顺序排序。兴奋性相互作用(红色箭头)和抑制性相互作用(蓝色线条)取自美国国家癌症研究所途径相互作用数据库。虚线表示转录调控。
已发表的研究表明,具有突变或甲基化BRCA1或突变BRCA2的细胞具有缺陷的同源重组,并对PARP抑制剂35–38高度敏感。图3c显示,我们研究的HGS OvCa样本中有20%的BRCA1/2发生种系或体细胞突变,11%的缺失表达通过DNA超甲基化和BRCA1的表观遗传沉默与BRCA1/2突变相互排斥(P=4.4 X 10-24,费舍尔精确检验)。RBC1/2状态的单变量生存分析(图3c)显示BRCA1/2突变病例的总体生存率高于BRCA1/2野生型病例。值得注意的是,表观遗传沉默的BRCA1病例的生存率与RCA1/2野生型HGS OvCa肿瘤相似(分别为41.5个月和41.9个月的中位总生存率,P=0.69,对数秩检验)。这表明BRCA1是通过相互排斥的基因组和表观基因组机制失活的,患者的生存取决于失活机制。本研究中发现的可能使细胞对PARP抑制剂敏感的其他同源重组基因的基因组改变包括MSY的扩增或突变(也称为C11orf30)(8%)、PTEN的局部缺失或突变(7%)、RAD51C的高甲基化(3%),ATM或ATR突变(2%)和Fanconi贫血基因突变(5%)。总的来说,大约一半的HGS OvCa病例可能存在同源重组缺陷,这为PARP抑制剂针对具有这些同源重组相关畸变的肿瘤的临床试验提供了理论依据。
将整套BRCA失活事件与所有反复改变的拷贝数峰值进行比较,发现BRCA失活病例中的CCNE1扩增频率出人意料地低(8%的BRCA改变病例有CCNE1扩增,而26%的BRCA野生型病例有;Q=0.0048,Adjust FDR)。正如之前的报道,CCNE1扩增患者的总生存率往往低于所有其他病例的患者(P=0.072,对数秩检验)。然而,CCNE1扩增病例没有生存劣势(P=0.24,对数秩检验)在仅观察BRCA野生型病例时很明显,表明先前报告的CCNE1存活差异可以通过BRCA突变病例的较高存活率来解释。
最后,我们使用概率图形模型在美国国家癌症研究所通路相互作用数据库中搜索改变的通路,发现87%的病例中FOXM1转录因子网络(图3d)发生显著改变。FOXM1及其增殖相关靶基因AurB(AURKB)、CCNB1、BIRC5、CDC25和PLK1持续高表达,但不受DNA拷贝数变化的影响,表明转录调控。TP53在DNA损伤后抑制FOXM1,这表明HGS OvCa中高比率的p53突变导致TOFOXM1过度表达。在其他数据集中,FOXM1通路在肿瘤中相对于相邻上皮组织显著激活,并与HGS-OvCa22相关。
讨论
这项TCGA研究提供了HGS OvCa中像差的大规模综合视图。总的来说,突变谱非常简单。至少96%的HGS OvCa样本中发生TP53突变;在22%的肿瘤中,BRCA1和BRCA2因种系和体细胞突变而发生突变。其他七个显著突变的基因仅在2-6%的HGS OvCa样本中被鉴定。相比之下,HGS OvCa表现出显著的基因组混乱程度。SCNAs的频率与之前在胶质母细胞瘤中的TCGA发现形成了鲜明对比,在胶质母细胞瘤中,有更多的复发突变基因,染色体臂水平或局灶性SCNAs更少(图1a)。假定的DNA修复基因(包括同源重组成分)中突变和启动子甲基化的高患病率可能解释了SCNAs的高患病率。突变谱表明HGS OvCa与其他卵巢癌组织学亚型完全不同。例如,透明细胞卵巢癌肿瘤有很少的TP53突变,但有复发的ARID1和PIK3CA数量;子宫内膜样卵巢癌肿瘤有频繁的CTNNB1、ARID1A和PIK3CA突变,P53的发生率较低;粘液性卵巢癌肿瘤具有普遍的恶性肿瘤。卵巢癌亚型之间的这些差异可能反映了病因学和谱系效应的组合,并代表了通过亚型分层护理改善卵巢癌预后的机会。
确定新的治疗方法是TCGA的中心目标。目前,50%具有同源重组缺陷的HGS OvCa肿瘤可能受益于PARP抑制剂。除此之外,RB、RAS/PI3K、FOXM1和NOTCH等常见的去调控通路为治疗提供了机会。最后,重复扩增区域中的22个基因已经存在抑制剂,需要在目标基因扩增的HGS OvCa病例中进行评估。总的来说,这些发现为HGS OvCa的治疗方法奠定了基础,在这种方法中,异常基因或网络被检测出来,并被选择为有效对抗这些特定异常的疗法作为靶点。
方法概要
所有标本均来自相关机构审查委员会适当同意的患者。使用Allprep试剂盒(Qiagen)从样本中收集DNA和RNA。我们使用商业技术从全基因组扩增的肿瘤DNA和正常DNA中捕获和测序外显子。DNA序列与人类基因组的NCBI Build 36对齐;突变调用中排除了重复读取。突变的验证发生在同一肿瘤DNA的单独全基因组扩增上。通过与基于特定序列损伤准确测量率的期望模型进行比较,识别出显著突变的基因。CHASM突变鉴定仪用于鉴定功能性突变。通过与其他平台的结果进行比较,对圆形二元分段安捷伦1M特征拷贝数数据进行GISTIC分析,以确定可能的平台特定人工制品。一致聚类方法用于分析mRNA、miRNA和甲基化亚型,以及使用以前的方法预测结果。HOTNET被用于识别蛋白质-蛋白质相互作用网络中的某些部分,这些部分的事件比预期的要多。对具有显著有效概率的网络进行评估,以增加已知注释的比例。PARADIGM用于评估整合通路活性,以确定HGS OvCa中差异活跃的网络模型部分。