这次分享的是来自癌症基因组图谱计划(TCGA)研究网络在2008年发表在nature(IF:49.962, 2020)上的文章Comprehensive genomic characterization defines human glioblastoma genes and core pathways。
注:附图附表感兴趣可去nature官网下载(https://www.nature.com/articles/nature07385#additional-information)
摘要
人类癌细胞通常含有多种染色体畸变、核苷酸替换和表观遗传修饰,这些都会导致恶性转化。癌症基因组图谱(TCGA)试点项目旨在评估大规模多维分析这些分子特征在人类癌症中的价值,并快速向研究界提供数据。在这里,我们报告了206例胶质母细胞瘤(最常见的成人原发性脑癌类型)的DNA拷贝数、基因表达和DNA甲基化畸变的临时综合分析,以及206例胶质母细胞瘤中91例的核苷酸序列畸变。该分析为RBB2、NF1和TP53的作用提供了新的见解,揭示了磷脂酰肌醇-3-OH激酶调节亚基基因PIK3R1的频繁突变,并提供了胶质母细胞瘤发生过程中改变的途径的网络视图。此外,突变、DNA甲基化和临床治疗数据的整合揭示了在治疗的胶质母细胞瘤中由于错配修复缺陷而导致的GMT促甲基化和高突变表型之间的联系,这一观察结果具有潜在的临床意义。总之,这些发现证实了TCGA的可行性和威力,证明它可以快速扩展癌症分子基础的知识。
癌症是一种基因组改变的疾病:DNA序列改变、拷贝数畸变、染色体重排和DNA甲基化修饰共同推动人类恶性肿瘤的发展和进展。随着人类基因组的完整测序和高通量基因组技术的不断改进,现在可以考虑对人类癌症基因组进行全面调查。癌症基因组图谱旨在通过整合的多维分析,对大组人类肿瘤中主要的致癌基因组改变进行分类和发现。
TCGA研究的第一种癌症是胶质母细胞瘤(世界卫生组织IV级),这是成年人最常见的原发性脑瘤。原发性胶质母细胞瘤占活检或切除病例的90%以上,无低度恶性肿瘤病史,而继发性胶质母细胞瘤是从先前诊断的低度恶性胶质瘤发展而来的。新诊断的胶质母细胞瘤患者的中位生存期约为1年,对所有治疗方法的反应通常较差。二十年的分子研究已经确定了人类胶质母细胞瘤中的重要遗传事件,包括以下方面:(1)通过受体酪氨酸激酶(RTK)基因的扩增和突变激活导致生长因子信号传导失调。(2)磷脂酰肌醇-3-OH激酶(PI3K)途径的激活;和(3)p53和视网膜母细胞瘤肿瘤抑制通路的失活。最近的全基因组分析研究也表明,胶质母细胞瘤之间存在显著的基因组异质性,并且胶质母细胞瘤中存在分子亚类,这些亚类在完全确定后可能允许治疗的分层。尽管是片段性的,这种胶质母细胞瘤遗传学的基础知识为探索是否可以从胶质母细胞瘤基因组的更系统的检查中获得新的见解奠定了基础。
结果
数据发布。作为公共资源,所有TCGA数据都存放在数据协调中心(DCC)供公众访问(http://cancergenome.nih.gov/)。TCGA数据按数据类型(例如,临床、突变、基因表达)和数据级别进行分类,以允许在适当的患者隐私保护下对该资源进行结构化访问。补充方法中提供了数据组织的概述,TCGA数据入门中提供了详细说明(http://tcga-data. nci.nih.gov/docs/TCGA_Data_Primer.pdf)。
生物样本收集
根据手术病理报告和临床记录,对新诊断的胶质母细胞瘤进行回顾性生物样本库筛选(补充图1)。进一步选择具有匹配正常组织以及相关人口统计学、临床和病理学数据的样本(补充表1)。在Biospecimen核心资源(BCR)处审查相应的冷冻组织,以确保至少80%的肿瘤细胞核和最多50%的坏死(补充图1)。从合格的生物样品中提取的DNA和RNA在分发给TCGA中心进行分析之前接受额外的质量控制测量(补充方法)(补充图2)。
基于肿瘤含量不足(n=234)和核酸质量或数量不理想(n=147)排除后,筛选的587个生物样本中的206个(35%)符合拷贝数、表达和DNA甲基化分析的条件。其中143例符合正常外周血或正常组织DNA,因此适合重新测序。该队列还包括21例用于探索性比较的治疗后胶质母细胞瘤病例(Supplementary Table 1)。尽管在其余185例新诊断的胶质母细胞瘤中可能有少量进行性继发性胶质母细胞瘤,但该队列主要代表原发性胶质母细胞瘤。事实上,与已发表的队列相比,TCGA中新诊断的胶质母细胞瘤病例的总体存活率与文献中报道的原发性胶质母细胞瘤相似(补充图3,P=0.2)
基因组和转录畸变
在三个微阵列平台(补充方法)上测量基因组拷贝数改变(CNA),并使用多种分析算法进行分析(补充图4和补充表2-4)。除了众所周知的改变外,我们还检测到以前在胶质母细胞瘤中未报道过的显著复发性局灶性改变,例如涉及NF1和PARK2的纯合子缺失,以及AKT3的扩增(图1a和补充表2-4)。对信息丰富但不常见的CNA的搜索也发现了罕见的焦点事件,如FGFR2和IRS2的扩增和TPRD的删除(补充表4)。蛋白质编码基因和非编码microRNA的丰度也通过转录物特异性和外显子特异性探针在多个平台上测量(补充方法)。由此产生的综合基因表达数据集显示,复发性CNA中76%的基因具有与拷贝数相关的表达模式(补充表2)。此外,基于单核苷酸多态性(SNP)的分析也对拷贝中性杂合性丢失(LOH)进行了分类,最显著的区域是17p,其中包含STP53(补充方法)。
图1 | 显著拷贝数畸变和体细胞突变模式。a、 焦点高水平CNA的频率和意义。每个重要CNA都列出了已知和假定的目标基因,“基因数量”表示每个焦点CNA边界内的基因总数。b、 c,在根据治疗状态分离的91例胶质母细胞瘤样本中,沉默(b)和非沉默(c)突变的数量分布,显示19例治疗样本中有7例出现超突变。d、 91例胶质母细胞瘤中的显著突变基因。这里显示了获得错误发现率0.1的八个基因。未处理样本中发生的体细胞突变呈深蓝色;在接受治疗的队列中,在统计上非超突变和超突变样本中发现的分别为浅蓝色。记录每组的事件数。
胶质母细胞瘤中的体细胞核苷酸改变模式
从143例病例中选择91对匹配的肿瘤-正常对(72例未治疗病例和19例治疗病例),检测601个选定基因的体细胞突变(补充表5)。由此产生的序列总计9700万个碱基对(每个样本116.1万个碱基),在223个独特基因中发现了453个经验证的非沉默体细胞突变,其中79个包含两个或更多事件(补充表6;另见http://tcga-data.nci.nih.gov/docs/somatic_mutations/tcga_mutations.htm)。背景突变率在未治疗和治疗的胶质母细胞瘤之间存在显著差异,每个样本的平均体细胞沉默突变率分别为1.4和5.8(72例未治疗病例中的98个事件,19例治疗病例中的111个事件,P<10-21)。这种差异主要由七个超突变样本驱动,由沉默和非沉默突变的频率确定(图1b,c)。7例高突变肿瘤中有4例来自先前使用替莫唑胺治疗的患者,3例来自单独或联合使用CCNU(洛莫司汀)治疗的患者(补充表1b)。在三个具有MSH6突变的胶质母细胞瘤标本中描述了胶质母细胞瘤的高突变表型,这促使我们对参与错配修复(MMR)的基因进行系统分析。事实上,七个超突变样本中有六个在至少一个MMR基因MLH1、MSH2、MSH6或者PMS2中存在突变,而八十四个非超突变样本中只有一个样本(P<7 * 10-28),这表明在这些来自治疗患者的高度突变样本中,DNA修复能力降低。
通过对突变显著性进行统计分析,我们发现8个基因发生了显著突变(错误发现率<10-3)(图2d和补充表6)。有趣的是,在72例未经治疗的胶质母细胞瘤中检测到27例TP53突变(37.5%),在19例经治疗的样本中检测到11例突变(58%)。所有这些突变都聚集在DNA结合域,这是人类癌症中p53突变的一个众所周知的热点(补充图5和补充表6)。鉴于原发性胶质母细胞瘤在这一新诊断的集合中占优势,这一结果明确证明p53突变是原发性胶质母细胞瘤中的常见事件。
图2 | F1肿瘤抑制基因和GFR家族成员的突变。a、 91例胶质母细胞瘤的NF1体突变。观察到错义突变和截断无义、移码和剪接位点突变。剪接位置是根据人类基因突变数据库中的F1参考转录本编号的最近外显子(e#)的碱基数给出的;阳性表示39个外显子,阴性表示59个外显子。星号表示终止密码子。fs,移帧。b、 基因座的拷贝数和突变状态与表达水平(yaxis)的相关性。预测导致较少表达拷贝(包括缺失、无义、剪接位点和移码突变)的突变事件通常具有较低的观察表达。纯合子缺失;单拷贝丢失;中性,拷贝数无变化(假定为二倍体);Amp,增加了拷贝数。按照补充信息中的描述,确定每个样本中THNF1基因座的拷贝数状态。c、 TCGA样本TCGA-08-0356(红色)、TCGA-02-0064(蓝色)和TCGA-02-0529(绿色)在GFRLocus的DNA拷贝数和mRNA表达谱。上面板显示分段DNA拷贝数(基于Affymetrix SNP6)。0数据)和7号染色体上的基因组坐标。下面板显示了来自Affymetrix外显子阵列的已知外显子的相对外显子表达水平,按基因组位置排序,其中相对表达是外显子强度和基因强度的中间集中差异。格弗涅模型位于两个图之间。黑线描绘了外显子2至7和26至28的基因组位置。请注意,结构缺失导致外显子2-7在绿色和蓝色样本中的表达相对较低,而外显子26-28在红色样本中的表达相对较低。d、 91例胶质母细胞瘤中的ERBB2体细胞突变。在胶质母细胞瘤的细胞外区域可见突变簇。剪接位点突变位置以最接近外显子(e#)的碱基数表示;外显子阳性
NF1是一个人类胶质母细胞瘤抑制基因
尽管在一小系列人类胶质母细胞瘤肿瘤中报道了NF1的体细胞突变,但其作用仍有争议,尽管在小鼠模型系统中有大量的遗传数据。在13个样本(91个样本中的14%)中发现了19个NF1体细胞突变,包括6个无义突变,4个剪接位点突变,5个错义变化和4个移码插入/删除(indels)(图2a)。其中五种突变——R1391S(参考文献23)、R1513(参考文献24)、e2521和e2911(参考文献25)以及Q1966(参考文献26)——已被报告为神经纤维瘤病患者的种系改变,因此可能失活。此外,在206例病例的整个临时样本集中观察到30个杂合缺失,其中6个还存在点突变(补充表8和9)。一些样本也表现出表达缺失,没有基因组改变的证据(图2b)。总的来说,206例患者样本中至少有47例(23%)存在体细胞NF1激活突变或缺失,明确说明NF1与散发性人类胶质母细胞瘤的相关性。
EGFR家族活化的患病率
EGFR在原发性胶质母细胞瘤中经常被激活。除了胞外结构域点突变和胞质结构域缺失28,29外,胞外结构域的变体III缺失(“vIII突变体”)27是最常见的描述事件,高分辨率基因组和外显子特异性转录组分析很容易检测到vIII和羧基末端缺失,并相应改变转录物(图2c)。在91例具有体细胞突变数据的胶质母细胞瘤病例中,22例存在野生型EGFR的局灶性扩增,无点突变,16例存在除局灶性扩增外的点突变,3例存在EGFR点突变但无扩增(补充图6和补充表9)。在91个测序样本中,共有41个样本出现EGFR畸变。
人胶质母细胞瘤PI3K复合体的体细胞突变。
PI3K复合物由催化活性蛋白p110a(由PIK3CA编码)和调节蛋白p85a(由PIK3R1编码)组成。据报道,在多种肿瘤类型中,包括胶质母细胞瘤,都存在PIK3CA的频繁激活错义突变。这些突变主要发生在适配器结合域(ABD)以及C2螺旋和激酶域中。事实上,在91个测序样本中的6个样本中检测到PIK3CA同源核苷酸替换(补充表6)。除了COSMIC数据库(http://
www.sanger.ac.uk/genetics/CGP/cosmic/),在PIK3CA的适配器结合域中检测到两种新的框架内缺失(“L10del”和“P17del”)。这些缺失可能破坏P110α与其调节亚单位p85a之间的相互作用(参考文献37)。
与PIK3CA不同,PIK3R1在癌症中很少被报道为突变。在癌症38,39中报道的五种PIK3R1核苷酸替换中,一种是胶质母细胞瘤39。在我们的TCGA队列中,在91例已测序的胶质母细胞瘤中检测到9例PIK3R1体细胞突变。没有一个样本含有PIK3含量。在9个突变中,8个位于中间的SH2(或iSH2)结构域内,4个是3-bp的框内缺失(图3a和补充表6)。根据PI(3)K的晶体结构,其识别p85aas中的D560和N564氨基酸残基与p110a C2结构域中的N345氨基酸残基的接触点(参考文献37),在胶质母细胞瘤中检测到的突变聚集在这三个氨基酸残基周围(图3b),包括IK3CA的N345K突变(以前在结肠癌和乳腺癌中报道过40)和IK3R1的D560Y和N564K突变。除了两个关键残基附近的其他三个新的缺失(R574del、T576del和W583del),我们还发现了一个18 bp的缺失,跨越了PIK3R1(图3b)中的残基D560到S565(DKRMNS)。我们推测,由于这些缺失导致的空间限制可能会阻止p85aN末端SH2(nSH2)结构域与p110a螺旋结构域的抑制性接触,从而导致组成性PI3K活性。
与PIK3CA不同,PIK3R1在癌症中很少被报道为突变。在癌症中报道的五种PIK3R1核苷酸替换中,一种是胶质母细胞瘤。在我们的TCGA队列中,在91例已测序的胶质母细胞瘤中检测到9例PIK3R1体细胞突变。它们都不在PIK3CA突变的样本中。在9个突变中,8个位于中间的SH2(或iSH2)结构域内,4个是3-bp的框内缺失(图3a和补充表6)。根据PI(3)K的晶体结构,将p85a中的D560和N564氨基酸残基识别为p110a C2结构域的N345氨基酸残基的接触点,胶质母细胞瘤中检测到的突变聚集在这三个氨基酸残基周围(图3b)。包括PIK3CA中的N345K突变(此前在结肠癌和乳腺癌中有报道)和PIK3R1中的D560Y和N564K突变。除了两个关键残基附近的其他三个新的缺失(R574del、T576del和W583del),我们还发现了一个18 bp的缺失,跨越了PIK3R1(图3b)中的残基D560到S565(DKRMNS)。我们推测,由于这些缺失导致的空间限制可能会阻止p85aN末端SH2(nSH2)结构域与p110a螺旋结构域的抑制性接触,从而导致组成性PI3K活性。综上所述,PI3K晶体结构定义的关键残基周围突变的聚集模式强烈表明,这些新的PIK3R1点突变和INDEL破坏了重要的C2–iSH2相互作用,减轻了p85a对p110a的抑制作用。
图3 | 胶质母细胞瘤中的PIK3R1和PIK3计数。a、 TCGA肿瘤中发现的突变位置显示在主干上方。ABD,适配器结合域;RBD,Ras结合域;C2,膜结合域;nSH2,N端SH2结构域;iSH2,内部SH2结构域;cSH2,C端SH2结构域。b、 在P110A的C2结构域与p85a的iSH2的相互作用界面中发现三个突变。p85a的两个残基D560和N564位于p110a和N345的C2残基的氢键距离内。
MGMT甲基化和MMR治疗的胶质母细胞瘤
相对于正常大脑DNA,测定2305个基因启动子内位于CpG岛的CpG二核苷酸的癌症特异性DNA甲基化(补充表7和补充方法)。MGMT(一种从鸟嘌呤残基中去除烷基的DNA修复酶)的启动子甲基化状态,与胶质母细胞瘤对烷基化剂的敏感性有关。91例测序病例中,19个样本被发现含有MGMT启动子甲基化(包括72个未治疗病例中的13个和19个治疗病例中的6个)。当与体细胞突变数据并列时,高突变表型和MGMT甲基化状态之间的有趣关系出现在治疗样本中。具体而言,MGMT甲基化与经治疗的胶质母细胞瘤核苷酸替换谱的深刻变化相关(图4a)。在未进行MGMT甲基化的13个治疗样本中,29%(99分之29)的经验证的体细胞突变发生在CpG二核苷酸中的G·C到A·T转换(甲基化胞嘧啶自发脱氨基的特征),所有突变中的23%(99分之23)发生在非CpG二核苷酸中的G·C到A·T转换。相比之下,在6个MGMT甲基化处理的样本中,81%的突变(181个突变中的146个)是非CpG二核苷酸中的G·C到A·T转换类型,而所有突变中只有4%(181个突变中的8个)是CpG中的G·C到A·T突变。这种模式与治疗导致的烷基化鸟嘌呤残基修复失败是一致的。换句话说,MGMT甲基化将处理样本的突变谱转移到非CpG位点的G·C到A·T转换优势。
图4 | 经治疗的胶质母细胞瘤的体细胞突变、MGMT DNA甲基化和MMR基因突变模式。a、 关键样本组的每个肿瘤经验证的体细胞核苷酸替换的平均数量显示在Y轴上,并用条形直方图的高度表示。样本根据患者的治疗状态沿X轴分组(减表示未治疗;加上表示已处理),MGMT的DNA甲基化状态(Meht为DNA甲基化;-为未甲基化),以及MMR基因的遗传状态(-为无基因突变;Mut为一个或多个MLH1、MSH2、MSH6或MS2基因突变);每个栏下方的数字表示组中的样本数。对核苷酸替换类型进行颜色编码,包括非CpG位点的G-to-A转换(蓝色)、CpG位点的G-to-A转换(绿色)和其他突变类型(灰色)。b、 作为MGMT治疗状态和甲基化状态函数的MMR基因突变谱条形直方图。替代类型的颜色代码与a中相同。
值得注意的是,MMR基因本身的突变谱反映了MGMT甲基化状态和治疗结果。在六甲基化、超突变(治疗)肿瘤中发现的所有七种MMR基因突变都是在非CpG位点发生的G·C到A·T突变(图4b和补充表6),而非甲基化、超突变肿瘤中的MMR突变均不具有这一特征。因此,这些数据表明,MMR缺乏和MGM甲基化在治疗过程中共同对胶质母细胞瘤体细胞点突变的总体频率和模式产生强大的影响,这一观察结果具有潜在的临床重要性。
综合分析确定了胶质母细胞瘤的核心通路
为了开始构建胶质母细胞瘤基因组中常见遗传改变的综合视图,我们将明确的遗传改变——经验证的体细胞核核苷酸替换、纯合缺失和局灶性扩增——映射到与胶质母细胞瘤相关的主要途径1上。该分析确定了一个高度互联的畸变网络(补充图7和8),包括三条主要途径:RTK信号传导,以及p53和RB肿瘤抑制途径(图5)。
仅通过拷贝数数据,206个样本中的66%、70%和59%分别在RB、TP53和RTK通路的核心成分中存在体细胞改变(补充表8)。在有测序数据的91个样本中,体细胞改变的频率分别增加到87%、78%和88%(补充表9)。有一种统计趋势,即每个通路中的组分变化相互排斥(p53、RB和RTK通路的P值分别为9.33 X 10-10、2.5 X 10-13和0.022;补充表10),这与放松对通路中一种成分的调节可以减轻对其他成分的选择压力的论点相一致。然而,我们观察到一个大于随机的机会(单侧,P=0.0018)一个给定的样本至少含有一个来自三条途径的异常基因(补充表10)。事实上,74%的患者在所有三条通路中都存在异常,这一模式表明,解除三条通路的调节是胶质母细胞瘤发病机制的核心要求。
除了脂类磷酸酶肿瘤抑制基因的频繁缺失和突变外,86%的胶质母细胞瘤样本在核心RTK/PI3K通路中至少存在一个遗传事件(图5a)。除GFR和ERBB2外,PDGFRA(13%)和MET(4%)表现出频繁的畸变(补充表9)。在91个测序样本中,共有10个样本在4个分类的RTK中至少有2个存在扩增或点突变(EGFR、ERBB2、PDGFRA和MET;补充表9),表明基因组激活可能是共激活RTK的一种机制。
图5 | 三条关键信号通路中的频繁基因改变。图中显示了RTK/RAS/PI3K(a)、p53(b)和RB(c)信号通路组成部分的一级序列改变和显著拷贝数改变。红色表示激活基因改变,频繁改变的基因显示更深的红色。相反,蓝色表示失活性改变,较深的阴影对应较高的改变百分比。对于特定通路的每一个改变成分,改变的性质和受影响肿瘤的百分比都会被指出。框中包含胶质母细胞瘤的最终百分比,其中至少有一个指定通路的已知组分基因发生了改变。
除了p53本身的突变外,p53途径的失活表现为ARF缺失(55%)、DM2扩增(11%)和MDM4扩增(4%)(图5b和补充表8)。在91个测序样本中(补充表9),基因损伤INTP53与MDM2或MDM4相互排斥(两者的优势比均为0.00;P50。分别为0.02和0.068;补充表10),但不是inARF的补充表。事实上,32例TP53突变的肿瘤中有10例也有deletedARF,这表明CDKN2A基因座(编码p16INK4A和ARF)的纯合缺失至少部分由p16INK4A驱动。
在77%存在RB通路畸变的样本中(图5c),最常见的事件是染色体9p21上的CDKN2A/CDKN2B基因座缺失(55%和53%),随后是CDK4位点扩增(14%)(图5c和补充表8和9)。尽管CDK/RB通路成员中的CNA可能在同一肿瘤中同时发生14,但所有9个带有RB1核苷酸替换的样本(补充表9)都缺乏CDDKN2A/CDKN2B缺失或通路中的其他CNA,这表明与拷贝数丢失相比,通过核苷酸替换使RB1失活可以避免遗传性的基因突变。
讨论
在建立这一试点方案的过程中,TCGA制定了生物样本银行和收集方面的重要原则,并建立了未来将服务于类似工作的基础设施。虽然它确保了高质量的数据,但严格的生物样本选择标准可能引入了一定程度的偏差,因为排除了小样本和高水平坏死的样本。尽管如此,该队列的临床参数与其他已发表队列相似(补充图3和补充表1)。
来自互补技术平台的多维基因组数据的综合分析被证明是信息丰富的。除了将RB、p53和RTK/RAS/PI3K通路的去调节作为大多数(也许是所有)胶质母细胞瘤肿瘤的强制性事件外,突变模式也可能为未来的治疗决策提供信息。有理由推测,DKN2AO缺失或失活突变的患者或CDKN2Cor扩增CDK4/CDK6的患者可能是CDK抑制剂治疗的候选者,这一策略不太可能对RB1突变的患者有效。类似地,具有PTEN缺失或PIK3CA或PIK3R1激活突变的患者可能会从PI3K或PDK1抑制剂中获益,而PI3K通路被AKT3扩增改变的肿瘤可能证明对这些方式不起作用。基因组共扩增的存在加强了最近关于单个胶质母细胞瘤标本中多个磷酸化(激活)RTK的报道,这表明了一种根据RTK突变的特定模式定制抗RTK治疗鸡尾酒的方法。此外,联合抗RTK治疗可能与下游抑制PI3K或细胞周期介质协同作用。相比之下,NF1突变的胶质母细胞瘤可能受益于RAF或MEK抑制剂作为组合的一部分,如BRAF突变癌所示。
胶质母细胞瘤最重要的生物标志物之一是GMT的甲基化状态,它预测对替莫唑胺的敏感性,替莫唑胺是胶质母细胞瘤患者目前的护理标准。对突变、DNA甲基化和临床(治疗)数据的综合分析(尽管样本数量较少)表明,一系列相互关联的事件可能会影响临床反应和结果。新诊断的MGM甲基化胶质母细胞瘤对烷基化剂治疗反应良好,部分原因是未修复的烷基化鸟嘌呤残基启动了无效的错配修复周期,可导致细胞死亡。因此,用烷基化疗法治疗GMT缺乏的胶质母细胞瘤会产生强烈的选择性压力,从而失去错配修复功能。这一结论与我们的观察结果一致,即错配修复基因本身在非CpG位点发生了特征性C·G到A·T的转换,这是由未修复的烷基化鸟嘌呤残基引起的。所以,GMT的初始甲基化,结合治疗,可能会导致影响错配修复基因突变的突变谱的改变和失去错配修复功能的选择性压力。换句话说,我们的发现增加了这样一种可能性,即最初对目前使用的一线治疗有反应的患者不仅可能产生治疗耐药性,而且可能出现MMR缺陷型高突变表型。如果这一假设得到验证,人们可能会推测,针对失配修复缺陷细胞设计的选择性策略将代表与烷基化剂的合理前期组合,共同防止或最小化这种耐药性的出现。相反,这种治疗介导的突变表型可增强对靶向治疗产生耐药性的途径突变,从而警告烷基化剂与靶向剂的组合,因为这可能显著增加对此类靶向药物产生耐药性的可能性。
TCGA利用统计上稳健的样本数量产生前所未有的多维数据集的能力为发现新的癌症干预措施开辟了一个新时代。导致对潜在耐药机制形成意料之外的假设的综合分析准确地强调了此类项目设计的价值和力量,证明了对大样本队列进行无偏见和系统的癌症基因组分析是如何导致重大发现的。
方法概要
根据适当的机构审查委员会对新诊断的胶质母细胞瘤(肿瘤细胞百分比最低为80%)的批准,从组织来源地的回顾性数据库中筛选生物样本。从合格标本中提取的RNA和DNA被分发到TCGA中心进行分析。用Sanger法对肿瘤和正常样本的全基因组扩增基因组DNA样本进行测序。在校正核苷酸类型的背景突变率和每个基因的序列覆盖率后,调用突变,使用第二个基因分型平台进行验证,并进行系统分析,以识别显著突变的基因。使用安捷伦244K,Affymetrix SNP6进行DNA拷贝数分析。0和Illumina 550K DNA拷贝数平台。使用各种算法(GISTIC、GTS、RAE)确定样本特异性和重复性拷贝数变化。使用Affymetrix U133A、Affymetrix外显子1.0 ST、定制Agilent 244K和Agilent miRNA阵列平台生成信使RNA和microRNA(miRNA)表达谱。mRNA表达谱被整合到每个样本中每个基因相对基因表达的单个估计中。使用Illumina GoldenGate分析测定CpG二核苷酸的甲基化。DNA序列改变、拷贝数、mRNA表达、miRNA表达和CpG甲基化的所有数据均以标准通用格式保存在http://cancergenome.nih.gov/dataportal/。提交给DCC的所有档案均经过验证,以确保文件结构通用,并确保识别信息的正确使用。