今天跟大家分享的是2020年1月份发表在NATURE COMMUNICATIONS(IF: 11.878)上的一篇文章,干货满满,有套路,但也不乏亮点,主要是基于泛癌分析,对染色体臂非整倍体在肿瘤进化,癌症转移,患者生存和药物反应等过程中的影响进行评估,是很值得一读的Pan-cancer文章。
Chromosome arm aneuploidies shape tumour evolution and drug response
染色体臂非整倍体影响肿瘤进化和药物反应
染色体臂非整倍体(CAAs)在癌症中普遍存在,但其在癌症发展、患者治疗等方面具体作用仍然未知。在本篇文章中,研究者主要基于23427个肿瘤的CAAs组成、状态对肿瘤进化进行分析,识别CAAs发生的可能顺序,并基于CAAs预测组织特异性转移。他们还识别出可以对患者预后进行预测的72个CAAs和88个协同发生的CAA对。此外,研究者还基于机器学习识别出31个可以对多种化疗药物反应产生影响的CAAs。另外,研究者还识别出1024个潜在的具有合成致死性质的药物基因组互作。在预测药物反应方面,CAAs明显优于突变和局灶缺失/扩增。因此,CAAs可以预测肿瘤的预后、肿瘤的形态演变、转移和药物反应,从而推进肿瘤的精准医学进展。
一.确定Pan-cancer的染色体臂非整倍体改变谱
基于GISTIC2.0对来源于TCGA、MSK-IMPACT、METABRIC和GDSC的SNP6.0 array segmental拷贝数数据进行处理,通过阈值0.2确定扩增或缺失状态。根据癌症类型提取体细胞拷贝数calls和改变频率。从肿瘤拷贝数calls中减去与人类基因组比对的拷贝数calls后得到体细胞拷贝数改变(SCNAs)的calls。接着分别计算SCNA数据中每个染色体臂的总片段长度和每条染色体臂的扩增或缺失长度。接着用扩增/缺失的长度除以片段的总长度(每个染色体臂)得到染色体臂非整倍体分数,根据阈值0.9确定染色体臂非整倍体的扩展和缺失状态。
研究者们利用上述方法,对来自癌症基因组图谱(TCGA)的全基因组SNP6阵列数据,在31种癌症类型的11,019个人类肿瘤样本中测定CAAs谱。接着,研究者通过对本方法中乳腺癌的CAAs频率和其另外四种方法计算出的CAAs频率进行比较,发现本方法识别出的CAA频率与其他方法中结果有较高一致性,证明本方法的可靠性。
二.染色体臂扩增/缺失的癌症特异性与肿瘤进化
研究者发现血液癌中CAAs负荷明显少于实体肿瘤(图1 a),并且不同癌型中CAA负荷差异很大(图1b)。每个样本中,血液癌症的扩增大于缺失,而实体癌症的缺失大于扩增(图1c,d)。因此,研究者认为血液病肿瘤优先获得染色体臂,而实体肿瘤则倾向于失去臂。接着对携带不同CAAs个数的血液癌和实体癌患者的G (扩增)> L(缺失)的肿瘤比例进行比较,发现在血液癌症,G>L的比例高于预期,并且携带CAAs个数和G>L的比例成正相关(图1e)。根据对e图中不同阶段G>L比例的分析,发现在肿瘤发生过程中,血液癌症获得的臂很少,而实体癌最初也往往获得很少的染色体臂,并在后期优先失去多个臂(图1f)。另外,通过不同分期患者中G/L比例的分析发现,随着肿瘤进展到更晚期阶段,CAAs中染色臂缺失逐渐增加(图1g)。
图1. 染色体臂扩增/缺失的癌症特异性与肿瘤进化
三.原发性和转移性肿瘤的CAAs比较
转移是晚期肿瘤的一个关键特征。研究者使用MSK-IMPACT数据对5778个原发实体肿瘤样本与4424个转移性实体肿瘤样本进行比较,与原发样本相比,转移性样本CAA负荷增加(图2a)。另外,脑转移灶的CAA负荷明显高于其他常见病灶的CAA负荷(图2a),且与WGD状态无关。
研究者还基于差异分析确定与转移相关的CAAs个体,其中最显著的是前列腺癌和非小细胞肺癌(图2b)。转移相关CAAs大多具有肿瘤类型特异性的,然而一些CAAs对肝、骨或脑转移的特异性表现为中等至较强(图2c),一些通过脑转移获得的CAAs在原发性脑瘤中也很常见(图2c)。
图2. CAAs在原发性和转移性肿瘤进化中的演变
四.乳腺癌CAAs的随机模型
通过构建一个k水平的树来模拟CAAs在肿瘤进化过程中的顺序。在每一个k水平上,节点指的是所有可能存在的CAAs核型。所有的边,从k级到k + 1级,指的是核型之间的转换。利用乳腺癌(BRCA)数据的CAAs核型的频率,估计在乳腺癌发展过程中获得一个特定CAAs的概率。从而得到一个78 * 78的转移概率矩阵。根据每个CAA的观察频率,生成一个预测CAAs进化网络(图2d),提供CAAs在癌症发展过程中获得的可能顺序。
五.CAAs与预后
研究者通过对癌症类型、临床分期、年龄和所有单变量显著性CAAs作为协变量进行稳健的多变量生存分析。最终在19个分析的实体癌症类型中,识别到36个CAAs与总生存率显著相关,36个CAAs与无病生存率显著相关(图3a,b)。
图3.单个CAAs与预后
六.88个CAA对协同预测生存结局
当特定的CAAs在肿瘤中同时发生的频率比预期高时,可根据二者协同预测患者预后。研究者为29种实体癌症生成co-occurrence CAAs矩阵,识别出co-occurrenc频率明显高于预期(positive co-occurrence)或低于预期(negative co-occurrence)的CAAs对(图4a)。并根据发生co-occurrence的CAAs对生成网络和火山图(图4b,c)。最终确定293个negative和8373个positive的co-occurrence CAA对。通过对CAA对的生存分析,最终在19个癌型中识别到88对预后相关的CAA对,其中包括co-malignant对和co-protective对。co-malignant对指两个CAA同时发生改变时,患者预后较差;co-protective对则反之(图4d,e)。
图4. 88个CAA对协同预测癌症患者生存结果
研究者接着对单个CAAs和CAAs对的生存预测能力进行比较,比较单个CAAs和CAAs协同预测生存结局的优劣。与单独CAAs生存预测相比,co-occurrence CAAs的与预后的相关性更强,有更多的CAAs对可以对预后进行预测(图5a),但单个CAAs可以对更多患者进行预测。单个CAAs和CAAs对一共可以对58%的患者结局进行预测(图5b)。
研究者还对全基因组加倍(WGD)对CAAs生存预后预测能力的影响进行评估。33种癌症类型-生存类型组合中,WGD对7种癌症的生存结果有显著影响(图5c)。这涉及到44个单独的CAAs或同时发生的CAA对。对于这44个预后预测因子,研究者将 WGD纳入多元cox分析,44个预后因子中p>0.05的只有一个。因此,WGD对CAAs患者生存预后能力的影响可以忽略不计。
图5.单个CAAs和CAAs对预测生存能力的比较
七.CAAs是药物反应的独立预测因子
首先研究CAAs与化疗药物反应之间的关系,研究者发现CAA负荷通常与术前对紫杉醇和氟尿嘧啶-阿霉素环磷酰胺(T/FAC)化疗增加的预测病理完全反应(pCR)呈正相关(图6a)。然后,研究者通过与710个已建立的泛癌药物基因组特征(癌症功能事件(CFEs),图6b)预测药效反应的能力比较,发现识别出的CAA具有较好预测药物反应的能力,并且识别出365个CFE/CAA -药物相互作用(图6c,d)。最终在17种癌症类型的细胞系中识别出31个不同的CAAs会对56种化疗药物反应产生影响。
八.潜在的合成致死相互作用的药物敏感性
另外,研究者还基于 FISHER精确检验识别出1024种潜在的合成致死相互作用和89种潜在的协同抗性相互作用。
九.CAAs预测药物反应能力优于其他基因组事件
在22种癌症类型中,CAAs参与药物相互作用的频率约是CFEs的两倍(图6e)。研究者开发出一个深度神经网络模型预测CAAs和CFEs的药物敏感性。深度神经网络模型包括971个细胞系中的39种药物,研究者分别基于CFEs(710个CFEs)、CAAs(78个CAAs) 、CFEs+CAAs(788个特征),通过这些数据对三种独立的pan-cancer深度神经网络模型进行训练和5倍交叉验证(图6b)。CAAs预测精度显著高于CFEs(图6f),并且CAAs对每种药物的预测得分也显著高于CFEs。因此,78个CAAs在数量和质量上都超过710个已经建立的CFEs,并提高基于药物基因组特征预测药物反应的能力。
图6.CAAs与药效
今天的文章大概就是这些,让我们最后来总结一下吧。首先基于SNP6.0阵列数据确定CAAs改变谱,接着研究CAAs的癌症特异性,并从CAAs中推断肿瘤进化过程,以及对癌症转移的影响;接着分别识别独立的CAAs预后因子和协同发生的预后相关CAAs;最后还将CAAs与药物反应联系在一起,识别出药物-CAAs互作和可以发生协同致死的CAAs互作关系,为联合用药提供新思路。文献解读就到这里了,我们下次再见啦。