多组学高分文献15-乳腺癌的综合蛋白转录组学揭示了与亚型和生存相关的蛋白质-mRNA一致性

Integrated proteotranscriptomics of breast cancer reveals globally increased protein-mRNA concordance associated with subtypes and survival

乳腺癌的综合蛋白转录组学揭示了与亚型和生存相关的蛋白质-mRNA的一致性

期刊:Genome Medicine;影响因子:10.675

发表单位:美国国立卫生研究院等


导 读

乳腺肿瘤的基因表达谱已经带来了疾病亚型的里程碑式发现,以及促进对治疗反应和疾病生存的新生物标志物的研究。但是,仅根据基因表达来定义乳腺癌生物学仍然是一个挑战。考虑到蛋白质是生物学的关键功能驱动力和抗癌药物的共同靶标,2018年12月发表在《Genome Medicine》的一项研究假设蛋白转录组整合将揭示单一技术以外的新型疾病特征,运用蛋白-转录联合组学分析来深入观测乳腺癌的不同亚型与病人生存期的关系。研究通过分析了65个乳腺肿瘤和53个相邻非癌组织,发现蛋白质在肿瘤中比相应的转录本更普遍上调,并描述了蛋白质和转录水平之间以通路为中心增加的一致性,这与更具攻击性的疾病和患者生存率下降有关。此外,研究还将这些发现结合TCGA和CPTAC的公共转录组和蛋白质组学数据进一步证实。


摘 要

    背景:乳腺癌的转录组分析发现了具有临床意义的独特疾病亚型。然而,仅基于基因表达来定义疾病生物学仍然是一个挑战,因为肿瘤生物学通常是蛋白质功能的结果。本研究测量了人类乳腺肿瘤和邻近非癌组织中的整体蛋白质组和转录组表达,并进行了整合的蛋白质组分析。

    方法:应用了基于定量液相色谱/质谱的蛋白质组学分析方法,分析了65个乳腺肿瘤和53个相邻非癌组织的蛋白质提取物。来自Affymetrix基因芯片的59个肿瘤和38个非癌变组织的基因表达数据用于转录组补充。对蛋白质组学和转录组学数据进行综合分析,检查它们之间的关系、疾病特征和患者生存率。使用来自“癌症基因组图谱”和临床蛋白质组学肿瘤分析协会的蛋白质组和转录组数据,验证发现。

    结果:研究发现,蛋白质组描述了癌变组织和非癌变组织之间的差异,而这些差异是转录组无法揭示的。在基底样和三阴性肿瘤中,蛋白质组而不是转录组显示了感染相关信号通路的激活。肿瘤中蛋白质而非mRNA增加,这可能与肿瘤中mRNA的3'非翻译区的缩短有关。两种技术的综合分析进一步揭示了肿瘤中蛋白质-mRNA一致性的整体增加,与肿瘤增殖之间的强正相关,高度相关的蛋白质基因对富集了蛋白质加工和疾病代谢途径。转录物和蛋白质水平之间一致性的提高还与侵袭性疾病有关,包括基底样/三联阴性肿瘤,并降低了患者的生存率。研究还观察到蛋白质表达谱与Myc激活信号共同分离,并将乳腺肿瘤分为具有不同生存结果的两个亚组。

    结论:本研究为乳腺癌中蛋白质与mRNA表达之间的关系提供了新的见解,并表明蛋白质组和转录组的综合分析具有揭示新疾病特征的潜力。


研究概要

1    乳腺肿瘤及邻近非癌组织的蛋白质组学分析

    作者对65个乳腺肿瘤和53个相邻的非癌性组织进行了定量蛋白质组学研究,共定量了7141种蛋白质。基于基因和蛋白质标志物的表达,肿瘤划分为Luminal A(雌激素受体阳性)、HER2阳性和三阴性/基底样分子亚型。与先前的乳腺癌蛋白组数据集相比覆盖面更广,且蛋白表达具有高度一致性。蛋白丰度的主成分分析清晰区分了肿瘤组织以及健康组织的蛋白差异,并显示了亚型相关的蛋白质表达模式。

    与转录组数据相比,肿瘤组织中差异表达蛋白质存在更频繁的上调,这可能与癌细胞中3'UTR的缩短有关,由于这些mRNA中抑制性结合位点的缺失,导致mRNA转化为肿瘤蛋白的增加。肿瘤中显著上调的蛋白质富集了与蛋白质合成、降解和疾病代谢相关的不同生物学过程。当比较上调蛋白质与mRNA的关联的生物学过程时,只有蛋白质捕获了核糖体合成,且与癌症的代谢过程显示出一致的关系。在基底样肿瘤中,上调的蛋白也富集了与细菌和病毒感染有关的几种KEGG途径,表明该侵袭性亚型中与感染有关的信号途径被激活。作者还使用功能富集得分的重要性进行层次聚类分析,发现HER2阳性肿瘤在补体和凝血级联反应中具有明显的蛋白下调,而三阴性和基底样肿瘤共享与tRNA生物合成、剪接体、细胞周期以及免疫疾病和感染相关的上调蛋白的富集,与细胞外基质(ECM)受体相互作用相关的蛋白下调。

图1,乳腺肿瘤的蛋白质组分析。a,基于质谱的蛋白质组学工作流程;e,肿瘤组织以及健康组织中蛋白表达的主成分分析。


图2,差异表达的蛋白质和转录本的途径关联。a,肿瘤和邻近的非癌组织之间差异表达的蛋白质的富集;红色和绿色的条形图突出了蛋白质富集但mRNA没有富集的途径,灰色条表示肿瘤蛋白和mRNA均富集的途径,绿色边界的条形图为肿瘤中上调的蛋白质但mRNA则下调;b,热图显示了KEGG BRITE类别和通路中蛋白质的亚型特异性富集,并通过乳腺癌分子亚型产生了KEGG中蛋白质差异富集的三个分支。


2    蛋白质和mRNA丰度之间的相关性增加是疾病相关的特征

    作者检查了蛋白质和mRNA丰度之间的关系及其与疾病特征的关系。肿瘤中的蛋白质和转录水平之间的一致性总体上高于相邻的非癌性组织,表明蛋白质和mRNA丰度水平之间增加的相关性是疾病相关的特征。此外,蛋白质和mRNA丰度的相关性还与疾病的侵袭性挂钩。蛋白-mRNA对之间的一致性在侵袭性三阴性和基底样肿瘤中最高,在HER2阳性肿瘤中稍低,而在Luminal A肿瘤中最低。随着未分化疾病等级的增加,蛋白质-mRNA对一致性增加,且ER阴性肿瘤的蛋白质-mRNA对的整体一致性显著高于ER阳性肿瘤。此外,作者还发现蛋白质-mRNA相关性与疾病等级之间的相关性与肿瘤ER状态无关,而蛋白质-mRNA相关性与ER状态之间的关系部分取决于疾病等级。表达水平与疾病等级相关的蛋白质在功能上与蛋白质代谢、剪接体和核糖体功能、免疫应答和感染以及细胞外基质-受体相互作用相关。

图3,乳腺肿瘤中蛋白和mRNA丰度之间的相关性以及与亚型和生存率的关系。a,密度图表示用于乳腺肿瘤和相邻的非癌组织中蛋白和mRNA表达的Spearman相关;f、g,蛋白质-mRNA一致性值与59个肿瘤中的增殖得分密切相关(f),但在38个相邻的非癌组织中则不相关(g);h,肿瘤中的蛋白质-mRNA对之间的高度一致性与降低的乳腺癌生存率有关。


3    肿瘤中的蛋白质-mRNA对之间的高度一致性与降低的乳腺癌生存率有关

    为了揭示肿瘤中蛋白质-mRNA一致性增加与肿瘤生物学之间的功能相关性,作者通过计算11个细胞周期基因的表达得分评估每个肿瘤的增殖水平,发现增殖得分与蛋白质-mRNA一致性之间存在很强的正相关性,但这种关系在相邻的非癌性组织中不存在。基因集富集分析(GSEA)表明,细胞周期途径中的核糖体蛋白质和基因最高度富集。生存分析表明,肿瘤中蛋白质-mRNA对之间总体一致性的提高与存活率降低显著相关,蛋白质-mRNA对一致性得分更高的肿瘤的风险显著增加。这些观察结果还在TCGA以及CPTAC乳腺癌蛋白质组学数据集中得到了验证。蛋白质-mRNA对之间的一致性在最富侵袭性的分子亚型中最富集,如基底样和富含HER2,最低的是Luminal A亚型。当进行仅限于Luminal A肿瘤(最常见的乳腺癌亚型)的分析时,这些肿瘤中蛋白质-mRNA一致性的提高定义了疾病的侵袭性,并且还与患者生存期降低显著相关。

图4,TCGA乳腺肿瘤中的蛋白质-mRNA对之间的一致性,以及与分子亚型和存活率的关系。a,密度图表示404个TCGA乳腺肿瘤内蛋白-mRN表达的Spearman相关;b,在分子乳腺癌亚型之间,蛋白质-mRNA对的整体相关性显著不同;c,TCGA肿瘤中的蛋白质-mRNA对之间的总体一致性与生存率相关;d,蛋白-mRNA对之间总体一致性的提高与Luminal A型肿瘤患者的生存期降低有关。


4    肿瘤中蛋白质-mRNA相关性增加的蛋白质和mRNA的特征

    为了获得对可能影响蛋白质-mRNA一致性的特征的更多了解,作者还计算了肿瘤或相邻非癌性组织之间的蛋白质-mRNA一致性,发现与肿瘤高度相关的蛋白-mRNA对在与蛋白加工和肿瘤代谢相关的途径中显著聚集。在肿瘤和邻近的非癌组织之间具有不同丰度的蛋白质比所有检测到的蛋白质池均具有更高的平均蛋白质-mRNA系数,而在基底样肿瘤与相邻的非癌组织之间表达差异显著的蛋白质显示出最高的相关性。为了发现增加肿瘤中蛋白质-mRNA相关性的蛋白质和mRNA的特征,作者通过预测两者的稳定性将蛋白质-mRNA对分组,发现蛋白质-mRNA对之间的整体相关系数分子的稳定性的增加而增加。总之,研究发现增加的蛋白质-mRNA相关性是一种疾病标志物,其以途径为中心,并集中在代谢相关途径中,并受预测的mRNA稳定性的影响。

图5,跨乳腺组织的蛋白质-mRNA相关性及其与肿瘤特征的关系。a,跨肿瘤和邻近非癌组织蛋白质和mRNA对之间的整体Spearman相关性的密度图;b,蛋白质和mRNA对之间的一致性与KEGG中的离散途径相关;c,不同肿瘤亚型中所有蛋白质的蛋白质-mRNA相关性;d,乳腺肿瘤中蛋白质和mRNA水平之间的一致性与蛋白质和mRNA的稳定性有关。


5    蛋白质组亚型及其与Myc信号传导的关系

    最后,作者检查了蛋白质丰度谱是否可以将乳腺肿瘤分为不同的亚组。根据表达变异性最高的1000种蛋白质进行聚类,获得2簇。第1组富含基底样肿瘤,第2组富含Luminal A亚型。第1组中上调的蛋白质通常由具有Myc结合基序的编码基因,表明Myc信号对乳腺癌蛋白质组有重大影响,具有Myc蛋白的功能作为核糖体生物合成的调节剂和增强剂蛋白质合成一致。通过比较两组肿瘤是否在生存结果方面表现出差异,第1组肿瘤患者的生存期明显短于第2组患者。第1组肿瘤也与增殖指数和肿瘤等级增加相关,但是与蛋白质组定义的亚型相反,在该数据集中,增殖指数和肿瘤等级都不是生存时间的重要预测指标。

图6,蛋白表达的患者分层。a,基于肿瘤中蛋白质丰度的聚类,将患者分为两组;b,两组肿瘤之间差异表达蛋白的基因中转录因子结合位点的富集模式,第1组上调的蛋白通常由带有预测Myc结合基序的基因编码,用红色长条突出显示;c,两组患者的Kaplan-Meier生存分析。


讨 论

    本研究提供了对乳腺癌的全面蛋白质组学分析,包括对与肿瘤相邻的非癌性组织对以及具有存活随访的患者的分析,并生成了一个蛋白质组数据资源。数据表明,mRNA丰度无法完全预测乳腺癌中的蛋白质丰度,而在相邻的非癌性组织中甚至更少。肿瘤蛋白质组描述的疾病途径和亚组仅被肿瘤转录组部分捕获,与CPTAC乳腺癌研究的结果一致。乳腺肿瘤中蛋白质-mRNA的一致性提高,这是一种新颖的疾病特征和预后因素,与分子亚型,侵袭性和较低的患者生存率相关。这是首次将蛋白-mRNA关联性作为肿瘤研究中潜在预后因子的研究,意味着蛋白-转录联合组学分析可能帮助我们揭示更多隐秘的疾病信息与特征。

你可能感兴趣的:(多组学高分文献15-乳腺癌的综合蛋白转录组学揭示了与亚型和生存相关的蛋白质-mRNA一致性)