多组学高分文献17-东亚非吸烟人群的肺癌多组学表征

Proteogenomics of Non-smoking Lung Cancer in East Asia Delineates Molecular Signatures of Pathogenesis and Progression

东亚非吸烟肺癌的蛋白质组学描述了发病机理和进展的分子特征

期刊:Cell;影响因子:38.637

发表单位:台湾中央研究院等


导 读

    在东亚地区,尤其是在女性当中,未吸烟者的肺癌发病率是一个严重的健康问题。同时,早期发病是东亚地区肺腺癌(LUAD)的显著特征,尤其是对于从未吸烟者。遗传因素和环境致癌物暴露可能是导致这些人群差异的危险因素,然而,非吸烟相关的病因和致癌作用仍知之甚少。为了精确治疗,早期发现和预防可能会为患者带来更好的治疗方案。因此,了解肿瘤发生的早期过程和进展,以及与内源性和环境诱变因子相关的因素至关重要,这些因素是认识东亚地区非吸烟者的LUAD特征的基础。

    几项基因组研究已广泛探索了LUAD的突变谱,其中大多数代表了以吸烟为主的人群。多维蛋白质组学策略涵盖了癌组织的蛋白质组和磷酸化蛋白质组分析,并结合了基因组分析,阐明了新的疾病亚型和信号传导途径,以及治疗发展的潜在目标。全面的蛋白基因组学分析可了解肺癌的病因和独特特征,但目前缺乏对东亚地区非吸烟者LUAD的研究。

    2020年7月发表在《Cell》期刊上的一项研究中,运用蛋白基因组学针对中国台湾收集的代表早期、女性为主、非吸烟的东亚肺癌临床样本及配对正常组织展开全面表征。通过基因组、蛋白组和磷酸化修饰组学揭示了肺癌早期的临床特征和发展过程中的分子标志物,并且其中蛋白组层面的分型能够识别出携带EGFR突变的早期患者的特征。该研究对于早期非吸烟的患者诊治具有重要的临床意义。

摘 要

    东亚地区肺癌的特点是不吸烟者比例高、早期发病和以表皮生长因子受体(EGFR)为主的突变。为了阐明这种独特的疾病的分子表型,本研究对台湾地区一个前瞻性收集的队列进行了深入的综合蛋白质组学研究,该队列代表早期、以女性为主、不吸烟的肺腺癌。综合的基因组、蛋白质组学和磷酸化蛋白质组学分析描绘了不同的分子属性和肿瘤进展的标志。突变特征分析揭示了与年龄和性别相关的突变机制,其特征是在年轻女性中APOBEC突变特征的高患病率和在老年女性中环境致癌物样突变特征的过度代表。蛋白质组学分类有助于区分早期EGFR患者的临床特征突变。此外,综合的蛋白质网络分析揭示了支持临床分层的细胞重塑和提名的用于患者分层和治疗干预的候选生物标志物。这种多组学的分子结构可能有助于制定早期不吸烟肺腺癌的治疗策略。


强 调

    东亚地区第一个非吸烟肺腺癌的深层蛋白质组学景观;

    确定年龄、性别相关的内源性和环境致癌物致突变过程;

    蛋白质组信息分类可在早期阶段区分出临床特征;

    蛋白质网络确定了肿瘤发生标志,生物标志物和可药物靶向。


研究概要

1    东亚肺腺癌的蛋白质组学景观凸显了人口统计学差异和进展标志

    作者收集了来自台湾的103例肺腺癌患者(TW队列)的匹配肿瘤和正常组织,进行外显子组测序(WES)、RNA-seq、蛋白质组学和磷酸化蛋白质组学检测。基因组分析鉴定出23145个非同义的体细胞单核苷酸变异(SNV),在转录水平定量了30155个RNA,蛋白质谱定量了10000多种独特的蛋白质和20000个磷酸位。EGFR突变发生在大多数患者中(85%),随后是TP53(33%)和RBM10(20%)。TW和TCGA队列中SNV的总体比例不同,C>T转变在TW队列中最常见,而与吸烟相关的C>A在TCGA队列中最常见。TW队列中,吸烟者和非吸烟者之间C>A转换没有显著差异。观察结果表明,与吸烟相关的特征较不明显,这暗示了其他因素导致了TW队列的基因组格局。

图1,TW LUAD队列的基因组景观。(A)TW队列中常见癌症基因突变频谱和单核苷酸变异体(SNV)的百分比;(C)性别富集突变(上图)、女性年龄相关的RBM10突变(中图)和吸烟相关突变(下图)的簇图;(F)TW队列与先前发表的LUAD研究之间存在显著差异的基因的突变频率条形图。


    转录组和蛋白质水平的主成分分析(PCA)均显示肿瘤和正常组织的清晰分离,并揭示了更高的肿瘤变异性。DNA复制、糖酵解、谷胱甘肽代谢和免疫相关途径在转录组中上调,而DNA修复、蛋白质加工和运输途径的上调以及细胞粘附相关途径的下调在蛋白水平上更明显。非小细胞肺癌途径中,大多数蛋白质及其磷酸化位点受到差异调节。Raf/MEK/ERK轴上的磷酸化位点显示出较高的患者间差异,表明MAPK通路在患者中的特异性调控。

    为了阐明肿瘤进展的分子动力学,作者将患者分为三组:IA、IB和≥II期,并通过聚类将差异表达的蛋白质和RNA进一步分为两个亚型。两个分子亚型之间,DNA复制、糖酵解、蛋白酶体、抗菌体液反应、糖基转移酶和肌动蛋白丝组织等几个关键过程较为一致。细胞间通讯、信号传导和质膜中起作用的蛋白质,例如整合素、G蛋白偶联受体、离子通道、适应性免疫和抗原呈递,在发展过程中呈现出总体的负调节趋势。在后期阶段,糖酵解、DNA复制、应激反应以及蛋白质加工、周转和运输过程中的蛋白质上调。DNA复制和修复过程的上调以及纤毛装配基因的缺失在RNA水平上最为突出。这些结果凸显了多组学整合对鉴定肿瘤进展过程中分子稳态失调的重要性,向更晚期癌症阶段的细胞转化的特征是复制过程中RNA到蛋白质的整体活化以及与质膜信号传导和通讯有关的蛋白质组负调控。

图2,分子变异、蛋白质组学关系和肿瘤进展标志。(A)LUAD患者的蛋白质和RNA表达的主成分分析(PCA);(F)非小细胞肺癌途径中的磷酸化改变,饼图显示相应蛋白质上调或下调的患者百分比;(I)基于每个病理阶段蛋白水平的通路富集。


2    基因组改变对非小细胞肺癌蛋白质组的影响

    随后,作者描述了队列中基因组畸变导致的转录组和蛋白质组改变。共鉴定了对应于319种蛋白质的337种突变肽,其中包括15个癌症驱动基因的变异同工型。RBM10中的截断突变对RNA和蛋白质水平均显示出负面影响,而KRAS、LABM1和PIK3CA可能与稳定性增加有关。EGFR激活突变(L858R和Del19)与S1064和Y1197的磷酸化增加相关,反映了患者体内EGFR突变的激活。通过磷酸化水平的相关性分析,EGFR-pY1197与MAP2K2-pT394的正相关可证明MAPK信号的下游激活。在不吸烟的不同EGFR患者中观察到MAPK途径活性的变化激活突变,并且还受到TP53突变的影响,具有淋巴结转移的晚期肿瘤显示出较低的MAPK活性。

    通过定量性状基因座(QTL)分析确定体细胞突变在RNA和蛋白质水平上的间接影响,共鉴定出359个变体RNA和87个变体蛋白相互作用,TP53基因座是eQTL和pQTL热点。eQTL和pQTL都显示TP53突变与细胞周期基因有强正相关,其中包括蛋白质水平的微染色体维持复合物(MCM)和TOP2A的6个亚基。TP53之间的pQTLKIT致癌基因的突变和较低的丰度可能解释了MAPK的低活性。TP53突变与参与DNA浓缩和重组的蛋白和DNA损伤蛋白的更高磷酸化呈正相关,代表潜在的治疗靶点。这些结果显示,MAPK级联内的蛋白质磷酸化协同作用可由EGFR和KRAS突变解释,并且与肿瘤分期和TP53突变负相关。TP53突变也影响了DNA复制、DNA拓扑状态以及对DNA损伤的响应。

图3,突变对LUAD蛋白质组和磷酸化蛋白质组的影响。(A)热图显示突变对其编码的RNA和蛋白质表达水平的直接影响;(D)与临床特征一致的MAPK级联的分级共磷酸化签名;(E)eQTL和pQTL的变异和相关基因。


3    与内源性和环境突变和蛋白基因组学影响相关的突变概况

    作者使用非负矩阵分解(NMF)分析了突变的三核苷酸序列基序的频率,鉴定了五个突变谱,并通过分析突变特征和体外环境因子的余弦相似性,揭示了内源性和外源性诱变剂在这些特征谱中的潜在作用。其中,具有突变谱II和V的肿瘤与APOBEC签名正相关。APOBEC突变特征与C>T和C>G突变有关,具有高APOBEC特征和EGFR未突变的女性比具有低APOBEC特征和EGFR激活突变的女性更年轻,而在男性患者中未观察到类似趋势,凸显了APOBEC诱变对女性非吸烟LUAD早期发作的潜在和独特贡献。通过预测肿瘤抗原负荷以及比较APOBEC和致癌样特征,富含烷化剂样特征的肿瘤显示出更多的可能被T细胞识别的新抗原,提示可能更易于进行免疫治疗。此外,为了鉴定可能受环境因素诱变的染色体区域,通过将体细胞突变叠加在致癌物签名上进行染色体富集分析,显示富含致癌物标记的染色体区域与癌基因或抑癌基因(如TP53、ERBB2、MYC和APC)的基因组位置重叠,但这些模式是否代表了东亚地区更高频率的驱动突变易感性仍有待研究。

图4,TW LUAD队列中APOBEC和致癌物突变特征的鉴定。(A)在TW队列中鉴定的五个突变谱的三核苷酸基序频率图和丰富的突变特征;(B)根据APOBEC签名、性别和EGFR突变状态将患者分为五组;(D)在男性和女性群体中具有高APOBEC签名的患者百分比;(F)每个突变特征谱的相对百分比和个别患者的相应临床特征。


    作者继续在蛋白质组和磷酸化蛋白质组水平上调查了APOBEC突变特征的来源和后果。在蛋白质水平上,至少30%的患者中发现了与APOBEC诱变有关的APOBEC3家族的6个成员的上调。在女性患者中进行的通路分析显示,具有高APOBEC签名的肿瘤中,涉及DNA修复和复制的蛋白质更为丰富。激酶富集分析将AurB、CK2、CDK1和CDK2鉴定为APOBEC高女性组中最活跃的活化激酶,提示CDK1、CDK2和AurB可能作为干预候选物。

    为了评估致癌物签名的功能影响,作者使用转录组、蛋白质组学和磷酸化蛋白质组学数据进行富集分析。带有PAH或硝基PAH信号的肿瘤显示与化学致癌物的代谢和解毒相关的途径显著富集,包括已知有助于致癌的AHR和细胞色素P450途径。DNA修复、ERBB/MAPK途径和TLR/RIG-1 T细胞信号转导主导了硝基PAH和亚硝胺样基团,这可能与早期的肿瘤起始、细胞增殖、EMT恶性进展和免疫调节有关致癌作用。

图5,与APOBEC和致癌物特征相关的信号通路改变。(C)热图显示了女性中mRNA和蛋白质水平上APOBEC家族与DNA修复和复制分子之间的相对丰度和Spearman相关性;(E)mRNA、蛋白质组学和磷酸化蛋白质组学数据的富集分析;(F)与APOBEC和致癌物特征相关的显著富集途径的概述。


4    蛋白质组亚型展现了早期肺腺癌的异质性

    作者基于蛋白质学数据的无监督共识聚类,将队列中的腺癌患者分类为3种分子亚型。蛋白质组学亚型与临床特征的比对揭示了通过肿瘤分期以及通过驱动程序突变的强烈分离。亚型1包括最大的一组,即晚期肿瘤(≥II)、过度内脏性胸膜浸润、TP53突变和最高突变负荷。亚型2是一个较小的组,由没有EGFR -L858R突变的早期患者(主要是IA和IB)组成。亚型3显示早期(IA阶段)的过度代表,主要缺乏TP53突变。亚型之间差异磷酸位点在癌症通路、PI3K-AKT信号通路和细胞周期中显著富集。所有患有双重EGFR -L858R/TP53突变型肿瘤的IB患者均发现于晚期类,IB期EGFR患者与Del19患者相比,-L858R的总生存期明显较低。最后,作者还通过差异表达分析定义了一组生物标志物候选物,以区分早期或晚期肿瘤,并进行了药物靶向分析。

图6,TW LUAD队列的蛋白质组亚型。(A)三种蛋白质组亚型中差异表达蛋白的热图;(F)EGFR -L858R或Del19突变的IB患者组的生存曲线;(G)鉴定的候选蛋白生物标志物和药物靶向评估。


5    蛋白质组学亚型的蛋白质网络表征确定候选生物标志物和可药用靶标

    作者使用蛋白组学数据构建了共表达网络,突出显示了在通讯和微环境调节中具有作用的分子。为了识别潜在的药物靶标,根据药物基因相互作用数据库中分类的已知抑制剂对网络上的所有可药物化蛋白进行定位。着眼于最受调控的基质蛋白,发现基底膜和ECM相关蛋白大多被下调,而ECM调节剂(包括MMP和组织蛋白酶)被上调。已有报道过表达MMP以调节肺恶性肿瘤及其作为治疗靶标的用途。为了评估其作为生物标志物候选物的潜力,在另一名具有生存数据的117例早期患者的独立回顾性队列中,对选定的MMP进行了免疫组织化学染色,显示MMP11和MMP7的强表达与总生存期差有关,表明其潜在的预后价值。因此,MMP作为潜在的生物标记物,可能有助于非小细胞肺癌的早期检测和治疗。

图7,蛋白共表达网络分析及候选生物标志物。(A)3014个节点和44665个边的蛋白质相关网络,代表性富集的生物学术语显示为不同的模块;(F)具有已知药物抑制剂的蛋白质节点在网络上以橙色突出显示;(H)MMP2、MMP7、MMP11、MMP12和MMP14的丰度。


讨 论

    本研究通过对肿瘤和邻近正常组织进行深度剖析来呈现东亚LUAD的第一个蛋白质组学景观。分析结果为不吸烟者早期LUAD的多层分子结构提供了全面的见解,包括体细胞突变、内源性和外源性环境突变特征、蛋白质组亚型以及磷酸化改变。研究揭示了LUAD早期阶段的分子结构和肿瘤进展的标志,并可能为在东亚治疗非吸烟型肺癌提供精确的医学途径。

你可能感兴趣的:(多组学高分文献17-东亚非吸烟人群的肺癌多组学表征)