An independent poor-prognosis subtype of breast cancer defined by a distinct tumor immune microenvironment
一种由独特的肿瘤免疫微环境定义的独立贫血亚型乳腺癌
发表期刊:Nat Commun
发表日期:2019 Dec 3
影响因子:12.121
DOI: 10.1038/s41467-019-13329-5
一、研究背景
肿瘤微环境影响癌症的起始和进展。在乳腺癌中,临床病理特征,如年龄,等级,阶段和分子亚型与预后有关,并驱动治疗决策。5种临床相关的分子亚型:Luminal A、Luminal B、Her2富集型、基底样型和正常样型,其发病率、生存率、预后和肿瘤生物学特性各不相同。
除了癌细胞生物学因素外,炎症微环境也影响着肿瘤的起始和进展。癌细胞周围的免疫微环境可以识别和抑制肿瘤生长或促进进展。在乳腺癌中,高免疫浸润已与更好的临床结果。此外,高免疫浸润已与新辅助和辅助化疗的反应增加相关。
二、材料与方法
1 数据来源
1)基因表达:手术收集的MicMa队列(其中的子集用于分析, MicMa-nCounter(n = 96,FFPE),MicMa-Agilent(n=104,新鲜冷冻组织))
2)RNA-seq:OSLO2-EMIT0队列(GSE135298,原始数据在EGAS00001003631)
3)公开的数据:表达数据从GEO、European Genome-phenome Archive、ArrayExpress或TCGA获得;METABRIC队列
2 分析流程
1)基因集富集分析
2)无监督聚类获得免疫簇:基于509个基因,使用R包pheatmap对患者的相关性矩阵进行层次聚类
3)Nanodissect:用于淋巴和髓细胞浸润的预测,淋巴细胞或骨髓细胞浸润的nanodissect分数反映了样本中各自基因的平均表达量
4)CIBERSORT(22种类型的浸润性免疫细胞的绝对比例)、ssGSEA(上皮间质转化、干细胞、增殖和细胞周期相关途径的基因集)
5)二项式逻辑回归预测免疫集群:R包glmnet (构建模型公式)
6)免疫浸润的病理评估
7)ROR评分:ROR-Score=0.05×Basal+0.12×Her2-enriched − 0.34×Luminal A+0.23×Luminal B;其中,基底、Her2富集、管腔A和管腔B是每个样本与R中使用genefu软件包获得的质心的相关性
8)统计学、生存分析、多变量Cox回归分析
三、结果展示
01 - 乳腺癌的免疫簇并反映了逐渐的免疫浸润
测量了MicMa队列的95个肿瘤样本中760个基因的表达,该阵列旨在剖析实体肿瘤中的免疫浸润。这95个样本中的79个样本之前已经通过Agilent全基因组4×44K寡核阵列进行了剖析。首先使用Pearson和Spearman相关性比较了两个平台获得的表达,发现基因的表达值之间存在高度的正相关(补充图1A)。
为了根据免疫相关基因表达的相似性对患者进行分组,对相关矩阵进行了无监督的分层聚类(图1a和补充图1B)。从3到10个聚类的轮廓图分析表明,3个聚类最好地捕获了nCounter和Agilent数据集的分割(补充图1C,D)。比较了两个数据集MicMa-nCounter和MicMa-Agilent的聚类结果。在这两个数据集中,有79个样本是重叠的。随着用于测量基因表达的不同平台,以及基因列表和用于执行无监督聚类的样本的不完全重叠,仍然发现79个重叠样本的聚类分配显著相似。
为了确认集群与肿瘤免疫微环境相关(图1b),使用算法Nanodissect为总淋巴细胞和骨髓细胞浸润打分。Nanodissect评分首先在MicMa队列中使用有经验的病理学家分析的匹配苏木精和曙红切片的免疫浸润评估进行验证(图1c和补充图1E)。发现这三个簇与Nanodissect淋巴细胞(图1b)和骨髓细胞(补充图1F)评分显著相关。得出结论,簇A-C反映了逐渐的免疫浸润,因此被称为免疫簇。
使用其他9个队列的表达数据验证了这些簇与淋巴/髓细胞浸润之间的关联。有509个基因在所有研究的数据集中被发现,被用于无监督聚类(图1d和补充图2A,分别用于METABRIC和TCGA队列的聚类)。在每个队列中,所得到的三个聚类与淋巴和骨髓Nanodissect评分显著相关(图1e;补充图2B)。淋巴和髓细胞浸润从簇A(蓝色;低浸润;冷肿瘤)逐渐增加到簇B(浅蓝色;中等浸润)和簇C(粉红色;高浸润;热肿瘤)。
对于额外的一层验证,使用METABRIC队列中免疫浸润的病理评估,这与Nanodissect评分(图1f和补充图2C)和免疫簇显著相关。使用PanCancer免疫剖析阵列的基因进行无监督分层聚类,可以根据免疫浸润的渐进水平对乳腺癌肿瘤进行分组。
02 - 免疫簇与预后相关
对于两个最大的队列METABRIC(n = 1904)和TCGA(n = 981),发现簇B(具有中等水平的免疫浸润)与更差的预后相关(补充图3A,B)。当分别对ER阴性(补充图3C,D)和ER阳性(补充图3E,F)的病例进行分层时,也观察到簇B病例的这种更差的结果。为了完善观察结果,根据簇B(浅蓝色)与簇A和簇C(紫色)绘制了患者生存期图,并证实簇B患者的预后明显且显著恶化(图2)。用相关生存数据在另外四个队列中进一步验证了这一结果。结论是免疫簇与ER阴性和ER阳性乳腺癌的预后相关。
03 - 用二项式逻辑回归预测免疫簇
基于免疫聚类的临床相关性,旨在开发一种通用的方法,能够准确而敏感地预测患者的预后较差的分类,而不必依赖于无监督聚类。作者使用二项式逻辑回归,通过lasso进行惩罚,得到一组基因,这些基因可以敏感和特异地预测一个样本是否属于簇B,通过接收者操作特征曲线和曲线下面积(AUC)分析评估(图3a)。96.3%的样本被模型预测为簇A和簇C,而68.8%的样本分到了簇B(图3b)。
通过比较生存期对数秩检验p值,发现lasso分类普遍改善了免疫簇与生存期之间的显著关联。lasso模型在另外5个队列中得到了验证。图3c-e为STAM(n = 856)、MAINZ(n= 200)和UPSA(n = 289),补充图5A、B为CAL(n = 118)和PNC(n= 92)。
由于二项式逻辑回归只预测了两个簇(簇B与簇A和簇C),进行了另一轮二项式逻辑回归,以高准确度区分簇A和簇C(补充图5C,D)。
04 - 免疫簇,一个独立的预后因素
作者进一步研究了免疫簇与乳腺癌中著名的临床病理特征(大小、年龄、等级、阶段、淋巴结受累和分子亚型(PAM50))的关系。簇A(免疫浸润度低)富含ER阳性和Luminal病例,而簇C(免疫浸润度高)中ER阴性和Basal样病例比例较高,ER阴性和ER阳性样本以及PAM50亚型在预后不良的簇B中同样占有一定比例(图4a,b)。
使用多变量Cox回归分析测试了免疫簇的预后影响,同时考虑了其他预后因素。发现免疫簇是模型生存的重要因素,如每个队列Cox模型中与免疫群相关的显著p值所示。为了进一步检验免疫簇作为重要的预后生物标志物的优势,采用了逐步回溯选择的方法。对于所有队列,免疫簇被保留在最佳拟合的最小模型中,在11个队列中的9个队列中,免疫簇是一个显著的预后变量。
05 - 具有复发风险(ROR)评分的新RNA-seq数据集的验证
EMIT0,这是OSLO2队列研究的一个子集,OSLO2-EMIT0由食品和药物管理局批准的Prosigna复发风险(ROR)分数评估,ROR评分在标准的临床病理特征之上增加了重要的预后信息。发现簇B组成的样本与簇A和C相比具有中间的ROR评分(图4c),表明与簇B相关的不良预后不可能由ROR评分中包含的信息来解释。当分别评估ER阴性(补充图7A)和ER阳性(补充图7B)病例时有同样结果。对于所有队列通过已有方法计算ROR评分,该方法与PAM50亚型有关,并证实簇B由中间ROR评分组成(图4d和补充图7C,D)。
多变量回归分析证实,免疫簇为ROR评分带来了额外的预后价值,这体现在用ROR评分和免疫簇建立生存模型时,免疫簇的p值显著。通过计算净重分类改善(NRI)和综合判别改善(IDI)指数,强调了免疫簇与ROR评分一起使用时,根据生存率对患者进行分类的额外价值,正如所有队列中NRI和IDI系数为正值所示。NRI和IDI的置信区间(CI)构建的Bootstrapping显示,对于几个队列,免疫簇与ROR评分相加时,显著改善了患者根据预后的分类。
06 - 免疫簇和对新辅助化疗的反应
进一步评估了免疫簇与新辅助化疗反应之间的关系,使用了来自8项研究(1377个样本)的基因表达数据,并使用lasso将每个样本分配给其所属的免疫簇。如图4e,发现簇C应答者百分比最高,其次是簇A,簇B应答者百分比最低。还计算了每个组中应答者的百分比:簇C平均有42%的应答者和58%的残余疾病患者,而簇B有18%/82%的应答者和13%/87%的残余疾病患者。由于pCR率作为ER状态的函数不同,还独立计算了ER阳性和ER阴性病例的应答者比例,发现无论ER状态如何,簇B的应答者比例最低(分别为补充图8A、B)。
对于每个对新辅助化疗有反应的队列,评估了pCR和非pCR病例在各免疫群中的分布。当考虑整个队列时,发现应答者在各免疫群组的分布有显著不同,簇B的应答者较少,簇C组的应答者居多;当按ER状态拆分时,虽然并非总是显著,但也观察到同样的趋势。这些结果表明,簇C中的患者有更高的概率成为应答者。研究结果还突出了簇B的低响应率,表明这类患者可能是新的新辅助治疗方案测试的候选人。
07 - 免疫簇的计算机剖析
为了评估集群中的逐渐免疫浸润是否可以解释与预后的关联,在Cox多变量回归分析中测试了免疫集群或总免疫浸润评分中哪一个对生存更有预测性。作者假设特定的免疫细胞类型混合物,而不是肿瘤微环境中的免疫细胞总数,可能是簇B预后差的原因。
使用CIBERSORT算法估计22种不同的免疫细胞类型的比例,对这种细胞类型特异性中位数浸润分数进行无监督聚类(图5a)。簇C病例中,富集了巨噬细胞M1、记忆激活T细胞和滤泡T辅助细胞(图5a),METABRIC和TCGA队列中CIBERSORT评分的分布也说明了这一点(图5b)。簇A如预期的那样,免疫细胞的水平非常低。在反应和预后较差的簇B中,发现巨噬细胞M2、静止肥大细胞和静止记忆T细胞的水平较高(图5a,图5b)。
使用广义线性模型,指定了区分簇B与簇A-C的免疫细胞类型(图5c)。还测试了哪些免疫细胞类型解释了簇A与簇B之间的差异和簇B与簇C之间的差异。
08 - 免疫簇的表型分析
通过差异基因表达分析确定了簇B中显著过度表达的基因,与簇A和簇C相比,簇B中有909个基因分别上调。这些基因与干细胞生物学和EMT相关,如使用MsigDB31的H和C2集合的基因集富集分析(GSEA)所示(图6a)。
为了进一步描述免疫簇与癌细胞表型之间的关系,使用了与EMT、干细胞、缺氧和增殖相关的基因集。使用GSVA方法计算了每个集群和队列的平均基因集富集分数,该分数反映了免疫集群中每个路径/基因集的活动。平均基因集分数的无监督聚类将免疫簇A和C分开,而簇B被分为两个亚组(图6b)。这些结果表明免疫簇与干细胞/EMT相关基因特征之间存在关联。
通过GSVA富集分数的无监督聚类,确定了乳腺癌中两个相互排斥的基因特征:(i)一个与增殖和胚胎干细胞样表型相关,(ii)另一个与EMT和乳腺干细胞表型相关。增殖表型在簇C中占主导地位(补充图11A),当计算每个代谢样品的基因集得分时也观察到了同样的情况(补充图11B)。在簇B中,EMT或增殖相关特征的平均基因集得分较高(补充图11C)。在代谢物组的样品水平上,我们观察到一个或另一个状态被激活的样品的类似模式(补充图11D)。簇A显示EMT和增殖状态得分较低(补充图11E,F)。
为了正式确定哪些基因集分数解释簇B,使用广义线性模型测试每个基因集的贡献程度。EMT标志对簇B有积极贡献,而增殖和细胞运动性与簇A和C相关(图6c)。还测试了当单独与簇A或簇C比较时,哪种基因集得分可以解释簇B。
09 - 肿瘤表型与免疫浸润的相关性
由于免疫簇与(i)免疫细胞类型和(ii)基因集特征相关,评估了免疫浸润(CIBERSORT)和癌细胞特征(基因集分数)之间的关系。图6d显示增殖和EMT分数与不同类型的免疫细胞显著相关。高EMT分数与巨噬细胞M2、静息肥大细胞和静息记忆T细胞相关,而高增殖与更活跃的适应性肿瘤微环境相关。这些数据表明癌细胞表型和肿瘤微环境的组成之间存在连续性。
簇B以致瘤免疫浸润为主,EMT信号高,但约35%的簇B也表现为增殖表型。为了探索簇B中的这种异质性,以无监督的方式根据基因特征分数将样本分组为B1以EMT表型为主,B2以增殖为主(图6e)。
在METABRIC和TCGA中,具有增殖表型的B2病例的预后较差(图6f,g)。为了进一步评估基因集评分的异质性是否伴随着免疫环境的异质性,作者寻求B1和B2亚群之间特异性免疫细胞类型的差异。补充图14中的无监督聚类显示,两个子聚类B1和B2都具有促肿瘤/静息免疫微环境。总而言之,簇B中两种相互排斥的状态可能与预后有关;然而,簇B的一个统一因素是存在促肿瘤/静息免疫微环境。
四、结论
在本研究中,发现了与临床相关的免疫簇与渐进性免疫浸润。在15个乳腺癌队列中,跨越6101个乳腺癌样本,肿瘤免疫浸润中等水平的患者群预后较差,与已知的预后分子和临床病理学特征无关。通过对群组免疫成分的表征,发现亲肿瘤免疫浸润与不良预后组相关。进一步的表型分析显示乳腺癌中存在两种相互排斥的侵袭性肿瘤表型,一种与EMT有关,另一种与增殖有关。这两种表型都是在不活跃/促肿瘤免疫微环境上发现的不良预后群。