整体思路:细胞相互作用的复杂网络支配免疫系统与肿瘤细胞之间的互动,了解实体瘤的特定免疫细胞组成,对于预测患者对免疫疗法有何反应显得至关重要。在这篇文章中,作者使用肿瘤单细胞RNA测序数据的适应症特异性和细胞类型特异性参考基因表达谱(RGEP),深入分析如何通过数学反卷积从bulk数据中得出实体瘤的细胞组成数据。证明了肿瘤衍生的RGEP对成功的去卷积至关重要,而来自外周血的RGEP则不足。我们区分了9种主要细胞类型以及3种T细胞亚型。使用源自肿瘤的RGEP,我们可以估计许多与肿瘤相关免疫细胞和基质细胞的含量,治疗相关的比例,以及完善的恶性细胞基因表达谱。
使用免疫检查点抑制剂增强患者对癌症的免疫反应可以说是过去十年来治疗癌症最激动人心的进展。不幸的是,只有一部分患者(通常约20%)在检查点抑制后显示出持久的免疫反应。基于预测反应生物标记物(=精密药物)的前瞻性患者选择和免疫治疗相结合,有可能进一步改变患者的治疗方式。迄今为止,已经表明免疫细胞的位置和数量可以预测标准疗法的患者预后。另外,对于像检查点抑制剂这样的抗PD1,抗PDL1和抗CTLA4药物,相关T细胞群的存在与治疗功效相关。因此,预测对免疫疗法反应的关键可能在于肿瘤病变部位的患者特异性免疫细胞组成。
从理论上讲,如果可以为每个肿瘤相关细胞建立参考基因表达谱(RGEP),则可以从其整体基因表达谱推断出实体瘤的免疫,肿瘤和基质细胞含量。从数学上讲,这类反推问题称为反卷积。迄今为止,已经描述并证实了大量基因表达的反卷积用于血液系统恶性肿瘤,其中可以从外周血单核细胞(PBMC)建立RGEP。这种方法在理论上已应用于实体瘤,但直到最近,仍无法通过实验验证这种推断。对于外周血中不存在的细胞类型(例如内皮细胞(EC)和与癌症相关的成纤维细胞(CAF)),很难获得它们的RGEP,而且尚不清楚免疫细胞的基因表达谱在多大程度上改变肿瘤浸润。但是,随着单细胞RNA测序(scRNA-seq)技术的出现,现在可以确定浸润肿瘤的免疫细胞,肿瘤相关的非恶性细胞以及来自同一实体瘤的单个肿瘤细胞的基因表达谱。
我们收集并研究了来自三个不同的主要人类组织来源的11,000多个单细胞的RNA-seq基因表达谱:为了表征与肿瘤微环境相关的细胞,我们获取了19名黑素瘤患者的数据;我们获取来自四个健康受试者的PBMC的数据以表征基线免疫细胞基因表达图谱;最后,我们从四个卵巢癌腹水样本中生成了免疫和肿瘤细胞基因表达谱。在下文中,我们显示了来自肿瘤相关免疫细胞和来自PBMC的基因表达谱有很大不同。因此,从PBMC获得的参考谱不足以使黑素瘤肿瘤样品的总体谱解卷积。我们发现,来自不同患者的适应症特异性免疫细胞RNA-seq谱图彼此足够相似,可以为每种细胞类型定义一个共有谱图,并且这些共有谱图可以对肿瘤bulk谱图进行准确的反卷积。我们的结果表明,特定的RGEP的产生对于从大量基因表达数据中可靠地估算肿瘤成分而言既必要又充分。我们的方法揭示了与肿瘤相关的细胞类型,而这些类型的细胞不能由来自PBMC的RGEPs估计。我们可以识别出九种不同的细胞类型,包括免疫细胞,CAF,EC,卵巢癌细胞和黑色素瘤细胞。此外,用于免疫细胞的RGEP可以用于根据特定的大量基因表达数据来估计肿瘤细胞的未知基因表达谱。我们的工作强调了生成针对每种感兴趣适应症的RGEP的重要性。
结果
肿瘤微环境中细胞的基因表达。
首先,为了研究随着免疫细胞从外周血转移到肿瘤微环境而基因表达谱变化的程度,我们比较了三种人类数据集的免疫细胞scRNA-seq谱图:(1)来自四个健康受试者的外周血4000个单细胞的数据集; (2)来自19个黑色素瘤患者样品的4645个肿瘤来源的单细胞的数据集,以及来自四个卵巢癌腹水样品的3114个单细胞的未公开数据集。单细胞RNA-seq数据需要仔细的数据处理和规范化,尤其是在比较来自不同来源和测序技术的数据时。为了表征单个细胞并说明其基因表达谱中的全基因组相似性和差异性,我们应用了降维技术t分布随机邻居嵌入(t-SNE)。这是一种无监督的机器学习算法,可将每个单细胞置于二维平面中。基因表达谱相似的细胞彼此靠近放置,如果它们之间的差异更大,则相距更远。图1a显示与特定细胞类型相关联且来自不同数据源的簇会自发出现。补充图1中显示了具有特定细胞的颜色编码的t-SNE映射,而不是特定于数据源的聚类。使用汇总的单细胞数据集,我们开发了一种分类方法,该方法可以识别细胞类型,而与数据源无关。我们可以识别和分类9种主要细胞类型:T细胞,B细胞,巨噬细胞/单核细胞,自然杀伤(NK)细胞,树突状细胞(DC),CAF,EC,卵巢癌细胞和黑色素瘤细胞。所有未通过任何特定像元类型的分类阈值的其余像元均被指定为“未知”。有趣的是,“未知”细胞大多位于T细胞簇中,这表明某些T细胞比其他细胞类型的细胞更难分类。但是,每个样本中“未知”细胞的百分比通常非常低(<0.03%)。此外,我们可以将T细胞分为三种亚型:CD4 +,CD8 +和调节性T细胞(Treg)。建议将CD4 +或CD8 + T细胞与免疫抑制性Treg的比例作为免疫活性与非活性肿瘤对抗的标志物。尽管我们的方法可以轻松扩展为包括其他细胞和进一步的细分,但我们将自己限制在九种主要细胞类型中,以对我们的分类算法进行基准测试。如先前报道 并在补充图2中所示,恶性肿瘤细胞和相关的成纤维细胞按患者聚集,非恶性细胞按细胞类型聚集。肿瘤活检应包含来自肿瘤血管和最近渗出的免疫细胞的免疫细胞。因此,预期PBMC和肿瘤相关免疫细胞之间部分重叠。我们分析了每个确定的群集的平均基因表达谱之间的成对相似性。通过单细胞比较,该分析更加定量且更可靠。图1b中显示的结果表明,大多数簇虽然不同,但与来自相同细胞类型的簇最密切相关。这是重要的质量控制步骤,可以确认通过数据处理和标准化策略已成功减轻了潜在的批次影响(请参见“方法”部分)。 Treg在三个不同的数据集上似乎是最不同的,可能表示环境决定性亚群。但是,微环境对基因表达有明显且可量化的影响。在下文中,我们将解决以下问题:基于PBMC的基因表达谱是否与在肿瘤微环境中观察到的结果是否相似;以及PBMC衍生的基因表达谱如何影响bulk表达数据去卷积的质量。
首先,我们观察到每种细胞类型的频率对于每种样品似乎是不同的,如图1c所示。 与跨腹水或黑色素瘤样品的细胞组成相比,来自不同供体的PBMC样品的细胞组成彼此更为相似。 我们基于基于scRNA-seq的分类法对先前预测的所有黑色素瘤样品的结果进行了验证,从而验证了预测的细胞组成。 此外,我们通过荧光激活细胞分选(FACS)实验比较了所有腹水样品的预测细胞组成。 如图2所示,我们的分类与先前发布的结果和我们的FACS测量结果一致。
使用单细胞数据作为反卷积的基准。
免疫细胞的微环境特异性基因表达谱以及给定样品的真实表达图谱可通过scRNA-seq获得,并可作为基准反卷积方法的基础。我们研究了bulk基因表达数据(例如黑色素瘤样品)的去卷积结果如何受微环境特定变化和患者之间差异的影响。作为反卷积的基准,我们通过对27个样本中的每个样本的所有单细胞基因表达数据以及不同组的REGP进行聚合,通过对组织来源和患者进行平均的不同策略,构建了人工“bulk”基因表达数据。我们使用五个不同的RGEP比较给定样品的推断的先验已知细胞组成(参见图3进行说明):首先,RGEP1仅从PBMC数据集导出。因此,在这种情况下将无法获得与肿瘤相关的细胞类型的估计值。第二个是RGEP2,是从三个数据集(PBMC,黑色素瘤和腹水)中每种细胞类型得出的。第三,RGEP3是数据集/指示类型和细胞类型特定的。作为其他基准,我们设置了两个控制方案 (CNTR1和CNTR2),它们是RGEP3的扩展,并包括特定患者的信息。这些场景当然不适用于现实世界,但可用于评估患者特定信息的相对重要性。 CNTR1仅将患者特定的配置文件用于恶性细胞,并将共识配置文件用于每种非恶性细胞类型。 CNTR2对所有细胞类型使用特定于患者的配置文件。原则上,CNTR2作为使用反卷积方法在技术上可行的上限。
为了比较五种可能的RGEP及其对反褶积精度的影响,我们使用CIBERSORT反褶积方法从27个构建的整体表达数据集中估算了细胞组成。该方法旨在对噪声,未知混合物和紧密相关的细胞类型具有更高的鲁棒性。已显示CIBERSORT优于其他基于体外细胞混合物基准测试的方法。 CIBERSORT算法最初是为微阵列数据的反卷积开发的。在这里,我们证明了该算法也可以应用于RNA测序数据,如果使用源自相同技术的RGEP来表征细胞类型,也可以应用该算法。所有反卷积都是使用一组基因进行的,其中包括1076个基因特征,这些基因特征可最大程度地区分各种细胞类型。对于每种细胞类型,将估计比例与27个构建样品中的真实比例进行比较(图4a)。估计细胞组成与真实细胞组成之间的皮尔逊相关系数用作预测准确性的量度(图4b)。通过使用均方根偏差(RMSD)获得定性相似的结果(参见补充图3)。对于T细胞,每个亚群分别进行估算。在图4中,将所有T细胞亚群的估计值相加以获得每个样本的总T细胞比例。单个T细胞子集的结果在图5中单独考虑。总的来说,基于RGEP1的估计(Pearson相关性ρ= 0.82)不如RGEP2和RGEP3或CNTR1和CNTR2的准确度(Pearson相关性ρ≥0.98)。对于RGEP1,由于没有与肿瘤相关的细胞类型的参考资料,未知细胞的真实比例要比其他RGEP大,估计质量中等(皮尔森相关系数ρ= 0.65)。
对于RGEP2和RGEP3,以及对于CNTR1和CNTR2,未知细胞的真实比例很小,可以忽略不计。如果细胞的真实比例很小,则相关性不是判断准确性的好方法。对于RGEP1,对于T细胞(皮尔森相关度ρ= 0.88,此处未区分为亚型),B细胞(皮尔森相关度ρ= 0.99)和巨噬细胞/单核细胞(皮尔森相关度ρ= 0.99),估计效果良好。但是,在所有其他设置下(皮尔逊相关系数ρ≥0.99),精度会进一步提高。对于RGEP1,对DC的估计(皮尔森相关度ρ= -0.04)较差,而对NK细胞的估计中等(皮尔森相关度ρ= 0.78)。对于RGEP2(皮尔森相关系数ρ= 0.82)和RGEP3(皮尔森相关系数ρ= 0.95),DC的估计有了很大的提高。 DC的估计值对于CNTR1仍略有改善(Pearson相关性ρ= 0.97),但仅在CNTR2时才达到最大值(Pearson相关性ρ= 1.00),这表明DCs的基因表达在很大程度上取决于分离的来源,这是一致的有证据表明DC的不同亚群在免疫力的产生中高度特异化。相对于CNTR1(皮尔森相关度ρ= 0.96)和CNTR2(皮尔森相关度ρ= 1.00),RGEP2(皮尔逊相关度ρ= 0.82)对NK细胞的估计略有改善,并且在RGEP3(皮尔逊相关度ρ= 0.95)中接近最佳状态。对于RGEP2至CNTR2,可获得与肿瘤相关的细胞类型(CAF,EC和恶性细胞)的估计值,并且可以对其进行准确估计(Pearson相关性ρ≥0.95)。有趣的是,在纳入患者特定信息后,对恶性细胞的估计并没有太大改善,这表明使用共识谱进行反卷积是可行的。这可能因为肿瘤细胞通常与非恶性细胞有很大的不同,非恶性细胞使它们的去卷积更容易(见图1b)。对于CNTR2,与其他设置(Pearson相关性ρ〜0.95)相比,ECs和CAF的准确性更高(Pearson相关性ρ= 1.00),这表明这些细胞类型的基因表达受患者特定的微环境影响。有趣的是,当考虑到二等分的距离(如图4所示)作为估计精度的度量时,我们发现它与真实的细胞类型比例无关。但是,每种细胞类型的总体精度都不同。
考虑到T细胞比率对治疗结果的重要性,我们进一步分析了T细胞亚群以及治疗相关T细胞比率的估计准确性(图5)。出乎意料的是,对于CD8 + T细胞,所有RGEP的估算结果都是准确的(皮尔森相关ρ〜0.95)。对于CD4 +细胞和调节性T细胞,使用RGEP1的估计结果仅中等(皮尔逊相关系数ρ= 0.63和ρ= 0.43),而对于RGEP2则明显改善(皮尔逊相关系数ρ= 0.87和ρ= 0.94)。这也反映在达到RGEP2准确估计值的Treg / CD4 +,CD8 + / Treg和CD4 + / CD8 + T细胞的比率(皮尔森相关系数ρ= 0.94,ρ= 0.96和ρ= 0.93)。对于CNTR1,所有T细胞亚群和比率的估计值均不会显着改善,而对于CNTR2,它却会有所改善(皮尔森相关系数ρ= 1.00),这表明T细胞的基因表达受患者特定的微环境影响。总而言之,使用基于适应症特异性基因表达谱(RGEP3)的共有基因表达谱进行反卷积足以获得样品细胞组成的可靠估计值,而无需有关各个细胞类型的患者特异性数据。使用基于外周血数据(RGEP1)或基于所有三个数据集/指标的平均值(RGEP2)的基因表达谱进行反卷积的准确性大大降低。当考虑到两等分的距离(如图5所示)作为估计准确度的一种度量时,我们发现对调节性T细胞的估计过高。调节性T细胞的估计与表达形式相似的非调节性CD4 + T细胞的估计混淆。由于非调节性CD4 + T细胞的总百分比高于调节性T细胞的百分比,因此对非调节性CD4 + T细胞存在相应的低估,这种估计并没有那么明显。尽管这些T细胞亚型存在这种偏见,但临床上相关T细胞比例的估算并没有受到影响。
为了探索相似细胞类型表达谱或缺失细胞类型谱对估计准确性的影响,我们系统地评估了一次从RGEP3中删除一个细胞类型表达谱的情况(补充图4)。对于大多数情况和细胞类型,估计精度不受其他细胞类型表达谱删除的影响。 CD4 + T细胞,巨噬细胞/单核细胞和恶性细胞类型的估计准确性对所有变化都具有鲁棒性。我们观察到一些更紧密相关的细胞类型的估计准确性降低。去除CD4 + T细胞会影响CD8 + T细胞估计的准确性,同时去除CD8 +或CD4 + T细胞会影响调节性T细胞的估计准确性。去除巨噬细胞/单核细胞会影响B细胞的准确性。去除B细胞或巨噬细胞/单核细胞会影响树突状细胞的准确性。 NK细胞的准确性受去除CD8 +或CD4 + T细胞的影响。去除黑素瘤细胞谱会影响内皮细胞和CAF的准确性。为了确定使用替代基因集进行反卷积的影响,我们使用性能最佳的RGEP3和四个其他基因集以及三种替代反卷积算法重复了分析。有趣的是,与RGEPs的来源和质量的影响相比,不同基因集和反卷积算法的影响相对较小(参见补充图5)。 CIBERSORT与合并的基因组结合提供了最佳的总体结果。
使用独立数据验证反卷积结果。
使用源自单细胞RNA测序数据的RGEP,我们确定RGEP的来源和质量会影响反卷积方法的准确性。因此,我们建议将源自感兴趣组织的单细胞RNA测序数据衍生的RGEP用于bulk反卷积。但是,将通过常规卷积RNA测序获得应用去卷积方法的临床数据。因此,重要的是证明源自单细胞RNA测序的RGEP适用于通过bulk RNA测序测量的数据。为了验证实际(而非人工)批量数据上的去卷积结果,我们另外对四个卵巢癌腹水样品中的三个进行了批量RNA测序,并使用RGEP3应用了去卷积方法来获得样品细胞组成的估计值。此外,使用相同的三个样品,我们通过FACS和单细胞RNA测序,然后进行算法细胞类型分类,对实验中的细胞组成进行了定量。图6a显示了这三个样品的数据生成示意图,图6b显示了对通过三种不同方法获得的结果的定量比较(有关详细信息,另请参见补充表1和2)。总体而言,结果吻合良好。由于所有这三种方法均具有固有偏差,因此它们仅提供了样品细胞组成的估计值。偏差是可以预料的,并且可能源于样品处理的差异,这些差异会给较脆弱的免疫细胞带来压力。在我们的验证数据中,当通过FACS定量时,我们始终观察到对巨噬细胞/单核细胞群体的估计减少。基于单细胞的分类一致地估计了该样品集中巨噬细胞/单核细胞的最高比例。类似地,解卷积方法始终估计较低比例的CD4 + T细胞,并且类似地针对低丰度树突状细胞和NK细胞群体。
估计肿瘤细胞基因表达谱。
尽管使用RGEP3是适应症特异性的,但不是患者特异性的,可以从大量基因表达数据中准确估计任何给定患者活检的细胞组成,但不同患者之间恶性细胞的基因表达谱差异最大。肿瘤细胞中基因表达的差异有望在预测对传统疗法(包括靶向疗法和化学疗法)的反应中发挥关键作用。这样,在解卷积之后估计患者特异性肿瘤细胞谱也是感兴趣的。如果对于每种非恶性细胞类型和适应症均存在共有的表达谱,则可以通过简单地从总体概况中减去每种非恶性细胞类型的概况并按其推断的比例加权来获得患者特异性肿瘤细胞概况。然而,实际上,总体概况将始终被不存在共有概况的细胞(“未知”细胞)“污染”。例如,嗜中性粒细胞未在scRNA-seq数据中显示,因为它们难以分离,离体后高度不稳定,因此难以用当前的单细胞分离方法保存。使用scRNA-seq数据,我们计算了每个患者样品的估计肿瘤细胞表达谱,并将它们与真实肿瘤细胞谱进行了比较(图7a)。由于某些基因(例如管家基因)在所有细胞之间相关,而与细胞类型无关,因此,预期会有一定的基线相关性。我们通过将非恶性细胞的基因表达谱与真实的肿瘤细胞基因表达谱相关联来估计该基线相关性。我们观察到所有样本的基线皮尔逊相关系数ρ为0.7–0.8,而与样本中肿瘤细胞的估计比例无关。如所预期的,随着肿瘤细胞含量的增加,肿瘤细胞表达的估计准确性得以提高(图7b)。值得注意的是,当样品中肿瘤细胞的估计比例超过20%时,估计的肿瘤细胞基因表达谱与真实谱显示ρ> 0.9的皮尔逊相关性。与未经校正的整体基因表达谱相比,肿瘤细胞多于20%但少于70%的样品中预测的肿瘤细胞基因表达谱与真实的肿瘤细胞基因表达谱具有更好的相关性。如果样品包含超过70%的肿瘤细胞,则整个样品的基因表达谱已经被肿瘤细胞所主导,并且不需要任何减法。对于肿瘤细胞少于20%的样品,减法不能改善估计,因为肿瘤细胞基因表达的信号很低。另外,整个样品的基因表达图谱也没有提供关于阴性对照的肿瘤细胞谱图的信息,在这种情况下是非肿瘤谱图。总之,对于肿瘤细胞含量在20%至70%之间的解卷积的样品,其基因表达谱得到了显着改善。