单细胞测序文献精读10 | 单细胞测序揭示肝细胞癌免疫细胞图谱及其动态特征

单细胞测序揭示肝细胞癌免疫细胞图谱及其动态特征

要点

1、两个scRNA-seq平台揭示了肝癌的高分辨率动态免疫景观

2、cDCs产生的d-LAMP3+DCs可以从肿瘤转移到肝淋巴结

3、对配体受体分析提示LAMP3+DCs对淋巴细胞的调节作用

4、肿瘤中的巨噬细胞亚群呈现不同的状态腹水排出的可能性

简言之

集成的单细胞RNA测序技术和生物信息学方法揭示了肝细胞癌的高分辨率免疫景观,识别了髓细胞的炎症特征和功能状态,并预测了复杂的细胞-细胞相互作用。


摘要

肝细胞癌(HCC)的免疫微环境特征较差。结合两种单细胞RNA分离技术,作者从五个免疫相关位点:肿瘤、邻近肝脏、肝淋巴结(LN)、血液和坐骨神经,分析了肝癌患者CD45+免疫细胞转录体。LAMP3+树突状细胞(dendritic cells,DCs)簇是常规树突状细胞的成熟形式,具有从肿瘤向淋巴结迁移的潜能。LAMP3+DCs还表达多种免疫相关配体,并具有调节多种淋巴细胞亚型的潜能。在具有不同转录状态的肿瘤巨噬细胞中,肿瘤相关巨噬细胞(TAMs)与预后不良相关,作者发现了SLC40A1和GPNMB在这些细胞中的炎症作用。此外,腹水中的骨髓细胞和淋巴细胞分别主要与肿瘤和血液来源有关。本研究所揭示的不同CD45+细胞类型的动态特征为HCC的免疫景观增添了新的维度。


导言

肝癌是世界上第三大肿瘤相关的死亡原因,肝细胞癌(HCC)约占所有肝癌发病率的90%。尽管用索拉非尼和雷戈拉非尼治疗能带来一定的生存效益,但总体抗肿瘤反应仍然有限。尽管免疫疗法对其他肿瘤适应症有临床益处,但肝癌的应答率要低得多。由于免疫环境的参数与治疗效果相关,因此,与其他免疫相关解剖分区的免疫细胞相比,确定肝癌免疫环境特征的基线对于阐明肿瘤浸润免疫细胞的组成和性质非常重要。

肿瘤微环境(TME)的细胞成分高度复杂,不同数量的髓细胞和淋巴细胞在炎症、肿瘤免疫逃避和免疫治疗反应中发挥重要作用。TME中骨髓细胞的存在通常与患者生存率的改变有关。据报道,肿瘤相关巨噬细胞(TAM)可阻止T细胞识别和杀伤肿瘤细胞。据报道,在小鼠模型中,传统树突状细胞(DC)亚群(cDC1和cDC2)迁移到肿瘤引流淋巴结和原始CD8+或CD4+T细胞。然而,肝细胞癌患者TAM和DC亚群的特征和功能尚不清楚。作者之前已经通过单细胞RNA测序(scRNA-seq)对肝癌中的T细胞进行了表征,但总体免疫图谱仍然未知。最近,表征免疫细胞TME的细胞亚群的研究已经出现,包括大规模细胞术研究和关于黑色素瘤、非小细胞肺癌、乳腺癌、头颈癌、结直肠癌和肾癌的scRNA seq研究,为此类肝癌研究铺平了道路。

上述研究中的scRNA-seq技术基于SMART-seq2或droplet-based平台。SMART-seq2为数量较少的细胞提供深度覆盖,而droplet-based平台捕获更大规模的细胞,但牺牲了有限的基因覆盖。因此,对这两种技术的综合分析可能是实现对广阔景观的深入理解的首选方法。

补充:

scRNA-seq技术到目前为止有一百多个,但主流的可以大致分为以下几种:

  • Droplet-based: 10X Genomics, inDrop, Drop-seq

  • Plate-based with unique molecular identifiers (UMIs): CEL-seq, MARS-seq

  • Plate-based with reads: Smart-seq2

  • Other: sci-RNA-seq, Seq-Well

单细胞测序转录组技术主要分为2种:

1、基于孔板式(well-based)的人工捕获单细胞从而建库,

2、基于微流控技术(droplet-based)捕获单细胞。孔板式方法通量低,但测序质量相对较好,基于微流控技术捕获细胞牺牲了测序质量,但通量惊人,1次可捕获数千个单细胞。

微滴技术 是将单个细胞包裹在µl级别的液滴中,液滴被搭载到建库所用的酶上,每个微滴包含一个独特的条码(barcode),由那个被包装好的细胞产生的所有reads都被贴上了该条码,也是为了之后对于不同细胞reads的分辨。一般微滴技术的通量最大,查资料得知一秒能包装7万个以上的液滴,并且建库费用合适--0.05美元/细胞。但是高额测序费用又成了他的短板,鉴定出的一般只有一千多个差异转录本,覆盖度还是比较低的

单细胞定量
包括两种类型:全长以及基于标签(tag)。前者对每个转录本都试图获得一致的read覆盖度,后者只捕获5‘或者3’端的RNA。定量方法的选择也影响了后续分析的方法选择。理论上,全长的方法应该得到转录本的平均覆盖度,但是实际上,覆盖度经常是有偏差的。基于标签的方法能够利用特异性分子标记(Unique Molecular Identifiers, UMIs)提高定量准确度,但是呢,这种限制了转录组一端的方法有降低了转录本的可拼接性,让以后的isoform识别变得困难。

SMART-seq2是3’scRNA-Seq,10×是进行全长测序。

在这里,作者结合全长和3’ scRNA-seq技术,从肝癌患者的各种组织中获得大量CD45+免疫细胞的高质量数据。首次对肝癌、癌旁肝、肝淋巴结、腹水和血液中免疫细胞的组成、功能状态、发育轨迹和细胞间相互作用进行了系统的研究和比较。特别地,先前未被分类的肝LNs和腹水被包括在内以分析HCC中免疫细胞的动力学。腹腔积液过多称为腹水,与肝癌预后不良相关,但腹水在形成肿瘤免疫环境中的作用尚不清楚。两种scRNA-seq技术的结合,同时包括LNs和腹水的测序,使作者不仅可以高分辨率地表征HCC的免疫组分,而且可以追踪其动态变化。


结果

综合分析全长和3’ scRNA-Seq构建高分辨率的肝癌免疫图谱

为了鉴定HCC中的免疫细胞,作者应用scRNA-Seq方法研究了16例初治的肝癌患者的肿瘤和4个免疫相关部位(邻近肝脏、肝LNs、血液和腹水)中分离的CD45+细胞(图S1A-S1C;表S1和S2)。

图S1(A):总体研究设计方案。将两种技术(基于液滴的10x基因组学和基于平板的SMART-seq2)应用于来源于血液、肿瘤、邻近肝组织、LN和腹水的CD45+细胞和T细胞亚群,并将两种技术的输出数据进行整合和组合,用于下游分析。*,数据已在作者之前的研究中发表(Zheng et al., 2017a)。

图S1(B): CD45+细胞分选的FACS门控策略。对于10×的scRNA-seq,作者基于CD45抗体收集细胞(上排)。对于SMART-seq2的scRNA-seq,作者根据CD45、CD3抗体和细胞大小信息(最下面一行)收集细胞。

图S1(C):T细胞亚群分类的FACS门控策略。

对于DSN09患者,10x基因组学和SMART-seq2方法同时应用,使作者有机会评估两类数据集综合分析的能力。使用基于图形的聚类来分析该患者的细胞,作者确定了20个10×数据的聚类和22个SMART-seq2的聚类(图1A)。

图1A:来自患者DSN09的基于SMART-seq2的(左)和基于10x的(右)单个CD45+细胞的统一流形近似和投影(UMAP)。红线表示10x特异簇,蓝色表示SMART-seq2特异簇。

补充:均匀流形近似和投影(UMAP/uniform manifold approximation and projection)一种类似于t-SNE的数据降维算法。

通过数据降维和可视化展示可以看出,PCA分群效果最差,UMAP和t-SNE都成功将与相似细胞群相对应的簇聚集在一起。但是与t-SNE相比,UMAP还提供了有用的和直观的特性、保留了更多的全局结构,特别是细胞子集的连续性。

对典型标记基因的检测显示了两个平台上的主要细胞群,包括T细胞、自然杀伤细胞(NK)和多种髓系细胞(图S1D和S1E),证明了作者数据的稳定性和准确性。

图S1D:基于SMART-seq2数据显示DSN09患者细胞类型注释的典型标记基因表达。

图S1E:基于10x数据显示DSN09患者细胞类型注释的典型标记基因表达。

不过,这两个平台之间的少数细胞数量有所不同。例如,LAMP3+DC、CD14+和FCGR3A+单核细胞组仅在SMART-seq2中被识别,而3型固有淋巴细胞(ILC)仅被10x捕获(图1A)。此外,作者观察到SMART-seq2有助于区分密切相关的簇,可能是通过捕获更多有助于细胞类型分类的RNA分子。例如,CD4+和CD8+T细胞亚型(CD8+PDCD1+、CD8+GZMK+、CD8+CX3CR1+簇)易于分离。相比之下,基于10x的 T细胞簇由CD4+和CD8+T细胞的混合物组成,与SMART-seq2定义的同时存在的相似性也证明了这一点(图S2A)。

图S2A:热图显示了独立集群中SMART-seq2和10x数据(上)以及联合集群中SMART-seq2和10x数据的Jaccard相似性。
用500个细胞类型特异性标记计算Jaccard相似性。

补充:Jaccard 系数,又叫Jaccard相似性系数,用来比较样本集中的相似性和分散性的一个概率。Jaccard系数等于样本集交集与样本集合集的比值,即J=|A∩B|/|A∪B|

然后,作者使用Harmony算法整合了这两类数据集。

补充:
Harmony算法:整合单细胞RNAseq数据进行批校正和后续分析。

在组合的数据集上,总共识别出37个集群,其中36个包含10x和SMART-seq2两个数据集的单元格,这表明数据集的集成度良好(图2B)。

图2B:条形图显示腹水中淋巴细胞和髓细胞的细胞比例,这些细胞与不同的组织对齐。***p<0.001,Wilcoxon试验。

第16、29、33、34、35和36个细胞簇以10x为主,每个细胞簇包含来自SMART-seq2的细胞少于10个(图S2B),表明这种罕见的细胞簇被10x“拯救”。

图S2B:显示联合集群中SMART-seq2和10x集群分布的条形图。红线代表10x特定集群,蓝线代表smart-seq2特定集群。

另一方面,最初在10x细胞簇的CLEC9A+DCs中的129个细胞在整合后被重新分配给LAMP3+DCs,由其基因表达证实(图S2C),这表明通过整合可以对单独在任一平台上被掩盖的稀有细胞群体进行鉴定。

图S2C:整合簇的LAMP3表达。

作者还观察到,在结合SMARTseq2数据后,10x集群中CD4+/CD8+T细胞的初始混合物随后被分离(图S2B)。
然后作者检测了基因检测的敏感性。在聚类水平上,SMART-seq2检测到的基因数(读数≥1)总是大于10x,几乎覆盖了10x检测到的所有基因(图S2D)。

图S2D:显示每个簇中检测到的基因数的条形图。

饱和分析显示SMART-seq2检测到的基因数在所有组织中都比10×高。SMART-seq2对20个细胞的基因捕获率与10×对1000个细胞的捕获率类似(图1C)。

图1C:饱和曲线显示10x(顶部)或SMART-seq2(底部)检测到的基因数。每个点根据平台着色,表示在给定细胞数(x轴)中检测到的基因数(y轴)。

SMART-seq2检测免疫相关基因的频率也高于10x,以LAMP3+DCs为例(p<2e-16,Wilcoxon试验)(图1D)。

图1D:箱式图显示在LAMP3+DC的特定基因类别中检测到的基因数。每个点代表一个单细胞。p<2e-16,Wilcoxon检验。

对于所有细胞簇,SMART-seq2产生的差异表达基因比10×多。例如,15个SMART-seq2 LAMP3+DCs中检测到的差异表达基因数量(LAMP3+DCs与其他簇相比)比129个10×的细胞高出29倍(图1E)。

图1E:点图显示10x和SMART-seq2检测到的LAMP3+DCs差异表达基因(LAMP3+DCs与其他基因比较,假阳性率[FDR]<0.01,log2(fold change[FC])>0.5)的比较。x轴和y轴分别显示SMART-seq2和10x中检测基因的log2(FC)。

值得注意的是,与DC发育相关的转录因子(TFs),包括ZBTB46,仅由SMART-seq2检测到(图1E)。这些基因也导致了额外的GO富集。平均而言,SMART-seq2得到了45个显著的GO项,而10×得到了17个显著的GO项(p=1.12e-7,Wilcoxon试验(图S2E)。

图S2E:分别由10x和SMART-seq2数据的差异表达基因产生的GO(生物学过程)组号。

补充:
基因本体(Gene Ontology,GO)是一个在生物信息学领域中广泛使用的本体。它主要包括三个分支: 生物过程、分子功能和细胞组件。GO的目的:类似于语义网络。是为了生物界有一个统一的数据交流语言。GO是用一套统一的词汇表来描述生物学中的分子功能、生物过程和细胞成分。

其思想大概过程:对于一个基因产品(蛋白质或RNA),用某些词汇来描述它是干什么的或位于细胞哪里、或者参与了哪个生物过程,而这些词汇就是来自GO的Term。

在基因表达谱分析中,GO常用于提供基因功能分类标签和基因功能研究的背景知识。利用GO的知识体系和结构特点,旨在发掘与基因差异表达现象关联的单个特征基因功能类或多个特征功能类的组合。

具体来说,对于LAMP3+DCs,除了两个平台支持的生物过程外,SMART-seq2特异基因还揭示了“细胞间信号传导”和“细胞迁移调节”的富集,提供了对其潜在功能的了解(图1F)。

图1F:在(E)中产生的SMART-seq2-和10x特异基因的富集GO项。

综上所述,作者得出结论,在广泛使用的基于10x的scRNA-seq研究中加入SMART-seq2对以更高分辨率识别免疫细胞类型具有协同作用。
然后,作者整合所有患者的数据,包括由10x产生的66187个细胞和由SMART-seq2产生的11134个细胞,并进行进一步分析(图1G)。

图1G:UMAP投影显示肝癌的免疫景观,由簇(左)和组织(右)着色。

聚类分析揭示了肝癌中的主要免疫细胞类型,包括T细胞、NK细胞、髓细胞、B细胞、血浆B细胞和ILCs(图S3A和S3B)。

图S3A:基于SMART-seq2数据的细胞类型标注典型标记基因的表达。

图S3B:基于10x数据的细胞类型标注典型标记基因的表达。

通过第二轮聚类分析进一步划分T细胞、NK细胞和髓细胞,分别得到14、9和14个簇(图S3D、S4A和S4E)。

图S3D:基于SMART-seq2数据的T细胞UMAP投影。每个点代表一个单独的细胞。

图S4A:NK细胞的UMAP投影,显示9个亚簇的形成。每个点代表一个单独的细胞,根据细胞簇号着色。

图S4E:髓样细胞簇的UMAP投影,显示14个簇的形成。每个点代表一个单独的细胞,根据细胞簇号着色。

免疫细胞类型表现出不同的组织偏好。作者使用10×数据根据每个簇中观察到的细胞数量与预期细胞数量的比率(Ro/e)来量化组织富集(图1H和表S3)。

图1H:基于10x数据的Ro/e估计每个簇的组织偏好。

在T细胞中,CD4-c6-FOXP3和CD8-c7-PDCD1分别对应于调节性T(Treg)细胞和耗竭性CD8+T(Tex)细胞,在肿瘤中富集,与先前的发现一致。CD8-c1-MKI67,代表增殖性T细胞,也在肿瘤中富集(图1H)。利用RNA速度,一种推断前兆细胞动力学的方法,作者观察到从增殖性T细胞到Tex细胞的清晰定向流动(图S3E),这与最近对黑色素瘤的研究一致,表明CD8+T细胞的增殖在功能障碍早期最为重要。

图S3E:在CD8-c1-MKI67和CD8-c7-PDCD1群体的UMAP投影上可以观察到RNA的速度,并根据簇染色。

补充:RNA velocity,直译为RNA速度,是一个转录本动态变化的指标,能预测细胞未来的状态变化。可以用于细胞分化、谱系发育、肿瘤微环境中细胞成分的动态变化等研究。

在自体邻近肝脏和“健康肝脏”对照组中,肿瘤富集群体(如Treg细胞,CD4-c6-FOXP3)始终较低(图S3C)。

图S3C:条形图显示了不同组织的富集人群,以“健康肝脏”作为对照组(P1TLH、P4TLH和P5TLH)。

对于NK细胞簇,NK-c3-IFNG、NK-c4-IFNG-HSPA1A、NK-c7-CD160和NK-c8-CD160-HSPA1A与其他组织相比在肿瘤中富集(图1H)。其中,IFNG+NK细胞高表达循环NK(cNK)细胞标记FCGR3A、CX3CR1和转录因子T-bet(TBX21),而CD160+NK细胞高表达肝驻留NK(lrNK)细胞标记CXCR6和转录因子EOMES(图S4B-S4D),提示HCC中cNK细胞和lrNK细胞同时存在。

图S4B:UMAP图显示NK细胞群(GZMK、GZMA、IFNG和TNF)中细胞毒性基因的表达。

图S4C:循环NK细胞(NK-c3-IFNG和NK-c4-IFNG-HSPA1A)和肝内NK细胞(NK-c7-CD160和NK-c8CD160-HSPA1A)间差异表达基因。红点为差异显著基因(log2(FC)>1,FDR<0.01)。

图S4D:cNK和lrNK簇中标记基因表达的箱式图。

对于髓样细胞,分别鉴定出单核细胞、树突状细胞、巨噬细胞和肥大细胞的2、4、6和2个簇(图S4E和S4F)。

图S4F:UMAP图显示了髓细胞群中特征基因的表达。

Mφ-c5-VCAN、Mφ-c6-MARCO和DC-c2-FCER1A主要在腹水中富集(图1H)。综上所述,通过对10x和SMART-seq2数据的联合分析,作者确定了肝癌不同组织中具有不同分布模式的多个免疫细胞群。

腹水中的淋巴细胞和髓细胞似乎有不同的来源
作者以腹水中的免疫细胞来自其他组织为前提,通过与其他组织中细胞表达比对来研究腹水中细胞的潜在来源。作者观察到淋巴细胞明显类似于血液中的细胞,而髓细胞主要与肿瘤细胞相似(图2A)。

图2A:基于表达相似性分析的Circos图显示腹水细胞与其他组织细胞的匹配比例。

总的来说,50.2%(3314/6603)、24.9%(1641/6603)和20.8%(1375/6603)的淋巴细胞分别被分配到血液、肿瘤和邻近肝脏的细胞中,而髓细胞(79.5%;2613/3286)主要被分配到肿瘤中发现的细胞中(图2B)。

图2B:条形图显示腹水中淋巴细胞和髓细胞的细胞比例,这些细胞与不同的组织对应。***p<0.001,Wilcoxon试验。

尤其是腹水富集的Mφ-c5-VCAN簇(p=0.046,Fisher精确检验)和Mφ-c6-MARCO簇(p<0.001)主要定位于肿瘤细胞。两个淋巴细胞亚群NK-c9-MKI67(p<0.001)和CD8-c1-MKI67(p<0.001)在肿瘤中也有最相似的细胞(图2C)。

图2C:条形图显示腹水中与不同组织中淋巴细胞和髓细胞亚群的细胞分数。***p<0.001,Wilcoxon试验。

然后作者进行反向分析,以确定肿瘤中哪些细胞类型有在腹水中积聚的趋势。根据肿瘤细胞是否能在腹水中找到最佳匹配,将单个细胞标记为腹水-相似或腹水-远处的细胞。在髓系细胞亚群中,Mφ-c1-THBS1(p<0.001,比值比=0.63,Fisher精确检验)在腹水中的积聚程度最高,而Mφ-C2-APOE(应该是Mφ-C2-C1QA,估计是文章里标错了)(p<0.001,比值比=0.38)在肿瘤中趋于持久(图2D)。

图2D:基于腹水-相似和腹水-远处肿瘤富集细胞簇的优势比和p值。p<0.05,p<0.01,*p<0.001,Fisher’s exact检验。

对于淋巴细胞亚群,表达细胞毒性基因(GZMK、GZMA、IFNG和TNF)的CD8-c1-MKI67在腹水中有更高的积聚趋势(p<0.001,比值比=4.63)(图2D)。作者在CD8-c1-MKI67中发现克隆性T细胞,共享相同的T细胞受体(TCR)α-β对,跨越腹水和肿瘤(图S4G),支持它们在肿瘤和腹水之间的迁移过程。

图S4G:肿瘤或邻近肝组织中的细胞簇与腹水细胞之间的TCR共享。行表示不同的克隆类型,列表示不同的细胞簇或组织。

然后,作者使用scRNA-seq数据进行基于线粒体突变的谱系追踪。这个MKI67+T细胞的系统发育树也显示了肿瘤和腹水中具有共同谱系的细胞(图S4H)。

图S4H:线粒体突变构建的腹水和肿瘤增殖性T细胞系统发育树的分支。维恩图显示了稳定线的数量(Bootstrap>30)。

补充:

进化树由结点(node)和进化分支(branch)组成,每一结点表示一个分类学单元(属、种群、个体等),进化分支定义了分类单元(祖先与后代)之间的关系,一个分支只能连接两个相邻的结点。进化树分支的图像称为进化的拓扑结构,其中分支长度表示该分枝进化过程中变化的程度,标有分枝长度的进化分支叫标度枝(scaled branch)。

系统发育树中的Bootstrap值,即自展值,可用来检验所计算的进化树分支可信度。Bootstrap几乎是构建系统进化树一个必须的选项。一般Bootstrap的值>70%,则认为构建的进化树较为可靠。如果Bootstrap的值太低,则有可能进化树的拓扑结构有错误,进化树是不可靠的。

Bootstrap值是指根据所选的统计计算模型,设定初始值1000次,就是把序列的位点都重排,重排后的序列再用相同的办法构树,如此让模型计算并绘制1000株系统发育树,这是命令阶段产生的。如果原来树的分枝在重排后构的树中也出现了,就给这个分枝打上1分,如果没出现就给0分,这样给进化树打分后,每个分枝就都得出分值。系统发育树中每个节点上的数字则代表在命令阶段要求的1000次进化树分析中,有多少次。重排的序列有很多组合,值越小说明分枝的可信度越低,最好根据数据的情况选用不同的构树方法和模型。

相反,Treg细胞(p<0.001,比值比=0.47)和CD4-c5-CXCL13(p<0.001,比值比=0.35)是腹水-远处的聚类,更可能在肿瘤中持续存在(图2D)。研究肿瘤是否会选择性地保留功能失调的T细胞,同时将增殖细胞转移到腹水是一件有趣的事情。
作者接下来研究了腹水和其他组织中巨噬细胞的关系。基于线粒体突变的系统发育树揭示了肿瘤和腹水中的许多巨噬细胞具有共同的谱系(图2E)。

图2E:线粒体突变构建的巨噬细胞在不同组织中的系统发育树分支。维恩图显示了几个稳定谱系(bootstrap>30)。

此外,RNA速度分析显示,肿瘤富集的Mφ-c1-THBS1表现出向腹水富集的Mφ-c5-VCAN谱系定位(图2F)。

图2F:基于分区的图抽象(PAGA)投影的RNA速度,显示了Mφ-c1-THBS1到Mφ-c5-VCAN的转换潜能。

接下来,作者从另外四个肝癌患者的不同组织中分离巨噬细胞,用自体腹水上清液孵育,并分析其转录体。这种孵育并没有增强与腹水巨噬细胞的相似性(图S5A)。

图S5A:条形图显示自体腹水上清液体外刺激不同组织巨噬细胞与腹水巨噬细胞表达的相似性(用Spearman相关法测定)。

总之,作者的数据支持腹水中淋巴细胞和巨噬细胞的特定亚群可能起源于肿瘤。

肿瘤富集巨噬细胞的两种不同状态
在作者的数据集中发现了6个巨噬细胞簇,其中Mφ-c1-THBS1和Mφ-c2-C1QA在基于Ro/e的肿瘤组织中富集(图1H)。Mφ-c1-THBS1中上调的基因与骨髓源性抑制细胞(MDSCs)的特征相似,Mφ-c2-C1QA中的上调基因也同时类似于TAMs和M1、M2巨噬细胞的特征(图3B)。

图3B:肝癌中经典细胞亚型M1、M2、MDSCs和TAMs中的基因富集与巨噬细胞亚群的比较。气泡大小表示基于y轴上的基因特征的簇的上调和下调基因的比例。圆圈的颜色表示FDR方向。红色,在特定细胞亚群中富集上调基因;蓝色,缺失下调基因。

M1和M2信号的共存表明,TAMs比经典的M1/M2模型更复杂,这与之前的研究一致。它们的全局转录体的扩散图显示Mφ-c1-THBS1(类MDSC巨噬细胞)和Mφ-c2-C1QA(类TAM巨噬细胞)形成一个连续体,但具有明显的表达特征(图3D)。

图3D:扩散图显示两个巨噬细胞状态(左)的连续连接和基于10x(右)的特征基因表达。

特别地,MDSC样细胞高度表达S100A家族基因FCN1和VCAN,而它们表达低水平的HLA相关基因(图3A)。

图3A:巨噬细胞簇特征基因表达的热图。行表示特征基因。列表示单个细胞。

相反,TAM样细胞表达了一组以前在肺癌TAMs中发现的基因,包括APOE、C1QA、C1QB和TREM2。此外,两个额外的基因,SLC40A1,编码铁蛋白,GPNMB,编码I型跨膜糖蛋白,在TAM样细胞中高度表达(图3A)。这两个簇的转录因子是不同的,ID3、MITF、RUNX2和MAF优先在类TAM细胞中表达,BCL3、NR4A1、RXRA和TCF25在类MDSC细胞中高表达(图3C)。

图3C:基于SMART-seq2 (Wilcoxon test)发现的两个细胞簇中TFs的差异表达。

作者进一步对肝癌患者的肿瘤切片进行了多色免疫组织化学(IHC)染色。在CD68+巨噬细胞中,在不同细胞上检测到S100A8和SLC40A1互斥信号(图3E),支持HCC中存在两种不同的巨噬细胞状态。

图3E:多色IHC染色证实两种巨噬细胞状态,以DSN09患者为例。虚圆表示单元格边缘。刻度杆显示20毫米。

然后作者研究了巨噬细胞状态的基因特征与肿瘤基因组图谱(TCGA)肝细胞癌(LIHC)预后的关系。只有TAM样特征与预后不良相关(p=0.01,Cox回归)。两个TAM样特征基因SLC40A1和GPNMB也与预后不良相关(分别为p=0.033和0.006)(图3F)。

图3F:TCGA-LIHC数据的总生存曲线(Cox回归)。

为了研究这两个基因的功能,作者使用CRISPR-Cas9系统敲除THP-1单核细胞源性巨噬细胞中的SLC40A1或GPNMB,并通过流式细胞术(荧光活化细胞分类[FACS])确认基因敲除效率(图S5B)。

图S5B:FACS分析显示THP-1细胞中SLC40A1、GPNMB和VEGFA三个基因的敲除效率。

作者用脂多糖(LPS)+干扰素γ(IFNγ)或Pam3CSK4刺激未经编辑的对照、SLC40A1基因敲除(KO)、GPNMB-KO和VEGFA-KO 的THP-1巨噬细胞,并测定促/抗炎细胞因子的产生。与对照组相比,在LPS+IFNγ和Pam3CSK4刺激下,GPNMB-KO产生的肿瘤坏死因子α(TNF-a)显著降低(图S5C),表明GPNMB促进巨噬细胞产生TNF-α。

图S5C:热图显示与未经编辑的对照组相比,CRISPR基因敲除后的(B)中细胞因子的变化。

SLC40A1-KO分泌的白细胞介素-23(IL-23)、IL-6和IL-12p40含量较低,但分泌的IL-1β含量较高(图3G),表明SLC40A1促进促炎细胞因子的释放,但抑制IL1β的产生,IL1β是TME炎性反应的关键调节因子。

图3G:条形图显示与未经编辑的对照组相比,SLC40A1-KO、GPNMB-KO和VEGFA-KO 的THP-1巨噬细胞中细胞因子的变化。p<0.05,p<0.01,**p<0.001(Student’s t检验)。

LAMP3+DCs:肿瘤中具有转移潜能的成熟DCs
DCs在肿瘤免疫中的主要功能是获取肿瘤抗原,迁移到LNs,并激活新生T细胞反应。作者重点研究了三种在肿瘤中富集的DC亚群:DC-c1-CD1C、DC-c3-CLEC9A和DC-c4-LAMP3(图1H)。DC-c1-CD1C高表达CD1C、FCER1A和CLEC10A,对应于cDC2,而DC-c3-CLEC9A高表达CLEC9A、XCR1和CADM1,代表cDC1(图4A)。

图4A:基于SMART-seq2的肝癌DCs基因表达热图。行表示特征基因。列表示单个细胞。

根据已知的标记,DC-c4-LAMP3与体内的任何经典DC亚群均不对应(表S4)。DC-c4-LAMP3中的细胞表达成熟标记LAMP3、CD80和CD83;迁移标记CCR7;淋巴细胞循环趋化因子CCL19和CCL21(图4B)。

图4B:基于SMART-seq2的箱式图展示LAMP3+DCs标记基因表达。每个点代表一个单细胞。

为了验证这个群体在体内的存在,作者对另外五个肝癌患者样本进行了流式细胞术。肿瘤中发现CD11c+LAMP3+ DCs表达的CCR7高于cDCs(图S5D和S5E)。

图S5D:肝癌患者肿瘤及癌旁肝组织DC亚群的FACS门控策略。

图S5E:FACS分析显示,LAMP3+DCs中CCR7和CD80的表达高于cDC1和cDC2。

肿瘤中LAMP3+ DCs的比例高于邻近肝脏(p=0.0007,Student’s t检验)(图S5F),与作者scRNA-seq的数据一致。

图S5F:点图显示肿瘤中LAMP3+ DC的比例高于邻近肝组织。p<0.05;p<0.01;*p<0.001;Student’s t检验。

为了检查LAMP3+ DCs是否存在于其他肿瘤类型中,作者将数据集中的肿瘤浸润DCs的转录组与乳腺肿瘤浸润的FACS定义的DC亚群的转录组数据进行了比较。不出所料,HCC肿瘤的cDC1和cDC2与乳腺癌的cDC1和cDC2表现出良好的一致性(图S5G)。

图S5G:左边的图显示了我们的数据中基于FACS生成的DC子集中不同DC子集对的上调/下调基因的富集。气泡大小表示在相应细胞亚群(x轴)中表达的基因特征(y轴)中基因的比例,颜色条表示富集/耗竭的p值。右边的热图显示了两个数据集(HCC和乳腺癌)中每个簇的特征基因。

尽管肝癌中的LAMP3+ DCs与乳腺癌中的DC群体并不完全对应,但在其cDC1、cDC2和pDC亚群中发现LAMP3+DCs中高表达的基因(图S5G),这表明所有这些DC亚群都可能含有LAMP3+DCs。与肺癌的scRNA-seq数据的特征基因相比,作者发现,LAMP3+ DCs高表达的特征基因来源于肺癌中“活化的DCs”(图4C;表S5)。

图4C:肝癌中LAMP3+DC的表达与肺癌中hDC3表达的一致性。小提琴图:肝癌DC亚群中hDC3信号的表达。文氏图:两个数据集重叠的特征基因数。

因此,LAMP3+ DCs可能存在于多种肿瘤类型中,并且可以被scRNA-seq检测到。
由于LAMP3被报道与CD40L刺激下的DC成熟有关,作者进一步研究了LAMP3+DCs与其他DC亚群之间的关系。血液中幼稚的原发性cDC1、cDC2和pDCs不表达LAMP3(图S6A)。

图S6A:健康供体外周血单核细胞DC亚群FACS门控策略,LAMP3无表达。

然而,在体外用LPS+IFNγ或poly I:C刺激后,所有三个DC亚群上调CD83和LAMP3(图S6B)。

图S6B:体外刺激后不同DC亚群(LPS+IFNγ或Poly I:C)中LAMP3表达的直方图。

体外单核细胞衍生树突状细胞(mo DCs)在接受CD40L或LPS的成熟刺激时也上调CD83和LAMP3。相反,与成熟抑制剂维生素D孵育抑制mo DC上的CD83和LAMP3(图S6C)。
与此相反,与维生素D(一种成熟抑制剂)孵育后,抑制mo-DCs上的CD83和LAMP3(图S6C)。

图S6C:不同刺激条件下,mo DC亚群中LAMP3的表达。

然后作者在体外刺激前后对DCs进行scRNA-seq,以表征LAMP3+DCs形成过程中DC亚群的转录组变化。这些树突状细胞可分为10个种群(图4E)。

图4E:显示体外树突状细胞簇的UMAP图。每个点代表一个单细胞。颜色代表簇。

其中,C02、C03为cDC2,C01、C04为pDCs,C08为LAMP3+ DCs。作者还确定了C05为新定义的cDC子集,即AS-DC(AXL+DAB2+)(图4F和S6D)。

图4F:体外树突状细胞的特征基因表达。

图S6D:UMAP图显示有/无刺激的PBMC衍生DCs中基于文献的特征基因表达。

与未经处理的样品(图5A-5C)相比,经LPS+IFNγ和poly I:C处理的样品中LAMP3+ DCs的数量更多,证实成熟刺激诱导了LAMP3+DCs。

图5A:体外DC簇的比例。颜色代表簇。x轴代表不同的刺激,y轴代表各簇的比例。

图5B:不同刺激下LAMP3+DCs的百分比。*p<0.05(Student’s t检验)。

图5C:按供体和刺激物对图4E中UMAP图的分解。

尽管cDC1的数量太少,无法形成一个明显的簇,但作者基于XCR1、CLEC9A和CADM1的高表达检测了cDC1的存在,并观察到poly I:C或LPS+IFNγ处理后LAMP3的水平升高(图S6E)。

图S6E:体外培养DC的scRNA-seq中LAMP3与cDC1标记基因CLEC9A、XCR1和CADM1的表达关系。

此外,作者在处理过的样本中发现了三个富集的簇。与cDC2向LAMP3+ DCs过渡阶段相对应的C07在poly-I:C处理的样本中更为突出,而与pDCs向LAMP3+ DCs过渡阶段相对应的C09和C10在LPS处理的样品中更为突出(图5A和5C)。总之,这些数据表明LAMP3表达是多个DC亚群的成熟标志。
为了进一步研究LAMP3+ DCs与其他DC亚群的谱系关系,作者对HCC中的DC亚群进行了RNA速度分析,观察到1.5%(1465中的22个)cDC1和0.98%(410中的4个)cDC2有可能转移到LAMP3+ DCs(图4D),提示肿瘤中的LAMP3+ DCs可能来源于cDC1和cDC2。

图4D:在肝细胞癌DCs扩散图投影上显示RNA速度。

对于刺激后的体外DC亚群,RNA速度分析显示,处于过渡期(C07和C09)的细胞表现出向LAMP3+ DCs的强定向流动(图5D),表明体外成熟刺激诱导cDCs(C02、C03为cDC2)和pDCs(C01、C04)向LAMP3+ DC分化,而不是AS-DCs(C05)。

图5D:在图4E中的UMAP投影上,使用规则网格上的高斯平滑来可视化RNA速度。

因此,体内外研究结果表明,不同的原代DC亚群有可能成为LAMP3+ DCs。然后作者用Spearman相关法比较了DCs在体外和HCC中的整体转录组。体外产生的和肝癌中的LAMP3+ DCs展现出很强的相关性(图5E)和共表达基因,包括CCR7、CCL19、FSCN1和CD40(图5F)。

图5E:DCs在肝癌和体外表达的相似性。行表示体外树突状细胞。列表示HCC中的DCs。

图5F:热图显示LAMP3+ DCs基因在肝癌及体外的表达。行表示特征基因。列表示群集。

接下来,作者使用来自小鼠组织迁移性cDCs特征基因来研究肝癌中的DC迁移潜能(表S5)。与cDC1和cDC2相比,LAMP3+ DCs表现出最高的“迁移得分”(图6A)。

图6A:显示HCC中DC亚群迁移分数的小提琴图。

通过Transwell迁移分析(图S6F),作者发现,使用CD40L+PGE2或商业DC成熟补充剂成熟的mo-DCs导致了LAMP3水平的升高,并且这些成熟的DCs比未成熟的DCs更容易向CCL19迁移(图6B、S6G和S6H)。

图S6F:Transwell实验设计。

图6B:条形图显示成熟树突状细胞在体外的高迁移能力,基于高表达的LAMP3(右)的Transwell分析(左)。p<0.05,p<0.01,*p<0.001(学生t检验)。

图S6G:在S6F(Pearson相关分析)迁移实验中,LAMP3的表达与迁移细胞的数量呈正相关。

图S6H:LAMP3在CD83hi迁移细胞中高表达(学生t试验)。

相反,用维生素D处理的树突状细胞未能迁移(图6B)。为了检测LAMP3+ DCs在HCC中的迁移能力和潜在的迁移方向,作者通过对线粒体突变的分析,追溯了LAMP3+ DCs在不同组织中的谱系起源。基于DSN09患者线粒体突变构建的LAMP3+ DCs系统发育树发现,在LNs和肿瘤中有少量细胞具有共同的谱系,比其他组织之间的数量更多(图6C和6D)。


图6C:DSN09患者LAMP3+ DCs线粒体系统发育树的分支。

图6D:显示肿瘤和LNs稳定谱系(bootstrap>30)的文氏图。系统发育树所审查的谱系关系并不能反映增殖的程度。条形图显示了在不同组织中共享谱系的数量。

作者还进行了RNA速度分析以检查迁移方向,并观察到cDC1和cDC2在肿瘤和LNs之间没有显示出清晰的方向性流动(图6E)。

图6E:在规则网格上用高斯平滑法显示UMAP投影上体外树突状细胞的RNA速度。

相反,在LAMP3+ DC中,肿瘤来源的细胞向LNs中的细胞呈定向流动,其趋势明显高于cDC1和cDC2(p=4.08e-06,比值比=3.03)(图6F),进一步支持了潜在的迁移方向。

图6F:肿瘤中的LAMP3+ DCs显示肿瘤与LNs之间的RNA速度链比率很高(Fisher精确检验)。

总之,作者鉴定了肝癌中的LAMP3+ DCs具有成熟特征。这些DCs可能起源于cDC1和cDC2,表现出向LNs的迁移能力。

树突状细胞和淋巴细胞的相互作用关系
为了研究髓细胞和淋巴细胞之间的相互作用,作者利用一组免疫相关配体受体(L-R)对深入了解细胞簇之间的调节关系。以肿瘤细胞为研究对象,作者预测97对L-R介导625对细胞簇之间的相互作用。由于更高的基因检测敏感性,SMART-seq2数据显示的潜在的L-R对更多(图7A和S7A)。与DCs和T细胞作为免疫调节因子的重要作用一致,DCs的配体数量最多,其中LAMP3+ DCs、cDC2和cDC1分别有114、82和82个配体。T细胞是淋巴细胞中的受体数量最多的细胞,Tex细胞、CD4-c5-CXCL13、Treg细胞和增殖性T细胞分别含有83、83、79和65个受体(图7A和7B)。

图7A:SMART-seq2测定的重要L-R对的配体和受体的数量。

图7B:肿瘤中DC和T细胞簇的相互作用。树突状细胞是红色的,T细胞是黄色的。DC-c4-LAMP3的配体以红色填充,其他配体以灰色填充。
箭头宽度是两个簇之间的交互值之和。显示值大于10且p<0.01的L-R对。

所有三个肿瘤富集的DC亚群通过共刺激因子CD28/B7家族(CD86-CD28、CD86-CTLA4、ICOSLG-CD28和ICOLG-CTLA4)和白细胞介素-15(IL-15-IL-2RB和IL-15-IL-2RG)与Tex细胞、增殖性T细胞和Treg细胞显示出强大的潜在相互作用(图S7B;表S6)。

图S7B:Circos图显示了CD80-CTLA4和CD80-CD28、CCL19-CCR7、CCL22-CCR4、PDCD1LG2-PDCD1轴在不同簇中预测的细胞-细胞相互作用。

LAMP3+ DCs在三个DC亚群中表现出最高的配体数,并且LAMP3+DC与T细胞亚群的L-R数高于cDC1和cDC2(图7C)。

图7C:DC和T细胞亚群间L-R对的数目。计数值>10对,p<0.01。

预测LAMP3+ DCs通过CCL19-CCR7和CCL22-CCR4轴与CD4+T细胞(CD4-c3-IL-7R、CD4-c5-CXCL13和CD4-c6-FOXP3)相互作用,提示LAMP3+ DCs通过趋化因子迁移吸引T细胞(图S7B)。LAMP3+ DCs高表达CD274(PD-L1)和PDCDD1LG2(PD-L2),并被预测与中枢记忆T细胞(CD4-c3-IL-7R和CD4-c4-TCF7)、效应记忆T细胞(CD8-c4-SELL和CD8-c5-GZMK)、Tex细胞(CD8-c7-PDCD1)、Treg细胞(CD4-c6-FOXP3)和增殖性T细胞(CD8-c1-MKI67)(图7E和S7B)上PDCD1(PD-1)结合,提示LAMP3+ DCs可能利用CD274/PDCD1LG2-PDCD1轴调控多种类型T细胞。

图7E:CD274-PDCD1介导的预测相互作用。

HCC肿瘤的多色IHC染色还显示表达PD-1的T细胞(CD3+CD4+或CD3+CD8+)和表达PD-L1的LAMP3+ DCs(CD80+)(图7F和S7D)的物理并列。

图7F:LAMP3+ DCs和T细胞中PD-L1和PD-1表达的多色IHC染色,以DSN09患者为例。比例尺表示30 mm。

图S7D:以DEJ10和DEJ16为例,用多色IHC染色验证LAMP3+ DCs和CD8+CD4+T细胞中PD-L1和PD-1的相互作用对。
比例尺表示30 mm。

根据对TCGA中366例肝癌患者的分析,LAMP3+ DC基因特征与细胞毒性T细胞呈中度相关(R=0.26,p<1e-07,Pearson相关),与Tex细胞(R=0.51,p<2.2e-16)和Treg细胞(R=0.44,p<2.2e-16)呈强相关(图7D和S7C)。

图7D:LAMP3+ DC信号与基于TCGA LIHC数据的Tex或Treg细胞的相关性,通过CD45表达进行规范化。每个点代表一个病人(皮尔逊相关分析)。

图S7C:基于TCGA-LIHC数据的LAMP3+ DC基因特征与细胞毒性T细胞的相关性,通过CD45表达进行规范化。每个点代表一个患者(皮尔逊相关分析)。

总之,作者的数据表明LAMP3+ DCs可以通过包括PD-1/PD-L1在内的多种L-R对调控HCC肿瘤中的多个T细胞亚群,并且更可能与T细胞功能障碍有关。
作者还预测,LAMP3+ DCs也可通过IL15和NECTIN2与NK细胞相互作用(表S6)。NECTIN2编码一种膜配体,NECTIN,其与CD226的相互作用产生激活信号,而与TIGIT的相互作用产生抑制信号。有趣的是,作者预测,LAMP3+ DCs通过NECTIN2-CD226与cNK细胞相互作用,而通过NECTIN2-TIGIT与lrNK细胞相互作用(图7G)。这表明,LAMP3+ DCs可能将不同的NK细胞亚群向相反的方向调节。

图7G:由NECTIN2-CD226/TIGIT介导的预测的相互作用。

全文总结

最后总结一下这篇文章,作者对肝癌患者的肿瘤、癌旁、肝淋巴结、腹水及血液中的单细胞通过流式分选出CD45+的细胞,并进行10×和SMART-seq2两种测序,对2种方法的测序结果进行综合分析。将肿瘤微环境中的细胞分为T细胞、巨噬细胞、NK细胞和树突状细胞进行分析,分析发现,幼稚DC细胞向成熟的LAMP3+DC方向转化,LAMP3+DC有向肝淋巴结迁移的趋势,腹水中的细胞来源于肿瘤、癌旁、血液中的细胞。

总之,该研究对来自不同组织部位的免疫细胞的全面表征揭示了免疫细胞在肿瘤环境中的动态特性,揭示了TME,LN和腹水中髓样和淋巴样细胞的不同谱系和迁移关系。为了促进更多研究人员使用该研究的数据,研究人员开发了一种基于Web的交互式工具(http://cancer-pku.cn:3838/HCC/),用于为一个或多个用户分析和可视化的单细胞数据输入基因。该研究数据为进一步研究提供宝贵的资源,以获取更深入的生物学见解,从而为当前的肝癌免疫疗法带来新的治疗靶点和反应的生物标志物。

单细胞测序文献精读10 | 单细胞测序揭示肝细胞癌免疫细胞图谱及其动态特征_第1张图片

你可能感兴趣的:(单细胞测序文献精读10 | 单细胞测序揭示肝细胞癌免疫细胞图谱及其动态特征)