这一篇我们继续分享单细胞空间联合分析解决我们的生物学问题,这一次我们要分享的生物学问题是基底细胞瘤与其微环境的相互作用和肿瘤生长机制,当然了,一旦涉及微环境的研究,单细胞空间两种技术都是必需的,今天我们参考的文献在Single-cell analysis of basal cell carcinoma reveals heat shock proteins promote tumor growth in response to WNT5A-mediated inflammatory signals,一起来看看文献的内容。
科普一下:
- basal cell carcinoma (BCC) :基底细胞瘤,基底细胞瘤亦称蚕蚀性溃疡,是皮肤癌中最多见的一种,发病率很高,占眼睑恶性肿瘤的第一位(约50%以上)。男性比女性稍多,老年人比青年人多见,年龄高峰在50~60岁之间。特征性皮损为具有珍珠样隆起性边缘的圆形斑块,表面常有毛细血管扩张,皮损逐渐增大。一般仅在局部呈浸润性生长,很少发生转移,但处理不当,或不加处理,也可能严重破坏眼部组织,甚至侵入鼻旁窦及颅内而引起死亡。
Abstract
基底细胞癌 (BCC) 如何与其肿瘤微环境相互作用以促进生长尚不清楚。在这里,使用单细胞 RNA 测序来定义人类 BCC 生态系统并区分正常和恶性上皮细胞。确定了肿瘤及其周围基质的空间生物标志物(空间位置还是很必要的),这些生物标志物加强了每种组织类型的异质性。结合基质细胞中的伪时间、RNA 速度、细胞熵和调节子分析揭示了成纤维细胞的癌症特异性重新分布,其中 STAT1、TGF-β 和炎症信号诱导非典型 WNT5A 程序,维持基质炎症状态。细胞间通讯模型表明,肿瘤通过产生热休克蛋白来响应成纤维细胞特异性炎症信号通路的突然爆发,在原位验证了这一点。最后,使用 HSP70 抑制剂进行剂量依赖性治疗可抑制 BCC 小鼠模型中的体外 BCC 细胞生长和 Hedgehog 信号传导以及体内肿瘤生长,从而验证了 HSP70 在肿瘤生长中的重要作用,并加强了 BCC 进展中肿瘤微环境串扰的关键性质。
Introduction
基底细胞癌 (BCC) 是一种局部浸润性皮肤癌,是世界范围内最常见的人类癌症,估计终生风险在 20-30% 之间,并且在包括North America、Europe、Asia和Australia在内的许多地区发病率不断上升。 BCC 源于 Hedgehog (HH) 信号通路的不当激活,其中分泌的 HH 配体结合胆固醇转运蛋白 Patched Homologue 1 (PTCH1) 并抵消 PTCH1 介导的 G 蛋白偶联受体平滑 (SMO) 抑制。 然后 SMO 激活 GLI 转录因子家族以促进增殖和肿瘤生长。 尽管 BCC 的死亡率低,但受累的患者人数众多,发病率和成本都很高。
尽管手术仍然是 BCC 治疗最好的方法,但对于美容敏感的身体部位的肿瘤或转移性疾病,它不是一个实用的选择。 SMO 抑制剂 vismodegib 和 Sonidegib 已成为晚期疾病的有希望的治疗方法,在转移性 BCC 中的反应率约为 30%,在局部晚期 BCC 中为 45%。 然而,驱动耐药性的 SMO 突变很常见,在接受 vismodegib 治疗的患者中,发现高达 21% 的患者在治疗期间经历了肿瘤再生长。 导致 BCC 耐药性的其他途径包括 PI3K/MTOR、WNT、aPKC iota/lambda、NOTCH1、RAS/MAPK 和 MRTF 的激活,仅举几例。 所以需要新的治疗选择来治疗晚期 BCC。
基质如何与 BCC 相互作用并促进其生长尚不清楚。根据 BCC、鳞状细胞癌和黑色素瘤中癌症相关成纤维细胞 (CAF) 标志物的层次聚类,可以将三个不同的亚组分层,每个亚组对应于特定的癌症类型。具体而言,BCC CAF 以其 PDGFR-β、S100A4 和 TWIST 的高表达而著称。在 BCC 的不同组织病理学亚型中,肿瘤与基质的比率显著不同,浸润性 BCC 的比率最低。编码细胞外基质成分的基因在 BCC 中也被上调,表明肿瘤诱导的基质基质重塑。此外,基质蛋白的表达已被证明可以预测 BCC 的侵袭性并区分浸润性 BCC 和促纤维增生性毛上皮瘤。总之,这些研究表明 BCC 基质中的表达因子可以在肿瘤生长、血管生成和转移中发挥重要作用。定义 BCC-基质相互作用可能是肿瘤进展的一个重要但未充分研究的部分,并导致更有效的治疗。
单细胞 RNA 测序 (scRNA-seq) 技术允许分析样本内异质性、肿瘤/样本微环境、致病途径和致癌环境中的细胞-细胞相互作用(单细胞确实是一个开创性的技术)。 使用这项技术,分析定义了 BCC 细胞异质性、细胞间相互作用和 BCC 中的新活性途径。 区分恶性和正常上皮细胞,确定由 WNT5A 驱动的基质炎症反应,表征过度表达热休克蛋白的 BCC 角质形成细胞亚群,并提供支持 HSP 通路作为 BCC 潜在新治疗靶点的数据。
Results
Cellular ecosystem of human BCC
为了定义人类 BCC 的cellular ecosystem,从原代人类 BCC 手术丢弃物(n = 4),包括肿瘤周围正常皮肤(PTS)组织(n = 2)中分选了可行的单细胞,并将它们置于 3 '-启用液滴的 scRNA-seq 。
研究中考虑的主要 BCC 亚型包括浅表性、结节性和浸润性 BCC(ID:BCC-I;k = 9,837 个细胞); 浅表和结节性 BCC(ID:BCC-II;k = 11,724 个细胞); 未知/“混合” BCC(ID:BCC-III;k = 6,712 个细胞); 和浸润性神经周围浸润 BCC(ID:BCC-IV;k = 8,569 个细胞)。 PTS 组织构成与 BCC 病变直接相邻的皮肤。 我们总共处理了 56,162 个原始单细胞(kPTS = 17,727 与 kBCC = 38,435)。 Following putative doublet/multiplet removal and quality control filtering of individual libraries。
剩余 52,966 个“有效”细胞(kPTS = 16,903 与 kBCC = 37,667)。 为了解决单个肿瘤中存在的细胞多样性并进行下游查询和比较基因表达分析,处理和表征了单个 BCC,并使用 Seurat 并可视化推断的推定细胞类型。 确定了十种大的细胞类型,包括 MKI67+ 增殖性上皮细胞、KRT14+ 基底上皮/肿瘤细胞、终末分化的 IVL+ 角质形成细胞、AZPG+ 附属相关细胞、PDGFRA+ 成纤维细胞、RGS5+ 成纤维细胞样细胞、TIE1+ 内皮细胞、PROX1+ 内皮细胞、MLANA+ 黑素细胞和通过 PTPRC 表达鉴定的免疫细胞。没能鉴定具有富含棘层角质形成细胞或Schwann/neural-like细胞的基因表达特征的细胞cluster。
为了识别原发 BCC 样本中存在的假定恶性肿瘤细胞,我们对 KRT14+ 上皮/肿瘤细胞进行了 InferCNV 分析(关于inferCNV分析,大家可以参考我的文章10X单细胞(10X空间转录组)肿瘤数据分析之肿瘤进化(inferCNV+UPhyloplot2))。在 BCC-I、BCC-II 和 BCC-IV 供体的 KRT14+ 上皮细胞中观察到与染色体重复(深红色)和缺失(深蓝色)相关的异常基因组谱,与其对应的非上皮、非-免疫内参细胞。有趣的是,与其他 BCC 亚型相比,BCC-III 没有显示出显著的异常基因组结构变化。相反,它的特征更类似于 PTS 样品中存在的非附属物 KRT14+ 上皮细胞,表明某些肿瘤没有显著的拷贝数变异驱动肿瘤生长。尽管 InferCNV 推断出 KRT14+ 上皮细胞的异常基因组变化,但它无法识别单个恶性细胞。即使使用非上皮细胞作为参考,我们也无法使用 copyKAT(关于copycat,大家可以参考我之前的文章copyKAT推断单细胞转录组肿瘤细胞CNV(自动识别肿瘤normal和tumor)) 准确地识别单个恶性细胞。
当使用 Seurat 整合 BCC 和 PTS 数据集时,我们注意到来自 PTS 的 BCC KRT14+ 上皮/肿瘤细胞的独立聚类,以及进一步的 BCC 间分区。与 KRT14+ 上皮/肿瘤细胞不同,所有其他非上皮细胞类型不会相互独立地drift或聚集,无论供体如何。高 BCC 肿瘤异质性与其他报告一致,这些报告表明其他人类癌症(包括黑色素瘤和鳞状细胞癌)中存在高度转录组驱动的上皮、肿瘤间异质性。为了确定识别与 PTS 显著不同的 BCC 相关 KRT14+ 上皮/肿瘤细胞状态的最佳方法,将基于 Seurat 的整合与四种不同但广泛流行的方法进行了比较,包括 SCTransform、LIGER(关于LIGER,大家可以参考我的文章10X单细胞(空间转录组)数据整合分析批次矫正之liger)、Harmony(关于harmony,大家可以参考我的文章10X单细胞(10X空间转录组)整合分析批次处理之细节(harmony)) 和 scMC。无论条件或供体如何,所有算法都将非上皮细胞聚集在一起。然而,Seurat、SCTransform、LIGER 和 Harmony 模糊地聚集上皮细胞,无论条件或供体如何;而与 Seurat 的聚类完全由供体驱动,因此很难识别和解释 BCC 特异性上皮细胞类型或状态。形成鲜明对比的是,scMC 明显地将 BCC 和 PTS 上皮细胞聚集在一起,同时保持转录相似细胞类型的聚集。由于 scMC 保留了生物变异,同时去除了与每个样本相关的技术变异,因此将得到的 scMC 校正的 BCC-PTS 数据用于下游查询和比较分析。(大家做分析的时候,整合分析也要多方法比较)
scMC 保持了与 Seurat 的独立 BCC 聚类所发现的相同的十种不同的细胞类型。 按条件和供体划分的每种大类细胞类型的量化揭示了 BCC 和 PTS 之间的相对细胞类型频率相似性。 非 PTS KRT14+ 上皮/肿瘤细胞独特地表达已知的 BCC 相关基因生物标志物,包括 BCAM 和 EPCAM。 有趣的是,来自 BCC-III 的 KRT14+上皮/肿瘤细胞显示出“混合”位置,其中许多细胞与 PTS 样本显著重叠,而其他细胞则独特地单独聚集,这与我们之前的观察结果与 InferCNV 分析相匹配。 总之,分析的基准方法和比较 scRNA-seq 聚类分析解决了人类 BCC 的不同细胞lanscope,并揭示了与 PTS 相比的主要 KRT14+ 上皮细胞类型差异,表明人类 BCC 样本之间存在高度的肿瘤间和肿瘤内转录异质性 .
Defining normal versus malignant epithelial cells.
为了定义人类 BCC 和 PTS 样本的上皮/肿瘤细胞图谱,对 30,058 个 KRT14+ 上皮衍生细胞进行了再分群(kPTS = 5,146 与 kBCC = 24,872)并确定了 15 个上皮细胞clusters,所有这些细胞clusters都由独特的表达定义基因生物标志物。三个亚群 (IFE I-III) 似乎是正常的上皮细胞,几乎构成了所有 PTS 样本和一小部分 BCC 样本,而其余细胞仅聚集到 BCC 相关样本 (BAS I-十二)。综合比较分析没有揭示独特的肿瘤特异性角质形成细胞 (TSK) 的存在,正如之前报道的鳞状细胞癌,而是具有共同和独特基因表达模式的 BCC 相关角质形成细胞。为了探索它们的基因表达谱和空间结构,在空间上解析了选定的基因产物,包括 KRT15 (BAS-II)、LHX2 (BAS-IV) 和 ACTA2 (BAS-XI)。 KRT15标记了KRT14high肿瘤巢的一个subsets,LHX2标记了KRT14high肿瘤巢外周的细胞核,ACTA2标记了KRT14low肿瘤巢的外周,加强了BCC肿瘤的异质性。
接下来,通过使用先前定义的 BCC 相关基因表达谱(包括 EPCAM、BCAM 和 TP63 的共表达)对单个 KRT14+ 细胞进行评分来确定“转化”细胞的身份。当按条件分组并量化时,观察到大多数 BCC 相关细胞表达了这些标记中的一些,但不是全部三个。有趣的是,EPCAM 和 BCAM 是 BCC 特有的,而 TP63 在 PTS 样本中的表达很低。为了开发更好的转化措施,确定了 BCC 和 PTS 上皮细胞之间显著的基因表达差异。这种方法导致将 LGALS1 鉴定为在 BCC 上皮细胞中高度上调的基因。 LGALS1 以前与胰腺导管腺癌、透明细胞肾细胞癌、宫颈癌和恶性黑色素瘤有关。分析采用了类似的方法来鉴定与我们的供体队列中不同 BCC 样本相关的基因。确定 MYLK、CALM5、SCGB2A2 和 KRT19 在每个肿瘤样本中高度表达。
使用 scRNA-seq 数据来确定是否可以将基因组研究的其他bulk转录组中鉴定的基因或基因特异性位点与 BCC 宏观环境中的单个细胞相匹配。 为此,分析使用了人类 BCC scRNA-seq 数据和通过 BCC 中的 GWAS 研究确定的 BCC 风险位点的重叠表达。 成功鉴定了几个与特定 BCC 风险位点相关且仅在 BCC 上皮细胞中表达的差异表达基因,包括 BNC2、CUX1、ZBTB10 和 CASC15。
分析还采用了类似的方法从仅在 BCC 上皮细胞中表达的晚期 BCC 的bulk RNA-seq 分析中鉴定 vismodegib 抗性基因。 发现了一组非特异性基因,在其他细胞类型中广泛表达,包括 SLC39A14、DUSP10 和 SOX4。 相比之下,其他基因在 BCC 上皮细胞中表现出独特的表达,包括 FBN3、SH3GL3 和 KC6。 这种方法可以识别特定于某些 BCC 亚型或 BCC 上皮亚群的基因。
RNA dynamics show de-differentiation in BCC.
由于 BCC 显示出肿瘤间和肿瘤内的异质性,我们使用单细胞Velocyto (scVelo)(关于scvelo,大家可以参考我的文章10X单细胞(10X空间转录组)scvelo动态模型导论) 进行了 RNA 速度分析,以更好地估计和概括 KRT14+ 上皮细胞内的瞬时细胞状态。将 RNA 速度向量与 Markovnikov 根和终端状态耦合表明表面和结节 (BCC-I);浅表性、结节性和浸润性(BCC-II);未知/“混合”亚型 BCC (BCC-III) 表明速度向量指向与高水平的 BCC 相关特征基因相关的终末状态,以及高水平的 HH 和 WNT 通路基因。相比之下,神经周围浸润 BCC (BCC-IV) 的浸润表现出指向远离 HH 基因高区域的载体。有趣的是,来自 BCC-I 和 BCC-II 中具有明显高晚期分化基因特征的细胞的速度表明晚期分化上皮细胞的潜在去分化命运选择有利于 BCC 中更基础的命运,与正常上皮细胞显示出向高晚期分化基因特征的速度.
Fibroblast heterogeneity and function in human BCC.
最近的研究已经确定了人类和小鼠皮肤组织中不同状态和条件的成纤维细胞 (FIB) 和成纤维细胞样 (FIB-like) 细胞的大量功能异质性,在体内平衡、损伤介导的修复和再生方面,疾病和癌症等具有重要的生物学相关性。 为了辨别人类 BCC 和 PTS 区域中是否存在细胞和空间 FIB 或 FIB 样异质性,根据 PDGFRA 和 RGS5 的表达对 FIB 和 FIB 样细胞进行了细分,总共产生了 7,080 个细胞(kPTS = 1305 vs kBCC = 5,775)。 两种细胞类型的细胞外基质蛋白 DCN 和 LUM 都呈阳性。 这种子聚类方法导致识别出四个 FIB populations和两个类似 FIB 的populations,所有这些populations都由独特基因生物标志物的差异表达定义。
为了探索它们在人类 BCC 中的基因表达谱和空间结构,使用蛋白质免疫染色结合高分辨率共聚焦成像在空间上解析了它们的原位分布。cluster 1 成纤维细胞 (FIB I) 占分析的所有 FIB 的约 8%,并共同表达 ASPN。已显示 ASPN 过表达导致癌症进展和增强转移,其在间充质基质细胞和癌症相关成纤维细胞中的表达相似。在原位,ASPN+ FIB 无处不在地出现在整个真皮中。cluster 2 FIB (FIB II) 占所有 FIB 的约 8%,共同表达 CLIC2。在原位,CLIC2+ FIB 稀疏地位于 KRT14+ 肿瘤细胞巢周围。cluster 3 FIB (FIB III) 占所有 FIB 的约 32%,共同表达 CEMIP。在结直肠癌中,黏膜下层上皮细胞中缺氧介导的 CEMIP 过度表达导致最终增强的细胞迁移状态。此外,CEMIP+ FIB 围绕 KRT14+ 肿瘤细胞巢。最后,cluster 4 FIBs (FIB IV) 占所有 FIBs 的约 28% 并稳健地表达 TMEM119。 TMEM119 在骨肉瘤细胞中上调,其过表达与肿瘤大小、临床分期、远处转移和预后不良有关。大多数 TMEM119+ FIB 出现在外周并与 KRT14+ 肿瘤巢并列,其程度大于观察到的 CLIC2+ 和 CEMPI+ FIB 或无处不在的 ASPN+ FIB。还鉴定了两种类型的 RGS5+ FIB 样细胞表达 ACTA2(~3%)和 NEU4(~21%)。对来自按条件划分的每个假定 FIB 和 FIB 样亚型的细胞进行量化显示,BCC 和 PTS 样本中的细胞类型频率相似,但 TMEM119+ FIB 除外,与 PTS 相比,TMEM119+ FIB 在 BCC 中似乎略有扩大。原位成像分析表明,TMEM119+ FIB 在位置和密度方面在 KRT14+ 肿瘤巢中明显分离,进一步强化了人类 BCC 中存在显著的肿瘤间成纤维细胞异质性的概念,并且该特定群体可能在功能和结构上定位于支持肿瘤生长和进展。
然后检查了编码 ECM 相关蛋白的基因,并比较了它们在不同条件下的表达谱,以确定与 PTS 相比 BCC 中 ECM 重塑的水平。 总的来说,分析确定了编码各种胶原蛋白的基因的范围和表达的显著变化,包括 COL1A1、COL1A2、COL3A1、COL4A1、COL4A2、COL5A1、COL5A2、COL5A3、COL6A1、COL6A2、COL6A3、COL8A1、COL11A1、COL11A、 COL16A1。 与胶原蛋白编码基因类似,与 PTS 基质相比,其他 ECM 相关蛋白编码基因,包括 FN1、SPARC、TIMP1、TIMP2、MMP2、MMP9、MMP10 和 MMP12,也在 BCC 中富集。 这些 ECM 相关编码基因的表达不限于单个 FIB 子集,而是代表泛 BCC ECM 相关重塑基因谱。 这种比较分析表明,与 PTS 相比,BCC 中的 ECM 相关重塑有很大程度,这可能是由胶原蛋白和金属蛋白酶编码基因的表达驱动的。
Rewiring fibroblasts to a reactive stroma state.
因为 TMEM119+ FIB 在 KRT14+ 肿瘤巢中明显分离,并且在 BCC 样本中的比例显著更高,所以想知道它们是否可能具有独特的基因表达谱,可以在功能上支持肿瘤的生长和进展。为了阐明这一观点,使用专为单细胞分析量身定制的 DEseq2 的修改版本,对跨 BCC 和 PTS 条件的第 4 cluster FIB 进行了差异基因表达分析。该分析导致鉴定了在 PTS cluster 4 FIB 中差异上调的 16 个基因,以及在 BCC cluster 4 TMEM119+ FIB 中差异上调的 50 个基因。一种特定基因 WNT5A 在 BCC 中过表达并与 TMEM119 表达共定位。 WNT5A 已成为参与癌症进展的重要分子,最近的研究表明 WNT5A 调节癌细胞的侵袭、转移、代谢和炎症。因此,分析的结果表明 TMEM119+ FIB 与 KRT14+ 肿瘤细胞的潜在功能性信号网络是通过旁分泌非规范 WNT 信号驱动的。
为了确定可能在不同 FIB 群体(包括 TMEM119+ FIB)中驱动条件特异性基因表达变化的 BCC 特异性基因调节因子(调节子),我们使用 pySCENIC 进行了基因调节网络 (GRN) 分析,并确定了对 BCC 中的每个 FIB/FIB 类clusters,但不是 PTS。 TMEM119+ FIB 中活跃的前五个调节子包括 ATF6BREG(+)、ETV1REG(+)、STAT1REG(+)、STAT2REG(+) 和 THAP11REG(+)。 发现该调节在所有分析的调节子中都是独一无二的。 单细胞 GRN 分析表明,在 FIB 和 FIB 样细胞中存在活跃的特定调节子,并且它们在 BCC 和 PTS 之间特定目标的活性和调节方面存在显著差异。 此外,还发现 STAT1REG(+) 调节子可能参与非规范 WNT 配体 WNT5A 的上游调节。
基质分析确定了人类 BCC 和 PTS 在基因表达和调节子水平上的大量细胞 FIB 和 FIB 样异质性。为了确定这些细胞是否存在于连续体中或具有不同的细胞状态,我们使用 CEE 计算了 BCC 和 PTS FIB/FIB 样细胞的细胞熵(ξ - 与细胞转变相关的能量)(这个地方值得关注一下),并在 Waddington landscope上可视化了它们的个体 CEE 分数。结果表明,BCC FIB populations的总体熵低于 PTS 的总体熵,并且 TMEM119+ FIB 显示出最稳定的稳定性,这表明 FIB I-III 可能显示出更高的可能性过渡到那些与 BCC 肿瘤巢最并列的 FIB(FIB IV )。通过无偏伪时间和 RNA 动力学耦合分析来跟进我们的分析。这些互补的方法揭示了 BCC 和 PTS 之间的两条主要但截然不同的轨迹。仅关注 FIB 细胞,PTS FIB 从共同的 CEMIP+ FIB 起源向 WNT5A+ 或 ASPN+ 末端分叉。与此形成鲜明对比的是,BCC FIB 遵循单边轨迹,从 ASPN+ FIB 发出并在 TMEM119+ FIB 中达到顶峰。这些观察结果表明,发生了肿瘤基质的“重新分布”以将 FIB 推向 TMEM119+/WNT5A+ 状态以支持肿瘤生长。
为了识别参与获取 TMEM119+/WNT5A+ 状态的候选转录因子 (TF),提取了该轨迹中表示的 FIB,将它们与 Monocle2 以假时间树对齐,并执行 scEpath 分析以识别重要的、假时间依赖的 TF。我们在 PTS(⃗ PTS,轨迹 1)和 BCC 中的 225 个 TF(⃗ BCC,轨迹 1)沿轨迹 1共鉴定了 69 个伪时间依赖性差异表达的 TF。通过将 TF 分成显示平均 TF 动态的组来比较和对比来自两个轨迹的 TF,这导致识别出 BCC 轨迹中唯一存在的几个基因。有趣的是,与 TMEM119+ FIB 的 PTS 相比,STAT1 以及在较小程度上 TBX15 和 ATF7 在 BCC 的轨迹后期表现出伪依赖性表达。其他 TF 显示出早期的伪依赖轨迹,并在 TMEM119+ FIB 中被关闭,例如 BCC 中的 FOSB 和 PTS 中的 NFKB1。为了更广泛地了解这些 TF 并确定每个轨迹compartment中的主要通路,对伪时间依赖性 TF 进行了基因 (GO) 分析。其中,发现与 TGF-β 和炎症相关的通路显著表达。将这些 GO terms作为生物标志物评分叠加到二维嵌入上,以确定它们的表达是否与肿瘤基质的重新分布密切相关,并叠加了 RNA 速度流以可视化和匹配细胞与其相应的 GO 的运动。有趣的是,在达到由 ncWNT 信号活性 FIB 组成的最终反应性基质状态之前,ASPN+ FIB 似乎在 BCC 中经历了 TGF-β+ 炎症状态,而不是 PTS,这是一个 WNT5A 配体含量高的区域。这些结果表明,ASPN+ FIB 在 BCC 中发炎,并且基质的重新布线可能由炎症引起,这可能是由于在 BCC 进展过程中与侵入真皮的免疫细胞发生了串扰。
Inflammatory signaling pathways are highly active in BCC.
FIB 状态变化如何影响 BCC 肿瘤生长尚不清楚。为了确定 BCC 和 PTS 微环境之间的信号差异,我们通过使用 CellChat(关于Cellchat,大家可以参考我的文章10X单细胞(10X空间转录组)通讯分析之CellChat、10X单细胞(10X空间转录组)通讯分析CellChat之多样本通讯差异分析) 对 KRT14+ 上皮/肿瘤和 FIB/FIB 样细胞之间的单细胞-细胞相互作用进行建模来探测人类 BCC FIB-上皮相互作用组。分析确定了 21 条在基质-上皮轴中活跃的重要信号通路,包括 CXCL、IFN-I、IL6、ncWNT 和 TNF。尽管大多数通路在 PTS 和 BCC 中均显示出活性,但 GRN 和 MIF 通路在 BCC 中不活跃,而 IGF、NT 和 TNF 通路在 PTS 中不活跃。然后,通过比较细胞-细胞组的通信概率,确定了 BCC 和 PTS 之间差异调节的信号通路配体和受体。不出所料,与 PTS 相比,这种方法显示 ncWNT 作为 BCC 中高度活跃的主要信号通路。 ncWNT 信号的相对贡献主要来自 WNT5A 配体到卷曲受体。与 BCC 相比,WNT5A 配体在 PTS FIB 中的表达最小且不显著。与此形成鲜明对比的是,ncWNT 信号在 BCC 中非常活跃,主要由 WNT5A 配体驱动到卷曲受体 FZD6、FZD7 和 FZD10。大部分活动都包含在 BAS 细胞群中,如发送方和接收方的网络中心性分析所示。 WNT5A 是促炎反应的已知驱动因素,包括 CXCL、IFN-I、IL6 和 TNF。 CXCL 信号包含在 PTS 中的 FIB 中,但扩展到 BCC 中的 BAS 细胞cluster; IFN-I 信号包含在 PTS 的上皮细胞内,但在 BCC 中扩展到 FIB;与 PTS 相比,IL6 信号在 BCC 中显示出更大的串扰; TNF 信号是 BCC 独有的。 TNF 自分泌和旁分泌信号源自 BCC 中的循环上皮细胞并向其他上皮细胞和 FIB 发出信号,并且是 WNT5A 的激活剂。总之,这些结果表明,急性炎症信号可能会激活 WNT5A,从而维持促炎反应并作为 BCC 中主要的炎症和应激信号中枢。
Heat shock proteins regulate BCC growth.
为了确定 FIB 的促炎反应如何影响肿瘤生长,在 BCC 与 PTS 上皮细胞中寻找相关的差异表达基因,并在 BCC 中发现了显著的热休克蛋白 (HSP) 特征。 HSP 是对细胞压力和炎症的适应性反应,与癌症的发展和进展密切相关。 我们鉴定了与 PTS 上皮细胞相比在 BCC 中显著上调的五个 HSP 编码基因,包括 HSP90AB1、HSP90AA1、HSPA2、HSPA6、HSPA8、HSPA12B 和 HSPA1A。 接下来使用 pySCENIC 进行 GRN 分析,并确定了几个可能调节 HSP 编码基因的活性调节子,包括 ELF1REG(+)、E2F6REG(+)、EGR1REG(+)、EGR2REG(+)、JUNREG(+)和 YY1REG(+) . 这些结果表明,在分析的不同 BCC 亚型的任何一个cluster中,高比例的 BCC 细胞对 HSP 基因表达的评分很高。
然后我们使用蛋白质免疫染色结合高分辨率共聚焦成像在空间上解析了 HSP70 的原位表达,因为 HSP70 是 HSPA1A 的基因产物。发现 KRT14+ BCC 巢表达细胞质 HSP70,很少有 IFE 上皮细胞和非上皮细胞表达蛋白质。有趣的是,具有神经周围浸润的原发性浸润性 BCC 证明了 HSP70 的核表达。为了确定 HSP 是否对 BCC 细胞生长很重要,我们在鼠 BCC 细胞系 ASZ001 上使用了 HSP70 抑制剂 Ver155008,并观察到 ASZ001 细胞增殖的剂量依赖性抑制,同时伴随着下游 HH 靶基因 Gli1 表达的降低。 RNA和蛋白质水平。通过 Mki67 和 Casp3 染色定量确定,HSP70 抑制影响 BCC 细胞的增殖和存活。最后,旨在使用 BCC 小鼠模型 Gli1-CreERT2 确定 HSP 对体内 BCC 的作用; Ptch1fl/fl 。我们诱导了 Gli1-CreERT2; Ptch1f1|f1 小鼠连续三天服用他莫昔芬以产生基底细胞样微肿瘤,然后每天腹腔注射载体对照或 Ver155008,持续 7 天。 Ver155008 处理的小鼠背部皮肤的组织学染色显示,与载体处理的对照相比,微肿瘤面积显著减少,呈剂量依赖性。我们的体外和体内研究有助于协调我们的 scRNA-seq 分析并确定 HSP,尤其是 HSP70,作为 BCC 肿瘤生长的潜在新调节剂,并可能为 BCC 的治疗提供新的治疗场所。
Discussion
人类 BCC 的功能异质性主要是通过批量水平的基因组和转录组学研究来探索的,在这些研究中,很难分离出不同的细胞类型和肿瘤内的克隆性。使用单细胞技术,我们确定了构成 BCC 的细胞类型和状态的环境,并发现bulk研究可以提供互补的数据集,但由于活检样本中正常细胞和癌细胞的异质性。在单细胞水平上进行分析时,我们发现了更多的 BCC 生物标志物,它们可以更好地定义 BCC 并标记来自特定供体的肿瘤,进一步突出了这种疾病的异质性。我们还确定了 CAF 的空间异质性,导致有利于 TMEM119+/WNT5A+ 反应性基质和炎症信号的轨迹,在 CAF 和 BCC 细胞cluster之间产生细胞间串扰。最后,我们的结果表明 BCC 肿瘤通过表达 HSP 对来自基质的炎症信号作出反应,并且 HSP 抑制剂可以成为抑制肿瘤生长的有效治疗方法。
我们在活检样本之间和内部区分恶性细胞和正常细胞以创建更细微的 BCC 基因特征的努力强调了整合基准的重要性。尽管没有算法是完美的,但我们证明了使用几种不同方法的基准集成增加了对基础数据的可信度。 BCC 具有高度异质性,并且在所有癌症中具有最高的突变频率,因此难以整合多个样本。使用的所有四种聚类算法(Seurat、SCTransform、LIGER、Harmony 和 scMC)在正确聚类具有低突变负荷的非上皮细胞类型方面表现出显著的效率,但具有较高突变负荷的上皮细胞在聚类中表现出显著的批次效应。根据我们的经验,Seurat、SCTransform、LIGER 和 Harmony 无法区分正常细胞和恶性细胞,Seurat 本身将每个供体彼此分开聚集,而不管其来源。然而,scMC 将正常和恶性上皮细胞清晰地聚集在一起,同时在每种条件下保持内聚力,这可能是因为它能够学习共享的减少维度的细胞嵌入以保留生物变异,同时消除与每个样本相关的技术变异。
尽管难以整合上皮细胞,但基质细胞状态在 PTS 和 BCC 样本之间显示出显著的凝聚力。在正常和恶性样本中都发现了四种 FIB 状态和两种 FIB 样状态,这表明 CAF 可能是正常组织驻留成纤维细胞的活跃状态,并且在 BCC 中不发生癌症特异性基质状态。然而,在 BCC 基质中发生了很大程度的主动重塑,可能主要由胶原蛋白和金属蛋白酶基因产物驱动。此外,RNA 速度分析表明,表达 TGF-β 和 IL 基因(CAF 的经典激活剂)的高度发炎基质会产生由 WNT5A+ FIB 突出显示的反应性基质。在到达 TMEM119+/WNT5A+ 之前,基质的这种癌症特异性重新布线从在整个基质中无处不在的 ASPN+ 状态 (FIB I) 转变为在 KRT14+ 肿瘤巢周围很少发现的 CLIC2+ (FIB II) 和 CEMIP+ (FIB III) 状态与其他三种 FIB 状态相比,以相对较高的密度围绕 KRT14+ 肿瘤巢的状态(FIB IV)。 TGFB1 和一般炎症基因在前三个 FIB 群体中表达,并且可能提供激活 WNT5A+ 状态的机制,而 WNT5A 可能会加强这种信号传导,因为它是诱导免疫反应的促炎信号的已知驱动因素。炎症和 CAF 驱动的基质重新布线是有希望的治疗靶点,我们的 GRN 分析表明 JAK-STAT 通路可能调节 WNT5A 表达,为 JAK-STAT 抑制剂治疗 BCC 患者开辟了可能性.
CAFs 和一般 FIB 炎症如何影响 BCC 肿瘤生长尚不清楚。我们的 CellChat 推断信号结果表明 FIB 和 BAS cluster之间的信号"爆发",涉及 TNF、IL6、IFN-1 和 CXCL 通路。有趣的是,WNT5A 是这些途径中的每一个的已知驱动因素,TGFB1 和炎症信号(如 IL6 和 TNF)是已知的 CAF 和 WNT5A 激活剂,尤其是 WNT5A。随着炎症信号的涌入,BCC 似乎通过上调 HSP 作为一种保护机制来做出反应。众所周知,HSP 在 DNA 修复机制中发挥重要作用,以维持基因组的稳定性和完整性,这一过程与炎症密切相关。癌症生活在一把双刃剑上,它们需要足够的基因组不稳定性才能茁壮成长,但又不能有太多的不稳定性来不利地改变成功的复制。癌症特异性 HSP 表达可能有助于维持基因组不稳定性平衡以促进肿瘤生长,这可以解释我们的结果表明 HSP 抑制剂可有效抑制 BCC 生长。正在进行的癌症类型临床试验证明,联合治疗可能更有效地抑制 HSP,这是未来可能的方向.
Overall, our findings illustrate the heterogeneity and dynamic nature of the BCC cellular ecosystem. The signaling relationships between BCC epithelial cells and fibroblasts revealed a WNT5A-inflammatory signature that led to the discovery of a HSP70-specific protective mechanism that is necessary to maintain tumor growth. Further characterizing these types of responses may provide additional mechanistic insight into the complicated crosstalk between the tumor and its microenvironment and provide additional avenues for therapeutic suppression of cancer.
Methods
Copy number variation analysis.
To infer genomic copy number structure, we performed InferCNV (version 1.7.1) as per developer’s suggestions using standard parameters (https://github.com/broadinstitute/inferCNV/wiki). We used a cutoff of 0.1 for the minimum average read counts per gene among reference cells. We used non-immune, non-epithelial, and non-appendage epithelial cells as internal reference control.
Marker gene module scoring.
Aggregate marker gene module scores were assigned to early epithelial differentiation, late epithelial differentiation, and BCC identity score using the AddModuleScore function in Seurat with the following conditions enabled: ctrl = 2.5 or 5. Basal, non-differentiating and basal late differentiating epithelial cells were identified by implementation of a “Early differentiation” and “Late differentiation” signatures defined by a core set of known markers as previously described. BCC cells were identified by implementation of a BCC signature defined by a core set of known markers as previously described. Hedhehog- and WNT-active and responsive cells were identified by implementation of a “Hedgehog signaling aggregate score” or “WNT signaling aggregate score” defined by a core set of known HH and WNT ligands and receptors, respectively as previously described in GSEA. Hedhehog and WNT-active/responsive cells were colored distinctly. Double-positive cells were color-coded based on a blend threshold score. Aggregate marker gene module and blend threshold scores were Log-normalized and visualized in two-dimensional feature plots.
RNA dynamics analysis.
To calculate RNA dynamics in single cells we performed RNA velocity analysis. First, we generated loom files using the Python script velocyto.py (Python version 2.7.2) for each individual library. Loom files for individual libraries from a particular condition (normal or tumor skin) were combined using loompy (version 2.0.16). Velocity vectors were estimated using scVelo (version 0.2.2) based on the linear or dynamic model of RNA velocity with default parameters. Velocity vectors were overlaid on a two-dimensional embedding. Predicted root and terminal states based on Markovnikov reaction diffusion were calculated. Root and terminal states were visualized on a two-dimensional embedding.(SCvelo)
Pseudotime analyses.
Pseudo-ordering of individual fibroblasts (FIBs) from peri-tumor skin (PTS) or basal cell carcinoma (BCC) was performed using Monocle2 (Version 2.10.1). Briefly, FIB cells from PTS or BCC trajectory 1 were subclustered and a cellDataSet object
was created in Monocle2
with the function newCellDataSet
with the following arguments enabled: lowerDetectionLimit = 1.0, expressionFamily = negbinomial.size()
. Subclustered FIBs were ordered based on variable features and DDRTree-based dimensionality reduction
was performed using the reduceDimensions function
. To identify differentially expressed pseudotime-dependent transcription factor changes, we applied single cell Energy path
(scEpath; Version 1; MATLAB Version 9.5) on Monocle2-ordered PTS or BCC FIBs
. Statistically significant pseudotime-dependent gene changes were identified by comparing the standard deviation of the observed smoothed expressions with a set of similarly permuted expressions by randomly permuting the cell order (nboot = 100 permutations). We considered all genes with a standard deviation greater than 0.01 and a Bonferroni-corrected P-value below a significance level α = 0.05 to be pseudotime-dependent
. Human transcription factors were identified using the Animal Transcription Factor Database (AnimalTFDB 2.0) by enabling the TF_Ifo.human.Symbol function
. Pseudotime-dependent genes were represented and visualized using a rolling wave plot with user-defined optimal K-means clustering.
Cell-cell communication analysis
使用 CellChat基于大量配体-受体对转录物对细胞-细胞通讯网络进行建模。为了推断相邻细胞和肿瘤细胞之间的细胞间通讯网络差异和相似性,我们从个体条件下对上皮细胞和成纤维细胞进行了subcluster。感兴趣的细胞组被合并、标准化并用作 CellChat 的输入。我们分别用identifyOverExpressedGenes (thresh.p = 0.05) 和identifyOverExpressedInteractions 函数计算了过度表达的基因和显著的配体-受体相互作用。我们使用了 CellChat 提供的配体-受体对的人类数据库。使用computeCommunProb 计算通信概率(tresh = 0.05,nboot = 100,Hill 函数参数kn = 0.5)并使用computeCommunProbPathway 和默认参数(tresh = 0.05)推断信号通路级别的蜂窝通信网络。我们过滤掉了每组至少有 5 个细胞的细胞间通讯。聚合的细胞 - 细胞通信网络是使用默认参数使用aggregateNet (tresh = 0.05) 计算的。为了识别相邻和肿瘤数据集中的保守和诱导/扰动通信网络,我们进行了联合流形和分类学习分析。
Gene Regulatory Network analysis.
基因调控网络在 Python 环境(3.7 版)中使用 pySCENIC(0.10.2 版)建模。我们使用了预先定义的人类转录因子 (TF) 列表 (https://github.com/aertslab/pySCENIC/blob/master/resources/hs_hgnc_tfs.txt) 并通过 GRNBoost2 推断它们与其推定的目标基因之间的调节相互作用.我们专注于激活模块并将它们用于下游查询。我们基于来自 TSS (hg38__refseq-r80__10kb_up_and_down_tss.mc9nr.feather) (https://resources.aertslab.org/cistarget/) 的 10kb 假定调控区域边界的排序和恢复方法进行了 cisTarget 基序富集。 AUC 指标用于评估基因恢复和调节子活性,并用于降维。如前所述,通过将调节子特异性分数 (RSS) 转换为 Z 分数,将调节子在成纤维细胞/成纤维细胞样细胞中的活性相互比较,并在不同条件下进行比较。使用 iRegulon (http://iregulon.aertslab.org) 从网络推理输出中识别特定于 Regulon 的模块。 Regulon 目标与不同条件下特定cluster中差异表达的基因相关。
生活很好,有你更好