7+纯生信,基于肿瘤微环境的分型分析,不蹭热点的分型怎么做,值得学习!

发表杂志:Cellular Oncology

影响因子:7.051

本文属于单肿瘤分型思路,类似的分型文章我们也解读过很多。

肿瘤分型文章比较重要的结论就是分型后构建的评分能够预测免疫治疗或者其他治疗的疗效。可以用于分型的基因集很多,结合热点做分析会事半功倍,现在上车正是时候!

生信分析咨询

请关注生信小课堂,全网同名

研究概述:

该研究旨在描绘直肠癌(RC)完整的TME景观,包括非免疫特征。作者提出了一种基于免疫和非免疫成分丰度的亚型策略,将所有RC患者分为4种亚型,即免疫亚组,典型亚组,干细胞样亚组和休眠亚组。其次,将WGCNA和LASSO回归相结合,基于不同亚型间差异表达的基因构建10个基因标记来预测预后和免疫治疗反应。按该特征划分的亚组也表现出不同的临床参数和对免疫检查点阻断的反应。本文应用多种机器学习算法,实现更高的生存预测精度,并结合M分期和年龄进一步建立列线图,以提供准确、直观的预后预测。

流程图

首先评估免疫和非免疫细胞在结直肠癌(CRC)组织上的细胞相互作用,并揭示它们与预后的相关性。

随后从所有RC患者中确定了四种独特的微环境亚型,并揭示它们的生物学特征。

接着通过WGCNA和LASSO回归基于微环境特征的差异生成了一个简洁的特征。

最后在不同的数据集中测试了这种退化的亚型系统,并验证不同亚组之间临床结果、突变特征和微环境水平的差异。

研究结果:

一、TME细胞之间的相互作用

1、作者首先使用单细胞数据将样本分成16个不同的簇,热图显示每个细胞簇的前3个特征基因,通过SingleR包把细胞分为6个不同的类别(图1B)。

2、受体-配体-转录因子相互作用的预测表明每个细胞类别之间普遍存在细胞相互作用(图1C),特别是对于受体与其他细胞的配体进行细胞通讯的上皮细胞。

3、上皮细胞和其他细胞之间的相互作用影响肿瘤进展(图1D)。例如,B-上皮,NK-上皮或单核细胞 - 上皮细胞之间的相互作用分别修改了Hippo信号通路,ErbB信号通路和细胞衰老。T-上皮相互作用也影响铂类耐药性和PD1-PDL1相关途径。

二、基于TME的直肠癌分子亚型

1、作者从已有得研究中获取TME成分得signature。代表TME中不同细胞类型的主要生物标志物包括19种免疫相关成分(例如免疫细胞,免疫相关途径和免疫反应),9种非免疫基质细胞和7种上皮细胞(表1)。

2、使用ssGSEA算法,根据其特征生物标志物的表达注释每个TCGA-READ患者中TME成分的丰度。发现肌成纤维细胞、杯状细胞、杯状祖细胞和潘氏细胞的浸润水平与RC患者的总体生存状态相关(图S1D-G),表明非免疫成分对肿瘤进展的作用。

3、基于ssGSEA的分层聚类将患者分为4个亚组(图S2,图2A)。

亚组1(免疫)表现出最高的免疫和非免疫基质细胞丰度,亚组2(典型)表现出中等免疫和非免疫基质细胞水平。亚组3和亚组4保留的免疫细胞数量最少,与亚组3(休眠)对比,亚组4(干细胞样)表现出较低的非免疫基质细胞丰度和较高的癌症干细胞和杯状细胞水平。

4、在Pearson相关性分析中,Paneth细胞与巨噬细胞和许多其他免疫细胞的浸润密切相关,肌成纤维细胞、干细胞、血管内皮细胞、血小板、间充质细胞、成纤维细胞和周细胞呈正相关(图2B),表明基质细胞浸润可能与细胞干性有关。

5、应用tSNE分析进行降维(图2C),获得了与分层聚类分析(图2A)相似的结果。用ESTIMATE对不同亚组的患者进行微环境相关评分:免疫亚组表现出最高得分,而干细胞样亚组表现出最低分(图2D)。不同TME亚型的患者表现出不同的生存曲线,免疫亚组在前两年的预后最差,而干细胞样亚组在三年后表现出更多不良结果(图2E)。

三、不同TME亚型的分子特征

1、突变数据显示,不同TME亚型具有相似的最常见突变基因列表,即APC和TP53,最常见的突变类别是错义突变(图2F)。

2、尽管排名靠前的突变基因具有一致性,但四个亚组的详细突变谱各不相同(图S3A-D)。免疫组的患者表现出最高的SYNE1和LRP1B突变频率,而Canonical组表现出相对较高的FAT4和RYR1突变频率。休眠组的特征突变基因为NRAS,而干细胞样组的KRAS和PIK3CA突变率最高(图S3E)。

3、不同亚组的患者也表现出不同水平的DNA修复相关途径(图S4A),强调不同TME亚组之间基因组突变状态的异质性。

4、免疫亚组的患者表现出TME相关通路的最高富集水平,其次是规范亚组。尽管休眠组和干细胞样组表现出相似程度的免疫相关成分(例如CD8 T效应器和免疫检查点),但干细胞样组表现出较低的上皮-间充质转化(EMT)和PAN-F-TBRS(泛成纤维细胞TGF β反应特征)水平。(图S4B)

5、HLA蛋白,免疫相关刺激物,免疫相关抑制剂和微环境分子的水平在不同亚组之间有所不同(图2G-H)。TCIA的结果显示四个亚组的患者表现出不同的免疫反应预测,包括抗PD1,抗CTLA4和两者的组合(图2I)。

四、基于WGCNA-LASSO的退化TME子分型方法的构建

1、通过WGCNA分析将DEG划分为不同的模块,患者主要分为5个模块。不同模块与不同微环境因素和临床特征相关(图3B)。

2、作者对预后基因进行了皮尔逊相关性分析。相关评分高于0.5的基因通过Cytoscape软件可视化(图3C)。其他GO和KEGG分析显示,不同组的患者具有不同的免疫细胞粘附,细胞外组织,稳态和免疫相关信号通路的富集状态(图3D,E)。

3、基于这些结果,选择的基因表现出不同的微环境状态和高正交性。最后,选择19个基因进行套索回归,属于5个不同的模块(MRAP,PLUNC:黄色模块; IL7R、DEGS1、BCL6、DHRS11 和 FAM129A:蓝色模块; KIF13A、ADAMTSL4、TIMP1、PDGFRA和FNBP1:绿松石模块; WNT5A、RRAGD、MYL9、ACTG2 和 HCP5:棕色模块; EDIL3 和 CFL2:灰色模块)。然后生成10个基因标记(图3F),将每个患者的风险评分确定为每个基因的总和乘以相应的系数(图3G)。

4、TCGA队列中的患者按中位风险评分分为高风险组和低风险组(图4A)。高危组患者的总生存率低于低危组(图4B)。

5、1年和3年生存率的AUC验证了签名的准确性,分别为0.848和0.948(图4C)。校准曲线显示,实际生存状态与预测非常相似(图4D)。

6、采用不同的机器学习算法来预测5年的生存状态。为避免过度拟合,随机选择一半样本作为训练集,并使用整个样本作为测试组。与所有算法集成的10基因在预测5年总生存状态方面是稳健的(图4E)。该特征还预测了RC患者的DFS(图4F)和PFS(图4G)。

7、其他临床因素如年龄、阳性淋巴结状态和远处转移也与预后相关(图4H)。通过整合所有风险因素发现10基因特征评分是RC患者预后的独立因素(图4I)

六、通过 GSE17537 和GSE161158 验证 TME signature

1、使用两个GEO数据集进行验证。根据中位风险评分将患者分为高风险组和低风险组。GSE17537结果显示,高危组患者的总生存期(OS;图5A)和无病生存期(DFS;图5D)比低危组更差。通过1年、3年和5年的AUC验证了signature的准确性,在OS(图5B)和DFS(图5E)中均表现出良好的预后性能。校准曲线进一步表明,实际预后结果与预测结果吻合良好(图5C,F)。

2、在GSE161158中,高危组患者的DFS也比低危组更差(图5G)。该模型的1 年、3 年和 5 年 AUC 值分别为 0.641、0.680和 0.657(图 5H)。校准曲线显示实际预后结果与预测吻合良好(图5I)。

3、GSE161158中风险评分升高的患者与晚期肿瘤分期密切相关,表明这种特征与肿瘤进展相关(图5J)。作者还通过将其与其他临床因素相结合,验证了这种10基因标记作为独立的预后因素(图5K,L)。

七、TME标志的特点及其临床应用

1、风险评分增加的患者与晚期肿瘤分期、肿瘤大小增长和淋巴结转移相关(图6A-D)。

2、利用GSEA来揭示该特征的生物学特征。高危组主要富集RNA定位和mRNA转运(图6E),低危组在代谢过程、抗原加工和内源性抗原呈递方面相对富集(图6F)。

3、与TME分类相比,高危患者与免疫组和Stem样组匹配更紧密,而低风险患者与规范组和休眠组匹配更紧密,低风险患者与POLE和GS类别更匹配(图6G)。

4、TCIA的预测表明抗PD1免疫疗法对低风险组的效果更好(图6H)。风险评分较高的患者不仅在两个数据集中表现出较差的预后(图6I,K),而且对抗PDL1(图6J)和抗PD1(图6L)治疗的反应也较差。因此,作者建议将这种10基因组合作为基于免疫检查点的免疫疗法的有效预测工具,特别是对于PD1 / PDL1阻断。

5、此外,作者发现化疗药物(例如伊马替尼和索拉非尼)的有效性也可以通过签名来预测。低风险组的患者对这些化疗药物表现出较低的IC50值(图6M-P)。

6、对突变谱的分析显示最常见的突变基因列表在很大程度上由两个亚组共享(图6Q,R)。与低风险组(图6R)相比,高风险组(图6Q)的总体突变率相对较低。

7、在签名中的10个基因中,DEGS1和RRAGD在高危组中上调(图7A,B)。这两个基因的上调与较高的风险程度相关(图7C,D)。

8、DEGS1 / RRAGD过表达与肿瘤分期(图7E,F)和肿瘤大小(图7G,H)之间存在很强的相关性。在I期肿瘤中观察到RRAGD的下调(图7F),与此一致的是,T4中的RRAGD表达明显高于T1-3(图7H)。

9、TIMER分析显示,DEGS1与CD8T细胞、巨噬细胞、中性粒细胞和树突状细胞的浸润相关(图7I);RRAGD表达与CD4T细胞,巨噬细胞,中性粒细胞和树突状细胞的浸润相关(图7J)。

10、在大多数亚群中高危组的存活率比低风险组更差(图8A-L)。作者将该特征与年龄和M分期相结合,构建诺姆图来预测RC患者的生存期(图8M)。ROC曲线显示1年,3年和5年的AUC分别为0.875,0.957和1.000(图8N)。从校准曲线推断出患者的实际生存期,与预先建立的列线图(图8O)预测相似。

研究总结:

作者确定了上皮细胞和免疫细胞之间的明显相互作用,确定了肌成纤维细胞、杯状细胞、杯状祖细胞和潘氏细胞的丰度作为预后相关因素。根据TME的整体特征(免疫相关成分,非免疫基质细胞和上皮细胞),将所有RC患者可以分为免疫,典型,休眠和干细胞样四种亚组。

不同RC亚型之间临床特征和预后的差异使作者可通过仅包括10个DEGs来建立一个稳健而简洁的模型,从而为预后和免疫治疗反应提供预测。通过无监督聚类建立的非预定义四个亚型和相应的10基因预后模型都有助于理解RC异质性,有助于RC患者的临床分层并辅助临床决策过程。

你可能感兴趣的:(7+纯生信,基于肿瘤微环境的分型分析,不蹭热点的分型怎么做,值得学习!)