7+纯生信,单细胞识别细胞marker+100种机器学习组合建模,机器学习组合建模取代单独lasso回归势在必行!

影响因子:7.3

研究概述:

皮肤黑色素瘤(SKCM)是所有皮肤恶性肿瘤中最具侵袭性的类型。本研究从GEO数据库下载单细胞RNA测序(scRNA-seq)数据集,根据原始研究中定义的细胞标记重新注释各种免疫细胞,以确定其特异性标志。接着通过计算免疫细胞通信网络,结合对通信网络的大量分析和通信模式的识别,对所有网络进行了定量表征和比较。最后基于bulk RNA测序数据,使用机器学习训练了枢纽通讯细胞的特定标记物,开发了新的免疫相关预后组合。

机器学习目前在肿瘤和非肿瘤生信中越来越常见,不管是构建模型还是筛选关键基因,都有很出色的发挥。想做类似分析的朋友,欢迎交流!

研究结果:

一、T细胞和B细胞是SKCM免疫微环境中的主要细胞成分

1. 使用scRNA-seq数据集获得2106个免疫细胞,使用t-SNE算法实现降维和无监督聚类并选择0.8作为最佳分辨率,观察到最大分叉簇(图1A)。t-SNE算法揭示了13种不同的细胞簇(图1B)。


2. 使用“singleR”函数注释了7种免疫细胞,“plotScoreHeatmap”函数显示所有参考标签中所有细胞的得分,以检查整个数据集预测标签的置信度(图1C)。

3. 作者注释了5种类型的免疫细胞簇:簇0,6,8,11为CD8 + T细胞,簇1,4,9为CD4 + T细胞,簇2,3为B细胞,簇5,10为单核细胞和树突状细胞,簇7为NK细胞(图1D)。在16个样本中,5种主要类型免疫细胞的数量和比例表现出高度的相似性,表明T细胞和B细胞是SKCM免疫微环境的主要组成部分(图1E、F)。


二、单核细胞是免疫通信网络中传入和传出信号的主要贡献者

1. 作者在七个免疫细胞组中观察过表达的配体或受体及其相互作用,以确定免疫细胞之间的相互作用(图2A)。圆形图显示了任两个细胞群之间的相互作用时间和相互作用的一般强度,与其他免疫细胞相比,单核细胞在免疫通讯网络的输入和输出信号中贡献最大(图2B-D)。不同免疫细胞组对输入和输出信号的贡献信号明显不同(图2E)。


2. 结合表观和剪影指数来识别6种传出和5种传入模式(图3A, D)。此外,输入和输出信号是细胞特异性的,而T细胞、CD8+ T细胞和NK细胞的传入信号具有相似性(图3B, E)。图3C, F显示了传出和传入模式的不同信号对各种细胞群的贡献程度。


三、MRS表现出稳健的DSS预测性能

1. 由于单核细胞在细胞通讯中占主导地位,故采用LOOCV框架将TCGA-SKCM中与其他免疫细胞相比在单核细胞中特异性高表达的87个生物标志物拟合到101个预测模型中。

2. 在所有验证数据集中计算每个模型的C指数。最佳模型组合是CoxBoost和stepCox(both)具有最高的平均C指数(0.638)(图4A)。最终建立了8基因单核细胞相关特征(MRS),包括8个基因C1QA,DAB2,F13A1,FCGR2A,FCGRT,HMOX1,IFITM3,SOD2。

3. 在训练数据集TCGA-SKCM中发现低风险组拥有相对较长的无进展生存期(PFS)(图4B)。高危组在训练数据集、外部验证数据集GSE65904和GSE54467中的疾病特异性生存期(DSS)明显较低(图4C-E)。

4. MRS识别的1年、3年和5年PFS(图4F)和DSS(图4G-I)的曲线下面积(AUC)值证明MRS是一种有效的的预测工具,具有稳定性和强度及良好的特异性和敏感性。

5. 单因素Cox回归分析显示MRS、年龄、分期、T分期、N分期与DSS密切相关(图4J)。

多因素Cox回归分析显示,MRS可作为SKCM患者的独立预后因素(图4K)。

该时间依赖性C指数表明MRS优于常规临床变量(图4L)。

DCA解释了与常规临床变量相比,MRS可以确切地使患者受益(图4M)。


6. 在三个单细胞外部数据集(GSE123139(图5A),GSE120575(图5B),GSE72056(图5C)中,八个MRS基因表达最密集的细胞类型被确认为单核细胞,进一步证明MRS的稳定性和可重复性。


四、转录组定义的亚类在生物学上不同,免疫浸润在统计学上与更有利的预后相关

1. 七种免疫浸润算法具有一致性,高危组免疫细胞浸润始终较少(图6A)。风险评分与淋巴细胞和M1巨噬细胞的细胞含量呈显著正相关(图6B)。

2. 在SKCM的免疫亚型中,低风险组IFN-γ显性亚型的患者明显更多,而淋巴细胞枯竭亚型的患者较少(图6C)。ssGSEA结果一致显示低危组具有更好的免疫功能(图6D)。


3. 免疫滤过与较好的预后之间有统计学相关性。七个数据集的通路分析有力地证实了高、低风险人群的生物学独特性。低危组淋巴细胞活化、抗原呈递等相关通路被激活,而高危组在黑色素形成、角化等相关通路显著富集(图7A)。

4. HLA、免疫检查点、趋化因子和共刺激分子在低危组高表达(图7B)。此外,包含18种转录因子的细胞调控子活性谱突出了高、低风险组之间可能存在的调节模式差异(图7C)。


五、IFITM3是MRS的核心基因,在SKCM中高表达

1. 使用“mgeneSim”函数发现MRS中的关键基因IFITM3(图8A)。

2. 作者利用TISCH数据库,在所有10个SKCM单细胞数据集中,定位IFITM3在免疫和非免疫细胞中的表达情况。IFITM3不仅在单核巨噬细胞中高表达,而且在微环境中的非免疫细胞和黑色素瘤细胞中也高表达(图8B)。

3. 通过HPA数据库的免疫组化数据发现IFITM3在SKCM中的蛋白水平表达也高于正常皮肤(图8C, D)。


研究总结:

本研究创新地整合了scRNA-seq和Bulk RNA-seq以及机器学习工具,8基因单核细胞相关特征(MRS)被描述并被证实是一种潜在的生物标志物。此外还探讨了SKCM中通信网络的概况,并描述了特定的标记物IFITM3和不可或缺的细胞-单核细胞。研究结果为破译TME和揭示SKCM的生物学机制提供了启示。

你可能感兴趣的:(7+纯生信,单细胞识别细胞marker+100种机器学习组合建模,机器学习组合建模取代单独lasso回归势在必行!)