单细胞108篇文献解读之8---Cell differentiation trajectory predicts patient potential immunotherapy response...

单细胞测序太贵?那不如挖掘公共数据库发4分+SCI

大家好!今天跟大家分享的文献是2021年2月发表在Aging (IF=4.831)杂志上的一篇文章。文章利用scRNAseq数据和bluk RNA-seq数据鉴定到3个细胞分化亚型并构建胃癌患者预后风险打分模型,基于该模型将患者分为高风险组和低风险组。

题目:Cell differentiation trajectory predicts patient potential immunotherapy response and prognosis in gastric cancer

细胞分化轨迹预测胃癌患者的潜在免疫治疗反应和预后

摘要

本研究的目的是研究胃癌(GC)细胞的分化轨迹和临床相关性并基于GC分化相关基因(GDRGs)构建预后风险打分模型来预测患者总生存期(OS)。整合分析GC样本的scRNA-seq数据和bulk RNA-seq数据。细胞分化轨迹分析鉴定到3个具有明显分化状态的subsets,subset Ⅰ/Ⅱ涉及代谢紊乱,subset Ⅱ与缺氧耐受有关,subset Ⅲ与免疫相关通路有关。基于GRDG将GC样本分为三个分子亚型并发现基于细胞分化的分子亚型可以准确预测患者OS,临床病理特征,免疫浸润状态和免疫检查点基因表达水平。构建了一个8个GRDG的预后RS模型并发现高风险组的OS较差。整合GDRG的RS预后模型和临床病理特征构建列线图,该列线图具有较高的准确性。本研究强调了胃癌细胞分化在患者临床结果和潜在免疫治疗反应方面的意义并提出了一个有前途的胃癌治疗方向。

流程图

image

结果

1. 数据的获取和整理

从GEO数据库下载scRNA-seq数据GSE112302,该数据包含6个样本的402个GC细胞。从TCGA数据库下载32个正常组织和406个GC样本的bulk RNA-seq数据。从GEO数据库下载包含433个GC样本的数据集GSE84437。

2. scRNA-seq数据质控和标准化

对scRNA-seq数据进行质控,过滤掉2个细胞(图1A),测序深度和线粒体基因序列数没有相关性(图1B),测序深度和细胞序列数呈正相关(图1C),共鉴定到16288个基因(图1D)。

3. 细胞轨迹分析鉴定到三个GC subsets

PCA分析表明GC细胞没有发生明显分化(图1E),因此使用前18个PCs进行下一步分析(图1F)。tSNE分析将400个GC细胞分为8个簇,差异分析鉴定到3339个marker基因,将排名10%的基因绘制聚类热图(图1G)。对8个簇进行注释,其中簇0,1,2,3,4,6和7为癌细胞,簇5为巨噬细胞。轨迹分析表明簇1为subset Ⅰ,簇0,2和3为subset Ⅱ,簇5和7为subset Ⅲ(图1H和1I)。

image

4. 基于GRDGs的功能分析

subset Ⅰ中鉴定到402个GC分化相关基因(GDRGs),subset Ⅱ中鉴定到1443个GDRGs,subset Ⅲ中鉴定到1016个GDRGs。GO和KEGG分析表明subset Ⅰ/Ⅱ涉及mRNA分解代谢过程和能量代谢紊乱(图2A-2D),subset Ⅱ与缺氧耐受有关(图2C和2D),subset Ⅲ与炎症和免疫相关通路有关(图2E和2F)。

image

5. 基于GDRG的GSE84437数据集GC患者的分子亚型

对数据集GSE84437进行基于GDRG的一致性聚类分析,将GC样本分为三个分子亚型(图3A-3C)。Kaplan-Meier分析表明C1的总生存期(OS)最好而C3的总生存期最差(图3D)。从C1到C3,患者的年龄降低,患者大多为T期和N期,而性别没有明显差异(图3E)。三个subsets中上调或下调的GDRGs与C1,C2和C3中的GDRGs具有相同趋势(图3F-3H)。

image

6. 对这三个分子亚型进行肿瘤微环境打分和免疫细胞浸润分析

在C1,C2和C3中免疫打分和基质打分升高(图4A和4B)而肿瘤纯度逐渐降低(图4C)。使用CIBERSORT算法分析各个样本中22类免疫细胞所占比例(图4D)。差异分析表明C1中记忆激活CD4+ T细胞,M0巨噬细胞和激活的NK细胞较多(图4E)。C2和C3中memory resting CD4+ T细胞,resting肥大细胞和naive B细胞较多(图4E)。这些细胞浸润程度越高则OS越差(图4G)。

image

7. 三个分子亚型的38个免疫检查点基因(ICGs)表达水平和预后分析

差异分析表明有10个ICGs在C1中显著高表达(图5A),上调的CD80,CTLA4,TNFRSF9,IFNG,LDHA和TNFSF9与OS较好有关(图5B)。在C2中有5个ICGs上调表达(图5A),Kaplan-Meier分析表明高表达的VTCN1,JAK1和LAMA3可以预测OS较差(图5C)。在C3中有9个ICGs显著高表达(图5A),Kaplan-Meier分析表明LDHB和TNFSF4表达水平与OS较差有关,而PTPRC可以预测OS较好(图5D)。

image

8. 构建,评估和验证预后风险打分模型

将GDRGs与GSE84437数据集取交集得到1729个GDRGs随后进行WGCNA。共得到9个模块,其中有6个模块与GC阶段显著相关(图6A-6E)。6个模块中共得到258个差异表达GDRGs(图6F),单因素Cox分析和多因素Cox分析得到33个预后相关GDRGs(图6G)。最后,构建8个GDRGs的预后风险打分模型。RS= (0.00048 * VCAN) + (- 0.00096 * TNFAIP2) + (0.00125 * STMN2) + (0.00027 * RNASE1) + (0.00013 * DUSP1) + (0.00082 * AQP2) + (0.00205 * ADAM8) + (0.00006 * TFF1) 。

image

对GSE84437数据集的样本计算风险打分,低风险组的OS较好(图7A和7B)。此外,预测1年,3年和5年OS的ROC的面积分别为0.695,0.66和0.701(图7C),GSE94437的面积分别为0.605,0.593和0.604(图7D)。图7E为预后模型中8个GDRGs的表达水平。

image

9. 构建和评估列线图预测患者3年和5年OS

单因素分析表明年龄,TNM阶段,N期和RS与患者预后有关(图8A)。年龄较大的患者临床病理分期较晚,RS较高,预后较差。多因素分析表明,年龄和RS是患者的预后独立因素(图8B)。基于TCGA队列,结合4个预后因子构建预测患者3年和5年的列线图(图8C)。ROC曲线面积分别为0.727和0.730(图8D)。校准曲线表明列线图预测效果较好(图8E)。

image

结论

本研究基于scRNA-seq数据鉴定到3个分化状态不同的GC细胞亚群,基于GDRGs的分子亚型可以准确预测患者OS,临床病理特征,肿瘤微环境打分,免疫浸润程度和ICG表达水平。结合预后模型和临床病理特征构建列线图可以准确预测患者OS。本研究强调了胃癌细胞分化在预测患者临床结果和潜在免疫治疗反应方面的意义,并提出了一个有前景的胃癌治疗方向。本研究的亮点在于作者结合scRNAseq数据和bluk RNA-seq数据构建预后模型,但也存在一定限制,例如本研究是基于TCGA和GEO数据集构建预后模型还需要大量的临床研究验证该模型的准确性和有效性。

版权声明:本文转自“生信发文助手,文章转载只为学术传播,不代表本号观点,无商业用途,版权归原作者所有,如涉及侵权问题,请联系我们,我们将及时修改或删除。

WOSCI沃斯编辑由耶鲁大学博士团队匠心打造,专注最新科学动态并提供各类科研学术指导,包括:前沿科学新闻、出版信息、期刊解析、论文写作技巧、学术讲座、SCI论文润色等。

作者:WOSCI沃斯编辑
链接:https://www.jianshu.com/p/825304c7033c

你可能感兴趣的:(单细胞108篇文献解读之8---Cell differentiation trajectory predicts patient potential immunotherapy response...)