肾透明细胞癌:WGCNA+PPI+免疫浸润+预后分析

今天跟大家分享的是有关于一篇用WGCNA识别肾透明细胞癌免疫浸润细胞相关marker的一篇文章,内容比较丰富值得借鉴。


基因共表达网络鉴定CD8 + T细胞浸润相关生物标志物在透明细胞肾细胞癌中的作用

首先让我们通过摘要了解一下这篇文章的主要内容,透明细胞肾细胞癌(ccRCC)是成年人中极为常见的一种肾癌,并且免疫疗法和靶向疗法在治疗ccRCC方面特别有效。在这里,作者应用加权基因共表达网络分析和量化免疫细胞细胞组成的反卷积算法来分析从GEO中下载的ccRCC表达数据,并鉴定与CD8 + T细胞相关的模块。通过共表达网络和蛋白质-蛋白质相互作用网络分析鉴定了十个hub基因(LCK,CD2,CD3D,CD3G,IRF1,IFNG,CCR5,CD8A,CCL5和CXCL9)。作者还分析了TCGA中的数据集发现这些hub基因在肿瘤组织中上调,能促进肿瘤的发展。接下来通过Kaplan-Meier分析和Oncomine  meta分析后选择CCL5作为预后生物标志物,并通过实验证明了CCL5的低表达减少了ccRCC细胞系中的细胞增殖和侵袭。最后作者进行了各种分析和验证证实了CCL5是与ccRCC中CD8 +T细胞浸润有关的潜在生物标志物和治疗靶标。


一.材料和方法

1.1基因表达数据和预处理

从GEO中获得ccRCC  RNA表达数据(GSE73731),其中包含265个样本有关的数据。使用R包limma对数据进行归一化处理。

1.2肿瘤浸润免疫细胞的评估

作者使用R包“ CIBERSORT”来估算GSE73731样品中免疫细胞的比例即计算22种TIIC的比例。这个算法可用于从复杂的组织表达谱中统计估计细胞亚群的相对比例,是一个估计混合组织中特殊细胞丰度的有用工具。

1.3共表达网络构建

作者使用R包“WGCNA”对4411个基因构建权重共表达网络。具体来说,首先,基于成对基因之间的Pearson相关值,将单个基因的表达水平转换为相似矩阵。接下来,将相似矩阵转化为邻接矩阵。然后采用一种动态混合切割方法,将具有相似表达模式的基因分类到不同的模块中。

1.4构造模块特征关系

作者应用pearson检验计算模块特征基因和T细胞浸润水平之间的相关性,并选择了p值显著并且相关系数高的T细胞亚型和模块并定义为中心模块。

1.5通路富集分析

为了确定基因在已识别的hub模块中的功能,作者使用“ Metascape”进行通路和过程富集分析。

1.6识别hub基因

根据hub模块中每个基因的模块连通性和临床特征关系选择了候选hub基因。这里面模块连通性指的是基因之间的pearson相关性的绝对值(Module Membership)。临床性状关系指的是每个基因与性状之间的pearson相关性的绝对值(Gene Significance)。作者将Module-Membership > 0.8 和  Gene-Significance > 0.5定义为候选的hub 基因。同时在hub模块中选择了所有基因并使用STRING数据局来构建PPI网络并寻找中心节点(节点连通性>15)。接下来使用Cytoscape展示了网络并进行了Venn分析以比较PPI网络中的候选hub基因和中心节点。

1.7验证hub 基因

在这里面作者使用了两个基于TCGA的免疫相关数据库来验证这些hub基因。首先是基于TIMER中的数据获得了每个ccRCC样本中CD8 +T细胞的含量。接下来计算了CD8 +T细胞的浸润水平与中枢基因表达之间的Spearman相关性,并使用R包“ ggstatsplot”比较结果。第二个是搜索了TISIDB数据库来确定hub基因和TIIC之间的Spearman相关性。最后使用R包“ pheatmap”来对结果进行展示。

1.8免疫和临床特征鉴定

从TISIDB数据库中获得hub基因与不同免疫因子之间的Spearman相关性。作者使用STRING和Cytoscape选择与平均相关系数大于0.5的hub基因相关的免疫因子来构建网络。接下来从TCGA中下载了ccRCC的RNA表达数据和临床数据来探索hub基因的临床特征。Wilcoxon秩和检验分析了正常样本和肿瘤样本之间差异表达。最后绘制了箱线图来显示基因与临床特征之间的关系,并通过Kruskal-Wallis检验分析统计学意义。

1.9 Kaplan-Meier分析和Oncomine meta分析

作者通过R包“ survminer”的将患者分为高表达和低表达组并通过R包“survival”进行Kaplan-Meier分析。从Oncomine数据库中使用了四个独立的微阵列数据集来进行meta分析来验证hub基因的表达模式。

1.10 GSEA

根据基因表达的中位数,将样本分为两组,进行“ c2.cp.kegg.v7.0.symbols”基因集富集分析。

接下来就是实验部分了,首先进行了细胞培养和siRNA-PTEN构建,然后进行了RNA提取和定量RT-PCR,最后是细胞增殖分析与侵袭实验。

二.结果展示

2.1 RNA表达数据

该研究的技术路线如图1所示。

图1.技术路线

在这里作者从GEO中获得了265 个ccRCC样本的RNA表达数据。获得了数据集中肿瘤样本的所有数据,并选择了变异系数值大于0.1的4411个基因用于进一步分析。

2.2肿瘤浸润免疫细胞(TIIC)的评估

应用CIBERSORT来分析RNA表达数据以评估每个样本的不同细胞亚型的丰度。使用R包“ CIBERSORT”计算了22个TIIC的分数。然后,选择每个样本中T细胞的七个亚型的分数作为WGCNA的性状数据。

2.3 ccRCC基因共表达网络

在这一部分,作者应用“WGCNA”包对4411个基因构建了共表达网络并对GSE73731的样本聚类(补充图1)。

 补充图1.样本聚类(GSE73731):样本树状图和特征指标

接下来作者选择了β = 3的软阈值(图2A,2B)构建了无标度网络,并使用动态混合切割构建了层次聚类树,其中树上的每片叶子代表一个基因,具有相似表达的基因靠在一起,形成树的一个分支,代表一个基因模块。最后生成了九个模块(图2C)。

图2. 选择适当的beta值以构造层次聚类树


2.4识别hub模块以及富集分析

模块特征基因与T细胞浸润的相关性如图3A所示。在这九个模块中绿色模块与T cells CD8,T cells CD4 memory activated,T cells gamma delta高度相关。黄色模块与activated T cells CD4 memory activated有更高的相关性。其他模块与T细胞之间的相关性小于0.5。这里面作者关注的是与CD8 + T细胞相关的绿色模块,将其识别为hub模块。接下来作者使用网络工具“ Matascape”分析该模块中包含的基因以进行通路和过程富集分析。图3B中显示了20个与免疫相关的最显著富集的terms。

 图3.关键模块和功能说明

2.5 hub基因的识别和验证

根据阈值标准(Module-Membership > 0.8 and Gene-Significance > 0.5),作者选择了30个基因作为候选的hub基因(图4B)。从PPI网络中根据节点的度>15鉴定了30个基因为中心中心节点并通过Cytoscape进行了可视化(图4A)。最终选择了在以上两种方法中出现的10个基因为hub 基因(LCK,CD2,CD3D,CD3G,IRF1,IFNG,CCR5,CD8A,CCL5和CXCL9)(图4C)。

图4.识别hub基因


接下来作者为了研究这些hub基因与CD8 +T细胞之间的关系,在TIMER数据库中分析了这些基因的表达数据。结果显示其中9个基因的表达值与CD8 +T细胞的浸润水平呈正相关(图5A)。作为示例,作者在图5B中显示了CCL5表达和CD8 + T细胞浸润水平的散点图。然后查询了TISIDB数据库发现hub基因和肿瘤浸润淋巴细胞之间呈正相关。其中激活的CD8 +T细胞(Act CD8)和效应记忆CD8 + T细胞(Tem CD8)的相关性值最高(图5C)。这些结果验证了已鉴定的hub基因与CD8 +T细胞浸润水平密切相关,并在免疫微环境中发挥了重要作用。

图5. 验证hub基因以及PPI图的构建

2.6免疫和临床特征的确定

在这一部分,作者在TISIDB数据库中搜索了这10个hub基因的表达与免疫因子表达的Spearman相关性并通过热图进行了展示(补充图2)。

 补充图2. 免疫因子与hub基因之间相关性的热图

作者确定了38个与免疫相关的因子,这些免疫相关因子与10个hub基因的平均相关性大于0.5。接下来作者基于10个hub基因和38个免疫相关因子构建了一个免疫浸润相互作用网络以此来利用STRING数据库探索CD8 +T细胞的浸润机制。结果导入了Cytoscape进行了可视化(图5D)。

接下来作者从TCGA中获得了ccRCC的10个基因的表达水平。Wilcoxon秩检验显示这些基因在肿瘤组织中的表达水平高于正常组织(图6A-6J)。火山图也显示了同样的结果(图6K)。

 图6. TCGA的转录数据中的hub基因的差异表达

Hub基因与病理分期之间的关系如图7A所示。所有hub基因的表达水平在病理分期阶段均表现出显著差异,并且随着阶段的增加而呈上升趋势。最后是肿瘤等级与hub基因之间的关系(图7B)。其中LCK,CD2,CD3D,IFNG,CD8A和CCL5与肿瘤不同等级显示显著相关性,等级增加对应于基因表达的增加。

图7.TCGA数据集中的hub基因和临床指标分析


2.7 识别预后生物标志物

作者通过Kaplan-Meier分析分析了10个hub基因,其中CCL5和IFNG的高表达患者的生存预后较差(图8A,8B)。为了验证肿瘤和正常组织中10个基因的差异表达,使用Oncomine对四个数据集进行了meta分析(图8C)。结果表明这些基因在肿瘤组织中表现出明显的过表达,这与TCGA数据集分析相一致。通过这两个分析,选择CCL5作为进一步分析的预后生物标志物。

图8. Kaplan-Meier分析和Oncomine meta分析


2.8 CCL5基因集富集分析

在这一部分,根据CCL5表达中值,将TCGA的ccRCC样本分为高低表达组,以进行通路基因集富集分析。结果表明,CCL5高表达组的样本富集到免疫相关的通路中共23个(图9A,9B)。

 图9. GSEA和CCL5实验

2.9敲低CCL5显著抑制细胞增殖和侵袭

由于以上分析表明CCL5在ccRCC中过表达并且与不良预后有关,因此在这一步作者进行功能性实验来探讨CCL5的潜在生物学功能。首先,作者使用小干扰RNA降低了肾细胞癌细胞系769-P中CCL5的表达水平(图9C),并通过Cell Counting Kit-8(CCK-8)评估了细胞的增殖能力。结果显示CCL5敲低后细胞系增殖能力降低(图9D),侵袭能力下降(图9E)。

好啦,今天的分享到这就结束了,文章做了一系列的生信分析筛选了癌症免疫浸润相关的marker最后结合实验来验证结论。总的来说文章内容相对于一般做WGCNA的分析要多,文章的图做的也很好看,值得学习。明天再见啦~

你可能感兴趣的:(肾透明细胞癌:WGCNA+PPI+免疫浸润+预后分析)