挖掘结直肠癌免疫预后特征基因

哈喽,大家好~

今天又给大家带来一篇

今年8月新鲜出炉的免疫预后基因挖掘方案

请速速收藏~

                                —  题目:结直肠癌免疫预后特征基因的鉴定和验证 —

1、研究思路

筛选显著差异、显著生存相关、免疫相关基因,建立预后模型,验证预后模型,分析预后特征与临床特征的关系,分析预后特征与免疫细胞浸润的相关性,分析预后特征的肿瘤突变负荷(TMB)分析。

2、方法和结果

2.1 差异免疫基因筛选

作者从TCGA数据库收集了结直肠癌的癌组织和癌旁组织样本表达数据,用R语言的“edgeR”包计算了癌和癌旁组织的差异基因列表(图A)。从ImmPort数据库收集了免疫相关基因列表。然后将差异基因与免疫相关基因列表取交集,得到差异免疫基因(图B)。最后,作者对差异免疫基因进行了GO和KEGG功能分析(图CD)。

2.2 生存相关IRGs的筛选和TF调节网络的构建

作者首先将TCGA的结直肠癌样本按照1:1分为训练集和测试集,基于训练集样本的表达数据和临床信息,用单因素Cox回归分析,筛选了显著与总体生存相关的基因。生存相关的基因列表与差异免疫相关基因列表取交集,筛选到24个显著差异、显著生存相关、免疫相关基因。然后作者从Cistrome Cancer数据库收集了转录因子列表,结合上述差异表达基因分析结果,筛选到77个显著差异表达的转录因子。最后,基于相关性评分> 0.4,p值< 0.05为筛选原则,构建了包含23个转录因子和12个免疫相关基因的网络。

2.3 建立预后模型

Lasso-Cox回归分析,进一步将24个显著差异、显著生存相关、免疫相关基因缩减至16个。用这个16个基因构建预后模型。后面就是常规操作,训练集病人分组,生存分析(C),ROC曲线(D)。

测试集和总数据集验证(A-H)

2.4 外部数据验证模型

作者用两组GEO数据进行了验证,效果都很好。

2.5 预后特征与临床特征的关系

作者用TCGA和两个GEO数据库的数据,分别用单因素和多因素Cox回归分析,显示年龄、性别、分期、肿瘤分级、风险评分和总生存率之间的关系,说明风险评分可作为预后的独立因素。

2.6 GSEA分析

常规操作,探究高风险和低风险病人群中富集的通路。

2.7 预后特征与免疫细胞浸润的相关性分析

分析高风险和低风险病人免疫细胞浸润的差异。发现CD4 memory resting T cells (p = 0.001), activated dendritic cells (p = 0.027) 和 resting dendritic cells (p = 0.044)三种细胞在低危组比例较高。NK cells(p = 0.031)在高危组比例较高。22个免疫细胞比例的相关性不高。

2.8 预后特征的肿瘤突变负荷(TMB)分析

计算高风险和低风险病人的TMB分数,发现高风险病人的TMB显著高于低风险病人(A),并且高TMB的病人预后更差(图B),BRAF突变与高TMB水平(p = 1.621e-22)和高风险评分相关(CD),顺手再画个突变的瀑布图(EF)。

本篇文章的分析方法不算新颖,文章中的图片相信大家在其他文章里也有看到。但是作者能熟练运用各种方法挖掘基因,挖掘出的基因能完美地通过内部数据和外部数据验证,真的是很难得的。

你可能感兴趣的:(挖掘结直肠癌免疫预后特征基因)