疾病和肿瘤联合的纯生信分析套路

今天小编和大家分享的是EBioMedicine上的一篇关于食管鳞癌亚型预后模型的文章

The prognostic significance of metabolic syndrome in esophageal squamous cell carcinoma and identify six lncRNA-signature for predicting the risk of survival

代谢综合征在食管鳞状细胞癌中的预后意义及识别6个用于预测生存风险的lncRNA。

一. 材料方法

1.1 研究人群及代谢综合征的定义

研究涉及了179名食管鳞状细胞癌(ESCC)样本的临床信息以及RNA芯片数据,作者根据2004年中国糖尿病学会的标准对代谢综合征(MetS)进行了定义,标准为:肥胖、高血糖、高血压、血脂异常。

1.2 相关数据收集

179名上文提及的患者的lncRNA+mRNA芯片数据(GSE53625),TCGA数据库的ESCC, ECA等癌型的表达谱数据。

1.3 食管癌患者的免疫浸润和基质评分

使用CIBERSORT这种去卷积的算法进行免疫浸润情况以及基质评分分析,算法使用547个基因的特征矩阵来表示22种类型的浸润免疫细胞。尤其关注Mets不同状态下的浸润和评分情况。(GSE53625)

1.4 识别ESCC中MetS相关的 lncRNA 和模型构建

(1)metS vs no mets,筛选出差异基因和差异lncRNA。

(2)WGCNA分析,筛选lncRNA富集的功能模块。

(3)1+2中的候选基因用于lasso进行降维。

(4)多重cox回归筛选特征和模型构建。

最终构建了6-lncRNA的分类模型。

1.5 评估模型在不同亚组中的效果。

为了评估模型在不同ESCC亚组的效果,作者将具有或者不具有Mets、肿瘤等级、TNM分级以及转移与否状态划分成不同亚组,用来进行模型的效果评估。

1.6 Mets 组功能富集分析与PPI网络构建

通过基因内共表达的分析,可以更好地了解分子的功能和通路。因此,作者使用加权基因共表达网络分析(WGCNA)来找出基因模块与MetS组之间的关系。利用最相关的模块基因,通过STRING数据库和Cytosacpe软件构建蛋白-蛋白相互作用(PPI)网络。

二. 研究的主要内容和结果

2.1 Mets与生存的关系

在文章的第一部分作者首先分析了Mets与生存的关系,所以比较了患有和未患有MetS的患者的临床特征,发现他们的总体存活率明显较低(图1a)。但是其他临床特征没有显著差异(表1)。进一步研究作者发现Mets患者的RFS更低(图1b)。 

图1a 患有和未患有MetS的ESCC患者的OS生存分析


表1 临床特征分层分析的部分展示

图1b 患有和未患有MetS的ESCC患者的RFS生存分析


2.2 单因素和多因素COX分析研究MetS组OS情况

在这一部分作者采用单因素和多因素COX分析来研究MetS对OS的影响。单变量Cox分析显示,患有MetS和未患有MetS的患者的OS存在明显差异。而结合多种临床特征的多因素cox分析结果如表2所示。

表2 单因素和多因素分析中发现代谢综合征(MetS)与总生存率的关系


2.3 MetS组相关基因表达及功能富集分析

如前所述,代谢综合症相关的生物学机制,如肥胖、胰岛素抵抗、炎症和雌激素信号等影响癌症的发生与发展。因此,作者从MsigDB和相关文献中选择了机制相关的基因集,以发现其是否有不同的表达。高Mets组与低Mets组的差异表达基因如图2a所示。接下来,作者使用WGCNA分析差异表达mRNA。首先计算基因模块与临床状态的关系,然后选择与MetS相关的基因模块(图2b),分析功能富集情况。结果表明,细胞外基质和细胞外基质组织相关通路均显著富集(图2c)。构建前 50 hub基因的PPI网络,如图2d,2e所示。表明Mets对肿瘤预后的影响可能与上述机制有关。

图2a ADIPOQ、IGF1、IGFALS、CSF mRNA表达水平


图2b 基因模块与临床统计学的关系


图2c 基因模块的功能富集分析结果

 图2d 前50 hub 基因的PPI网络

 图2e 前 50 hub 基因的功能富集结果


2.4 MetS组免疫浸润和基质评分与临床状态的关系

在这一部分作者分析免疫浸润和基质评分。结果显示,各种免疫细胞的表达存在显著差异(图3a)。接着使用主成分分析区分肿瘤组织与正常组织(图3b)。研究发现Mets 的巨噬细胞M2浸润水平较高(图3c)。对于间质评分,分析了Mets、T期、N期、TNM期、肿瘤分级等临床状态,仅Mets具有显著的临床意义(图3d),间质评分较高,且与功能富集结果一致。这些结果提示,MetS可能与微环境变化有关并且影响肿瘤生长。

图3a 肿瘤与正常组织的免疫浸润情况

 图3b 肿瘤和正常组织的主成分分析(PCA)

 图3c 多数患者有大量巨噬细胞浸润

 图3d MetS患者的基质细胞分数较高

 

2.5 六个lncRNA特征的识别与预后效果验证

在这一部分作者通过WGCNA,发现lncRNA模块(MEgrey、MEblue、MEbrown、ME turquoise)与MetS的相关性最大(图4a),因此选择了4个模块lncRNA分析其与总生存期的关系。最后作者得到一个六个lncRNA的特征评估患者的预后风险(图4b),进一步评估发现高低风险组具有显著差异(图5a,b)。并且作者在验证集中对特征进行了验证(图5c,d)(验证部分数据包括TCGA中的该癌症的数据集,还有其他癌型的数据集,同时包括作者之前的数据,主要用于验证模型对预后效果评估。)。

图4a 应用WGCNA分析lncRNA模块与临床状态的关系

 图4b 六个lncRNA特征的森林图


图5a 训练集中高低风险组的生存分析

 图5b 训练集中6个lncrna特征的热图分布

 图5c 验证队列中高风险和低风险患者OS的Kaplan-Meier生存分析


图5d 患者的风险得分分布

你可能感兴趣的:(疾病和肿瘤联合的纯生信分析套路)