Cancer Letters|早期肺腺癌复发signature

今天跟大家分享的是四月份发表在Cancer Letters杂志(IF:6.508)上的一篇文章Clinical significance and inflammatory landscapes of a novel recurrenceassociated immune signature in early-stage lung adenocarcinoma,文章主要讲的是基于LASSO算法和逐步的Cox比例风险回归模型来识别早期LUAD样本的预后相关基因,并在另外两套独立数据集中验证。根据预后相关基因构建的风险评分可将患者分为高、低风险组,与预后显著相关。

Clinical significance and inflammatory landscapes of a novel recurrenceassociated immune signature in early-stage lung adenocarcinoma

早期肺腺癌一种新的复发相关免疫特征的临床意义和炎症特点

一、摘要

本文的工作是使用LASSO算法识别到能预测早期LUAD复发的基于免疫基因集的特征基因,首先在TCGA的338个早期LUAD训练集中进行逐步的Cox比例风险回归模型来识别基因,然后在226个GEO 和68个独立的早期LUAD样本中验证。这个分类系统对不同临床和突变亚群的预后有很强的预测作用。该特征对早期LUAD患者的复发具有高度预测作用,可作为进一步优化癌症免疫治疗的有力预后工具。


二、数据及方法

1. 样本及数据

(1)TCGA的338例早期(肿瘤I期、II期)LUAD样本的RNA-seq数据

(2)GEO的226例 LUAD样本(GSE31210)的mRNA表达数据和临床数据

(3)从2014年1月到8月的郑州大学第一附属医院的68例早期LUAD病理诊断样本。使用TRIzol试剂从冷冻样本中提取RNA,然后使用Prime Script™RT试剂盒将总RNA样品反转录为单链cDNA,用于qRT-PCR。qRT-PCR用于检测样本中9个IBRS基因的表达。表1展示样本的临床信息。

(4)免疫相关基因集:从AmiGO 2 Web portal(http://amigo.geneontology.org/amigo/landing)下载。

 表1.68例早期LUAD样本的临床特征


2. 特征识别和统计分析

使用单变量Cox比例回归模型识别与无复发生存期(RFS)相关的免疫基因表达。然后使用最小绝对值收敛和选择算子(LASSO)方法在Cox回归模型中确定重要的预后基因,确定一个标准误差(SE)。为了使模型更加优化和实用,使用了逐步Cox比例风险回归模型。

基于预后免疫相关基因的表达对样本构建风险评分Risk score = (exp Gene1 * coef Gene1) + (exp Gene2 * coef Gene2) + … +(exp Gene9 * coef Gene9)。将早期LUAD患者按照给定的风险评分分为高风险组和低风险组。使用Kaplan-Meier 和two-tailed log-rank检验评估高低风险组的RFS和总生存期(OS)的差异。所有统计学方法均以P < 0.05为有意义。


3. 预后 meta分析

使用STATA软件对三套样本进行预后meta分析,采用随机效应模型计算了pooled HR值


三、 结果解读

1. 基于TCGA样本构建早期LUAD 基于免疫基因集的复发特征(IBRS)

在TCGA样本中,单变量Cox比例回归模型发现232个免疫相关基因与RFS相关(P < 0.05)。232个免疫相关基因的详细表达模式如图1A所示。对这些基因的GO和KEGG富集分析这表明这些基因主要参与先天免疫反应和炎症信号通路(图1B和C)。使用LASSO Cox回归模型计算最有用的预后基因,并选择一个高于最低标准的SE,得到一个有11个基因的模型:TGFBR1、DYNC1I2、LGR4、THOC1、ADAM10、SERPINB6、CCL20、WNT2B、SLC11A1、MAPT和PSEN1(图1D和E)。

图1.早期LUAD样本识别预后免疫相关基因


为了优化该模型,使其只包含最具预测性的基因,接下来使用逐步Cox比例风险回归模型,最终确定了9个基因。对每个病人计算风险评分,将TCGA样本根据优化后的风险值分为高风险组和低风险组(图2A),生存分析显示,高风险组的复发率明显高于低风险组(图2B)。然后通过计算ROC曲线下面积来评估预测性能,结果显示,对于预测1年、3年和5年的TCGA复发,IBRS曲线下面积(AUC)分别为0.775、0.789和0.789(图2C)。当只看I期患者时,IBRS能够将患者分为RFS差异显著的亚组(图2D),II期患者中高的免疫相关风险评分与较差的RFS相关(图2E)。

 图2.在TCGA训练集中构建用于判断LUAD早期复发的免疫相关基因特征


2. GEO数据集验证IBRS

根据上述方法确定的风险评分,将GEO的样本分为高风险组(N = 61)和低风险组(N = 61)(图3A)。生存分析显示,低风险组患者的RFS明显好于高风险组(图3B)。I期患者中,IBRS可明显区分高、低风险组不同的RFS(图3C),然而,IBRS仅在II期患者中显示出RFS的边缘性差异,可能是由于样本量有限(图3D)。此外,高风险组患者的OS明显短于低风险组(图3E)。

 图3.在GSE31210中验证免疫相关特征基因的预后效能


3. 在不同临床亚组的验证IBRS

将TCGA早期LUAD样本根据三个临床特征(性别、吸烟和年龄)进行分组。结果显示,在所有亚组中,高风险组患者的RFS和OS比低风险组患者的更短,GSE31210 数据集中也是这种情况。然后分析免疫基因风险评分在D.N. Hayes, et al.发布的三种肺腺癌表达亚型magnoid, squamoid和bronchioid中的分布,发现bronchioid亚型表现出明显的高风险评分。将这三种亚型的患者分别分为高风险组和低风险组,在所有分子亚型中,高风险患者的RFS明显低于低风险患者。


4. 不同EGFR或KRAS突变状态患者中验证IBRS

EGFR和KRAS是肺腺癌常见的突变基因,与不同的肿瘤免疫微环境相关。首先分析TCGA训练集中高、低风险组的EGFR 和KRAS突变状态。结果显示,与EGFR野生型相比,EGFR突变型低风险患者比例较高。相反,与KRAS野生型组相比,KRAS突变型组具有更高的高风险患者比例。在不同突变状态下,高风险组RFS和OS明显缩短。GSE31210样本也得到相同结果。


5. IBRS的炎症概况和免疫检查点景观

接下来是探究不同的免疫相关特征基因与不同的复发风险之间的内在联系。首先,分析了7组metagenes(代表不同的炎症和免疫反应,有HCK、IgG、Interferon、LCK、MHC-I、MHC-II和STAT1这七组)与IBRS之间的关系。图4A展示TCGA数据集中metagene表达情况。然后使用基因集变异分析(GSVA)(一种非参数的无监督分析方法,主要用来评估芯片和转录组的基因集富集结果)来解释这些关系。接下来使用Pearson相关计算样本的风险评分与7组metagenes的相关性,图4B展示TCGA数据集中相关性r值分布。分析显示,风险评分与IgG、Interferon、STAT1呈正相关,与LCK、和MHC-II呈负相关。在GSE31210数据集中也做了相同分析(图4C和D),风险评分与Interferon、STAT1、MHC-II和LCK相关,表明IBRS与干扰素和干扰素相关的信号转导密切相关。两套样本的风险评分与IgG之间缺乏相关性,可能是由于肿瘤样本的瘤内免疫异质性。

 图4.早期LUAD风险评分与炎症反应的关系


由于风险评分与炎症活性密切相关,接下来分析了特异性免疫表型的差异水平,包括免疫细胞浸润和免疫检查点。图5A和B分别展示使用CIBERSORT评估TCGA和GSE31210样本的高低风险组的免疫细胞表达情况。在两组患者中,高风险组中活化的CD4记忆T细胞和M1型巨噬细胞的比例显著升高,静息肥大细胞的比例显著降低。图5C和D展示在TCGA和GSE31210样本中对30个免疫检查点分子表达情况,发现了4个免疫检查点(B7-H3、4-1BB、OX40L和IDO1),在两组患者的高风险组中均表达上调。

 图5.早期LUAD的风险评分与免疫功能的关系


6. 冷冻组织样本验证IBRS

对68例早期肺腺癌患者冷冻组织样本使用相同的公式,计算每个患者的风险评分,将患者分为高风险组和低风险组(N = 34和34)(图6A)。高风险组和低风险组之间的RFS存在显著差异(图6B)。此外,I期或II期患者的风险评分对RFS的预测有显著性差异(图6C和D)。高风险组患者的OS明显低于低风险组(图6E)。为了调查这三套患者样本(n = 632)的综合预后价值,使用STATA软件进行了预后meta分析。结果显示IBRS是早期LUAD患者肿瘤复发的重要风险因素。

 图6.独立68个冷冻组织样本中验证免疫相关特征基因的预后效果


7. IBRS是早期LUAD患者的独立风险因素

在TCGA训练样本中进行了单变量和多变量Cox回归分析。结果表明,经年龄、性别、吸烟史、T分期、淋巴转移、TNM分期、EGFR和KRAS突变情况调整后,IBRS是RFS和OS的重要独立预测因子(表2)。GSE31210的结果也一致证实IBRS对RFS和OS 的预测价值独立于其他因素。在68个独立样本中,同样的也证实IBRS对RFS和OS 的预测价值。

 表2. TCGA样本的IBRS与其他特征的单变量和多变量Cox回归分析

总结:

本文的工作是将TCGA 的早期LUAD复发样本作为训练集,基于LASSO算法和逐步的Cox比例风险回归模型来识别到一组基于免疫基因集的复发特征基因,然后对样本构建风险评分,划分高、低风险组,分析发现风险评分与FPS和OS显著相关,并在GEO的LUAD样本中验证。接下来在不同临床亚组、肺腺癌亚型和不同EGFR 和KRAS突变状态分组下高、低风险组与RFS和OS的相关性。然后分析高、低风险组与不同的炎症和免疫反应的关系。最后在68例早期肺腺癌样本中进行验证高、低风险组与FPS和OS相关性。通过单变量和多变量Cox回归分析证明IBRS是早期LUAD患者的独立风险因素。

你可能感兴趣的:(Cancer Letters|早期肺腺癌复发signature)