23-基于代谢基因进一步识别和PTC相关的预后模型

一.研究背景

在肿瘤发生过程中,会发生代谢组学相关的重编程,但在现有研究中,去分化甲状腺癌(DDTC)中代谢相关基因的表达模式仍然未知,这篇文章找到了和分化甲状腺癌(DDTC)代谢相关的基因标志物。在此,为大家介绍一篇:Transcriptome analyses identify a metabolic gene signature indicative of dedifferentiation of papillary thyroid cancer发在ONCOIMMUNOLOGY 杂志上的关于免疫的文献【J Clin Endocrinol Metab   2019.4.3  IF:5.605  通讯作者:Qinghai Ji     通讯作者单位:上海复旦大学医学部癌症研究中心】

甲状腺乳头状癌(PTC)是去分化的甲状腺癌(DDTC)中最常见的组织学类型[1],大多数的PTC是不易复发且能够被治愈的,但有5%-20%的患者会出现复发的情况[2],有一些还会进一步恶化甚至死于该疾病。在Ben Ma等人之前发表的工作中,他们发现甲状腺乳头状癌的去分化是导致其预后差的原因[3]。同时,虽然有几项关于从基因组层面对PDTC和甲状腺未分化癌(ATC)的研究,这些研究表明分化良好的甲状腺癌是通过积累一些重要基因的突变,如TERT和TP53突变,进而从逐步肿瘤进展(WDTC)到PDTC最终发展成ATC的[4-6],但PTC去分化的分子机制仍未澄清。之前的研究在甲状腺癌中发现了代谢组学特征的改变、一些氧化应激反应的介质和异常的脂质代谢。代谢组学的分析可以有助于对恶性甲状腺结节的准确诊断和实现对PTC远端转移和癌症干细胞的预测。因此,在上海复旦大学癌症研究中心头颈外科和肿瘤科的Ben Ma等研究员的研究中,他们试图去找到与PTC分化相关的代谢基因,且进一步识别和PTC预后相关的代谢基因.

二.材料和方法

该工作的研究思路如Fig 1所示。

Fig 1. 流程图

1.甲状腺癌数据:FUSCC数据集作为训练数据集,包括5个PDTC,5个PTC和6个NT(normal thyroid); GEO数据库中下载甲状腺癌芯片数据,即:GSE29265,GSE33630,GSE53157,GSE65144和GSE76039;在UCSC Xena数据库下载TCGA甲状腺癌表达数据(n=502)。

2. GEO平台数据处理:对芯片表达谱进行背景校正和RMA标准化处理,Combat去批次,探针注释到基因,当多个探针注释到同一个基因,取均值。

3.识别与DDTC相关的代谢基因:从KEGG数据库中收集70条代谢相关通路,整合通路中的基因,共得到1466个候选代谢基因。在FUSCC数据集中,通过分别计算PDTC v.s. PTC以及PDTC v.s. NT的Fold change值和p值,得到在这两个比较集中都显著上调和显著下调的基因(|FC|≥1.5 & p<0.05),并进一步和在GSE29265和GSE33630两套数据集中的失调基因取交集,得到在DDTC中显著失调的基因。

4.识别预后相关的signature:基于单因素cox回归分析,首先识别和预后相关的代谢基因和临床以及其他的突变特征(如BRAFV600E等特征);再通过多因素回归分析进一步识别可以作为独立预后因素的代谢基因。将在多因素cox检验中可以作为独立的预后标志物的代谢基因挑选出来,作为影响甲状腺癌预后的特征基因。

5.风险模型的构建:结合TCGA甲状腺癌,利用上述预后相关基因构建风险模型,采取中位数值作为阈值将样本划分高低风险组。在TCGA数据集以及整合的GEO数据集(包括GSE29265,GSE33630,GSE53157,GSE65144和GSE76039)中分别去刻画高低风险组,并计算该预后模型分别在TCGA数据集以及整合的GEO数据集中的曲线下面积AUC值,进而评价该预后模型的性能。

6.功能富集分析(GSEA):为验证这风险模型中所构成的代谢基因signature的功能,根据上述的风险得分公式将TCGA样本所划分成的高低风险标签作为phenotype label,70个代谢相关的KEGG通路作为背景基因集,利用GSEA软件随机1000次去完成基因功能的富集分析。

7.代谢基因对生存的影响:在Gepia数据库(http://gepia.cancer-pku.cn/index.html)验证这些代谢相关基因的高低表达对甲状腺癌病人的DFS和OS的影响。

三.结果展示

1.识别和验证在DDTC相关的代谢基因:在FUSCC数据集中,通过|FC|≥1.5 & p<0.05,我们获取在PDTC v.s. PTC和PDTC v.s. NT中共显著失调(上调和下调)的121个基因(81个下调基因和40个上调基因)(如图 Fig 2b),并进一步和GSE29265和GSE33630两套数据集中识别到的上调和下调基因取交集,最终得到了在DDTC中27个上调和38个下调基因,共65个失调基因(如图 Fig 2c所示)。

Fig 2. 失调代谢基因

2.构建预后风险模型:基于单因素分析,我们从上述的65个失调代谢基因中找到49个和生存相关的候选基因集以及T3/T4 stage、LNM和BRAFV600E mutation。进一步整合这49个基因和T3/T4 stage、LNM和BRAFV600E mutation这些特征构建多因素cox回归模型,发现LPCAT2、ACOT7、HSD17B8、PDE8B以及ST3GAL1这5个基因可以作为独立的预后标志物,并利用这5个基因构建风险评估模型(如下所示),我们发现该风险模型和甲状腺癌差的预后相关(如图 Fig 3d)。通过在TCGA数据集以及整合的GEO数据集(包括GSE29265,GSE33630,GSE53157,GSE65144和GSE76039)中计算AUC值去评价该预后模型,在TCGA数据集中的AUC=0.9,在整合数据集中的AUC=0.79(如Fig 3所示)。

Fig 3. LPCAT2、ACOT7、HSD17B8、PDE8B以及ST3GAL1这5个基因构成的标志物与PTC差的预后相关

3.高低风险组病人特征刻画:对依据上述预后模型划分的高低风险组病人进行诸如年龄、性别、T stage,TERT突变特征以及相应LPCAT2、ACOT7、HSD17B8、PDE8B以及ST3GAL1这5个基因表达分布的刻画,通过图中的展示,发现高风险组的病人显著发生BRAFV600E的突变。

Fig 4. TCGA数据集中高低风险组病人相关临床和分子特征的刻画

4.基因功能的刻画:在TCGA样本表达谱中,映射得到LPCAT2、ACOT7、HSD17B8、PDE8B以及ST3GAL1这5个基因表达谱数据,70条代谢相关的KEGG通路作为背景基因集,预后风险模型对样本划分的高低风险作为phenotype label,循环1000次,去看这5个基因所参与的生物学功能(如图 Fig 5所示)。

Fig 5. 代谢基因标志物的功能. a)在TCGA数据集中GSEA刻画代谢基因所参与的功能;b-d) LPCAT2,ACOT7和HSD17B8所参与的代谢功能

参考文献:

1. Aschebrookkilfoy B, Ward M H, Sabra M M, et al. Thyroid Cancer Incidence Patterns in the United States by Histologic Type, 1992–2006[J]. Thyroid, 2011, 21(2): 125-134.

2. Schlumberger M. Papillary and follicular thyroid carcinoma.[J]. The New England Journal of Medicine, 1998, 338(5): 297-306.

3. Ma B, Xu W, Wei W, et al. Clinicopathological and Survival Outcomes of Well-Differentiated Thyroid Carcinoma Undergoing Dedifferentiation: A Retrospective Study from FUSCC[J]. International Journal of Endocrinology, 2018.

4. Landa I, Ibrahimpasic T, Boucai L, et al. Genomic and transcriptomic hallmarks of poorly differentiated and anaplastic thyroid cancers[J]. Journal of Clinical Investigation, 2016, 126(3): 1052-1066.

5. Ibrahimpasic T, Xu B, Landa I, et al. Genomic alterations in fatal forms of non-anaplastic thyroid cancer: Identification of MED12 and RBM10 as novel thyroid cancer genes associated with tumor virulence[J]. Clinical Cancer Research, 2017, 23(19): 5970-5980.

6. Pozdeyev N, Sokol E S, Hartmaier R J, et al. Genetic analysis of 779 advanced differentiated and anaplastic thyroid cancers[J]. Clinical Cancer Research, 2018, 24(13): 3059-3068.

7. Pavlova N N, Thompson C B. The Emerging Hallmarks of Cancer Metabolism.[J]. Cell Metabolism, 2016, 23(1): 27-47.

8. Caria P, Tronci L, Dettori T, et al. Metabolomic Alterations in Thyrospheres and Adherent Parental Cells in Papillary Thyroid Carcinoma Cell Lines: A Pilot Study[J]. International Journal of Molecular Sciences, 2018, 19(10).

9. Huang F, Li J, Jiang L, et al. Serum‐plasma matched metabolomics for comprehensive characterization of benign thyroid nodule and papillary thyroid carcinoma[J]. International Journal of Cancer, 2019, 144(4): 868-876.

往期分享

21-Deep learning (DL)一种基于多组学构建肝癌患者分型的新算法

22-从DNA损伤修复以及分析亚型角度分析膀胱癌中的免疫调节

24-基于免疫相关基因构建肝癌免疫预后模型(IPM)

25-多组学分析鉴定腺癌突变与免疫预后的关系

你可能感兴趣的:(23-基于代谢基因进一步识别和PTC相关的预后模型)