生信分析 ▏高分单基因纯生信

哈喽,大家好!你们见过全文只有2张图的SCI吗?还是IF 27+的那种!今天小编为大家带来一篇今年11月发表在Molecular Cancer的单基因泛癌分析(虽然是letter),题目为Hiding in the dark: pan-cancer characterization of expression and clinical relevance of CD40 to immune checkpoint blockade therapy,影响因子27分+!总以为纯生信不好发了,单基因也没有多大研究意义,泛癌分析好像也烂大街了……哎,眼瞅着别人纯生信单基因泛癌分析又发27+,真的是柠檬树上柠檬果,柠檬树下你和我!

杂志封面图

数据来源

老规矩,先看数据来源~不过这篇文章的数据来源好像有点独树一帜的风格,本文采用的是TCGA / TARGET / GTEx RNA-Seq联合数据集,包括3个单独数据库的数据,如下:

1)TCGA:众所周知,TCGA数据库是目前最综合最全面的肿瘤数据库,收录了来自20000个病人,33个癌症的数据。包括患者的临床样本信息以及测序数据(包括基因组,转录组,表观遗传,蛋白组等各个组学数据)。

2)TARGET:2018年上线的新肿瘤数据库,主要针对儿童肿瘤,包含RNA、WGS、WES、CNV、甲基化等测序结果,同时具有比较完整的临床信息。

3)GTEX:第一个收集了多个人体器官mRNA测序的数据库,包括来自449名生前健康的遗体捐赠者44个不同器官的测序数据,覆盖面非常广。

TCGA数据库综合全面、权威,但是缺点就是正常组织样本的测序数据非常少;而GTEx可以非常好地弥补这个缺点,GTEx的最大优势就在于正常组织样本的测序数据非常多。相比于TCGA,TARGET针对的面窄了一些,但同时也意味着,它的内容更具针对性,同时也是一个比较新的数据库,可以在一定程度上为文章注入新的血液,毕竟老生常谈的那些常见生信数据库也被挖掘的差不多了,如果这个时候在文章中增加一个新的数据库,会让读者眼前一亮。本文的一大特色之处就是联合使用这3个数据库,两两互补,在经典的基础上进行了创新。

结果解读

本文虽然是27+的水平,但是它的结果部分却非常简单,仅仅只有2张组图而已,小编今天就带大家“看图说话”。

1.CD40与1型抗肿瘤反应和良好预后有关

第一张组图分3个小图,主要讲述了CD40的表达与I型抗肿瘤T细胞反应和生存率呈正相关。

图1


图1A是通过UCSC Xena网站获取了TCGA/TARGET/GTEx这3个数据库中正常和肿瘤组织中指定基因(下文会提到的一些与CD40相关的markers)的表达数据,并绘制了热图。这里有必要讲一下“UCSC Xena”这个在线网站:它是一个对多种常用的生信数据库的数据进行二次开发的衍生网站,收录了TCGA、ICGC、TARGET、GTEx等多个数据库的公共数据。相信对于很多做生信分析的小伙伴来说,并不是专业的“码农”,所以无论是数据下载还是后期的数据处理,都是我们的一大痛点。而UCSC Xena正好解决了我们这个难题,这个在线网站基本上保留了原有数据库的所有数据,还对数据进行了整理,我们可以直接下载使用,基本上能满足我们做生信的大多数需求。在本文中作者就是通过UCSC Xena下载数据,并利用联合数据库中可用的转录组数据和相应的正常组织数据一共确定了23种癌症类型,用于以下的研究。

图1B分析了CD40 mRNA表达与其配体(CD40LG)以及一些markers的相关性,并绘制了秩相关矩阵,主要目的是为了分析CD40的表达与I型抗肿瘤T细胞反应的关系,这些markers主要是肿瘤中的一些免疫细胞、可能发生的反应以及细胞增殖与死亡的生物标记物。贴心的小编猜测你可能并不关心具体是哪些makers以及最终的结果,所以小编就用“需要用放大镜才能看到的”字体展示了。

markers包括MHC(HLA-DRA),树突状细胞(BATF3),B细胞(PAX5),巨噬细胞(CD68),粒细胞(主要是嗜中性粒细胞,CD177),T细胞(CD4和CD8A),I型抗肿瘤反应(IFNG和GZMB),细胞增殖(MKI67),细胞死亡(BAX),细胞活力(正常(n = 8152)和癌症(n = 10137)组织中的BCL2)和II型促肿瘤反应(IL5)。结果发现,CD40在正常组织和肿瘤微环境中均与CD40LG适度共表达。在正常组织中,CD40与I型反应(IFNG,r= 0.33;GZMB,r= 0.37)和抗原呈递(HLA-DRA,r = 0.53),T辅助细胞Th(CD4,r= 0.41)呈正相关,而与细胞毒性T细胞(CD8A,r= 0.19)相关性不明显。与细胞增殖(MKI67)最相关的是CD40LG(r = 0.61)和促凋亡标志物BAX(r = 0.56),这表明CD40/CD40LG轴在免疫细胞更新和体内平衡过程中具有重要作用。CD68(巨噬细胞)而不是CD177(嗜中性粒细胞),在正常(r = 0.42)和肿瘤(r = 0.38)组织中与CD40呈正相关。此外,CD68(巨噬细胞)与抗原呈递反应高度相关(HLA-DRA,正常和肿瘤组织中的r = 0.71和0.60),并且与GZMB适度相关(在正常和肿瘤组织中分别为0.54和0.47)。在TME中,发现CD40表达与I型反应(HLA-DRA,r = 0.46),T细胞(CD4,r = 0.44;CD8A,r = 0.48)和APC反应(IFNG,r = 0.40;GZMB,r = 0.45)呈中度相关。此外,CD40与正常(r = 0.30)和肿瘤(r = 0.36)组织中的BATF3(树突状细胞)呈中度相关。相比之下,CD40LG与PAX5(B细胞,正常和肿瘤组织中的r = 0.45和0.46分别)适度相关,但与BATF3(树突状细胞)无关。在肿瘤中,APC标志物HLA-DRA(MHC分子),BATF3(树突状细胞),PAX5(B细胞)和CD68(巨噬细胞)与CD8A,IFNG和GZMB呈正相关(r>0.3)。总之,这些结果表明,虽然CD40 / CD40LG信号可能由APCs以上下文依赖性的方式介导的,但它与T细胞介导的细胞毒性作用(CD8A,IFNG和GZMB)有关。观察到的CD40表达与I型抗肿瘤T细胞反应之间的关联可能部分由TME中的CD40、CD8 T细胞引起,因为CD40激活是其记忆生成的基础。CD40/C40LG与TME中的细胞死亡(BAX)或细胞存活(BCL2)标志物之间没有相关性。此外,CD40/CD40LG轴与正常或癌组织中的II型促肿瘤反应(IL5)没有相关性。

图1C通过Xena平台构建了以CD40四分位数分层的总生存Kaplan-Meier图。

结果显示,肿瘤中的高CD40表达与癌症患者更好的生存率有关。

2.CD40靶向RAS/RAF/PI3K,与免疫治疗相关

第二张主图分5张小图,主要描述了CD4在不同癌症中的表达水平和相关的通路及其在免疫检查点阻断治疗反应中的预测价值。

图2

图2A是在23种癌症类型中分析了CD40的表达水平。

结果显示,与相应的正常组织相比,CD40在11种恶性肿瘤中下调,包括脑癌,乳腺癌,肺癌,结肠癌,卵巢癌,食道癌,皮肤癌,前列腺癌,子宫癌,子宫内膜癌和血癌。而在5种恶性肿瘤(甲状腺,睾丸,头颈,肾上腺和肾脏)中CD40表达升高。

图2B验证了CD40在黑素细胞痣(简称“痣”)样本中的表达,并使用NCBI-GSE112509据集将其与黑色素瘤组织中的表达进行了比较。

结果显示,在NRASwt/BRAFwt 痣, NRASwt/BRAFmut 痣和 NRASwt/BRAFwt 黑色素瘤中,CD40的表达水平没有显著差异。但是,发现了CD40在具有致癌NRAS和BRAF突变的黑色素瘤组织中的表达异质性,与NRASwt/BRAFmut痣组织相比,CD40在NRASwt/BRAFmut黑色素瘤中表达减少。此外,与NRASwt/BRAFwt痣、NRASwt/BRAFmut痣或NRASwt/BRAFwt黑色素瘤组织相比,NRASmut黑色素瘤中CD40表达降低。

图2C在TCGA数据库中的Firehose Legacy黑色素瘤数据集(n=479)进一步分析了CD40在不同突变类型黑色素瘤中的表达。

结果发现,RAS (N/H/K)突变单独(p=0.058)或与NF1突变联合(p=0.038),与黑素瘤中CD40表达减少相关。这些结果与先前报道的“抑制RAS/RAF/PI3K通路增加黑色素瘤细胞中CD40表达”的结果非常吻合。

图2D通过NCI数据库(一个经过校对的权威通路互作数据库,http://www.ndexbio.org/)分析了CD40的互作通路。

结果显示,CD40/CD40LG轴可能导致MAPK,PI3K / AKT,NF-κB和JAK3 / STAT5途径的激活。

图2E通过TIDE数据库评估了CD40预测不同肿瘤免疫治疗效果的价值。

作者分析了CD40表达的ROC曲线下面积(AUC),并将其与现有的生物标志物(包括肿瘤突变负荷(TMB)、CD274 (PD-L1)和CD8)进行比较,判断其作为预测免疫治疗反应工具的潜力。TIDE数据库全称是Tumor Immune Dysfunction and Exclusion,翻译为中文就是肿瘤免疫功能障碍和排斥,网址为http://tide.dfci.harvard.edu/,主要用来推测调节肿瘤免疫基因的功能,综合分析免疫功能障碍和排斥对肿瘤的免疫逃逸机制,从而来有效预测免疫检查点抑制治疗的效果

结果显示,在≥50%的黑色素瘤队列和一个胃癌队列中,CD40的预测性能与CD8相当,这两个生物标志物的AUC >0.7,预测免疫治疗阳性反应的可能性很强。值得注意的是,CD40 是唯一在预测胶质母细胞瘤 ICB 反应方面取得良好性能的生物标志物(AUC = 0.83)。TMB (AUC = 0.73) 和 CD274 (AUC = 0.7) 分别在一个膀胱癌队列和一个 HNSC 队列中可以预测 ICB(免疫检查点阻断)反应。值得注意的是,在用α-CTLA4或α-PD1治疗的两个黑色素瘤患者队列中,高CD40与更好的总生存期(OS)相关。然而,接受α-PD-L1治疗的膀胱癌患者或接受α-PD1治疗的肾癌患者中,CD40与OS没有特别显著的相关性。

结语

好了,到这里“看图说话”就结束了,我们回头总结以下,为什么这篇文章的图文这么简单,却还能发27+呢?小编认为有以下2点:

(1)选题非常好,贴近热点,具有较高的临床意义:免疫检查点抑制剂 (ICB)的肿瘤治疗只有一部分人可以长期获益,如果能够准确预测具体哪些患者可以获益,将会推动医学发展的巨大进步。

(2)联合多种数据库,内容更全面:作者不仅采用TCGA等常见的数据库,还利用一些比较新的数据,数据库之间相互弥补,相互印证,结果更可靠。

精彩好文 生信人

热点年度盘点:21年十大科研热点,免疫治疗只能排第三 - (jianshu.com)

IF60综述:非癌组织中的克隆扩张 - (jianshu.com)

参考文献:

Yan, C., Richmond, A. Hiding in the dark: pan-cancer characterization of expression and clinical relevance of CD40 to immune checkpoint blockade therapy. Mol Cancer 20, 146 (2021). https://doi.org/10.1186/s12943-021-01442-3

你可能感兴趣的:(生信分析 ▏高分单基因纯生信)