多组学纯生信分析套路 多组学鉴定肾癌新药靶

今天跟大家分享的是今年3月发表在Genome Medicine杂志(IF:10.8860)上的一篇文章,文章主要研究的是ccRCC免疫治疗的药物靶点。

整合-组学和HLA-配体组学分析识别ccRCC免疫治疗的新药物靶点

一.研究背景

透明细胞肾细胞癌(ccRCC)是肾癌中最常见的亚型,有分析意向(http://gaptechsxr.mikecrm.com/1vdMmqy)生信人WX公众号全世界有超过40万人被ccRCC影响,其每年造成约17.5万人死亡,特别是对于晚期和转移性疾病的患者来说,他们的预后较差,确诊后5年生存率仅有12%。其中,导致预后不良的主要原因是ccRCC肿瘤对常规化疗和放疗具有较高的内在耐药性以及目前应用的靶向治疗的耐药性。为了对抗治疗耐药,通常采用不同的靶向药物对患者进行不同的治疗。然而,在大多数情况下,肿瘤在治疗中会复发或进展为转移性疾病。并且ccRCC治疗中,靶向通路的数量有限,使得无反应的患者几乎没有治疗选择,导致预后非常差。因此,今天介绍的文章整合多组学及人类白细胞抗原(HLA)配体组学分析来识别ccRCC免疫治疗的药物新靶点。


二.材料及方法

1. 数据:研究收集了55位原发的癌症及配对癌旁组织作为队列1 ,此外,研究也从TCGA下载了452例ccRCC样本作为队列2,其中包括表达数据及DNA甲基化数据、体细胞突变数据,两个队列描述如表1所示。作者也从先前发表的研究获取单细胞肾近端小管表达数据。

表1 患者队列和特征

2.使用LC-MS/MS分析人类白细胞抗原(HLA)配体及识别ccRCC多肽。

3. HLA分型及转录组分析:使用Human Transcriptome Array2.0对肿瘤样本进行全基因组mRNA表达分析。

4. GSEA:研究使用GSEA分析队列样本的基因集合特征。

5. NGS panel序列:使用TruSeq Custom Amplicon基因panel对候选基因进行测序。

6. DNA甲基化分析:通过 MALDI-TOF MS进行DNA甲基化分析。

7. CD8+ T细胞体外引物测定和四聚体染色。

8. ccRCC组织的靶向代谢组学:组织样本的靶向代谢组学/脂质体组学分析使用液相色谱法和注射分析质谱进行。

9. 细胞培养:细胞培养包括细胞系培养、siRNA介导的EGLN3基因敲除、代谢组整合分析、细胞增殖凋亡、海马糖酵解、海马线粒体功能、球体形成分析、及细胞存活实验。


三.研究的主要内容及结果

1. HLA配体组学检测ccRCC中过度表达的肽

因为ccRCC是一种低突变负荷的实体瘤,所以在文章的第一部分作者想要识别肿瘤中异常的非突变肽。作者在队列1的癌症组织及癌旁组织识别出了HLA 1类及2类结合肽,并进行了质谱分析。如图2所示,为了识别ccRCC特异肽,作者从158个健康器官和白细胞组织中提取HLA 1类和2类配体作为对照库,以排除普遍存在的肽。作者定义在至少三种ccRCC肿瘤组织检测到并且不在非肿瘤组织或白细胞制剂中的肽是ccRCC特异的。研究最终识别ccRCC特异的1类多肽443条,2类多肽203条,他们分别定位到382条和139条可能的源基因。 接着,为了获得免疫治疗的候选靶点列表,作者将HLA 1类和2类肽靶点的源蛋白进行组合,产生499个蛋白,这些蛋白由499个独特的基因编码(图1a)。

图1 候选基因的识别流程


图2 ccRCC中过表达的HLA 1类及2类肽


2. ccRCC呈递肽的源基因涉及了ccRCC肿瘤激活的通路

在文章的第二部分,作者为了识别ccRCC相关的通路和过程,选择了来自Hallmark, C4 Cancer Module, C6 Oncogenic Signatures, Biocarta, Kegg,及从MSigDB收集的C2 Curated Gene Set的Reactome pathways 和先前发表的八个免疫模块特征中的2182个基因特征。将这些特征应用于患者队列1的51个肿瘤组织的全转录组数据进行ssGSEA,这些肿瘤组织均有HLA配体组数据和高质量RNA(图1)。因为ssGSEA方法允许以基因表达水平为基础计算个体样本中的通路活性评分, 所以作者使用ssGSEA得分分析了这些基因特征在ccRCC中的激活情况,结果如图3a所示。接着,为了确保观察到通路激活是由肿瘤组织的恶性转变的结果而不是肿瘤起源细胞类型造成的,作者将同样的富集分析应用于一组肾近端小管区域的单细胞测序数据,结果如图3b所示。最后作者分析了这些特征基因与HLA配体分析中基因交集(图3c),并在进一步的分析中认为其是与ccRCC发病机制相关的潜在免疫治疗靶点。

图3 GSEA分析揭示ccRCC的富集通路


3. 使用TCGA数据进行靶点验证

在这一部分作者使用TCGA数据对前面得到的候选靶点进行了验证。与队列1类似,作者进行了ssGSEA,发现队列1分析的50条通路中42条通路富集得到支持(图4a),从而确定了173个候选基因。在TCGA患者队列中,这173个基因都在最小表达阈值以上表达,该阈值由log2 FPKM-UQ频率分布的局部最小值定义(图4b)。为了选择ccRCC肿瘤诱导基因,作者计算了肿瘤与癌旁组织的表达差异,差异分析结果如图4c。由于作者目标是识别存在于大多数ccRCC患者中的潜在靶点,所以最终筛选了TCGA患者队列中肿瘤低表达变异的候选基因构成了最终的候选基因列表(图4d)。

图4  TCGA数据靶点验证


4. 候选靶点的基因表达和功能的调控

由于肿瘤细胞经常表现出表观遗传改变,其对基因表达有全局影响。同时,在ccRCC中,肿瘤抑制基因的启动子区域经常出现DNA高甲基化,从而影响肿瘤的分期和分级。因此作者在这一部分对TCGA数据进行分析,研究候选分析流程是否受到DNA甲基化影响,研究发现肿瘤组织中的一些基因可能受到DNA甲基化的调控。接下来,作者使用TCGA数据分析了体细胞突变对于这些候选基因表达、稳定性及功能的影响,结果发现研究队列1中检测到的MET、TSC2和RB1的大部分突变是私有的。

 

5. ccRCC候选靶点的功能

在这一部分,作者首先对候选基因进行了DAVID功能注释分析(图5a),此外,候选基因的GO PANTHER分类系统结果如图5b。由于ccRCC是一种代谢疾病,主要改变能量和脂代谢,所以作者进一步对候选细胞可能的代谢相互作用进行研究。作者对队列1中30个样本的组织代谢物采用靶向代谢组学、流式相色谱和注射分析质谱进行评估,分析结果如图5c所示。此外,作者对候选基因的免疫肿瘤相互作用很感兴趣,因此研究了候选基因表达与免疫肿瘤标记存在的关系,候选基因与标记基因的表达关联分析结果如图5d所示。

图5 候选靶基因的功能关联


6. 候选基因的肽能激活CD8+ T细胞

由于如果要将ccRCC特异性肽用于癌症疫苗,需要它们能够将初始T细胞激活为效应T细胞。因此,在这一部分作者测试了来自五个候选基因的12个HLA 1类肽进行细胞免疫原性潜力启动化验(图6),这些肽的免疫原性结果如表2所示。

图6 评估所选候选肽的免疫原性


表2 候选基因来源肽在CD8+ T细胞引物试验中的免疫原性


7. EGLN3作为ccRCC治疗靶点的功能分析

低氧诱导因子(HIF)羟化酶3 (PHD3;EGLN3)是这个分析方法中最重要的的候选目标之一。这是由于总共识别了13个来自EGLN3的ccRCC特异性肽(图7a),其中5个被证明具有免疫原性(表2)。接着作者使用PANTHER GO去分析EGLN3涉及到的完整功能,发现其与细胞低氧压力应答等功能相关。接着作者通过非靶向代谢组学对细胞代谢物进一步分析揭示了EGLN3敲除和对照组细胞中差异的代谢物,研究发现胞嘧啶和脱氧胞苷在EGLN3缺失的细胞中大量增加(图7b)。进一步的,为了评估EGLN3是否能做为ccRCC中的药物靶点,作者研究了其在ccRCC细胞培养模型中的作用,结果发现EGLN3沉默降低了A498细胞的复制(图7d),增加了A498和786-O细胞的凋亡(图7e)。此外,也发现EGLN3敲低破坏了A498细胞的糖酵解作用,这可能是细胞复制减少的原因(图7f, g)。分析还发现EGLN3敲低也影响线粒体功能,然而,在A498和786-O细胞中效果不同,EGLN3缺失时,A498细胞的线粒体呼吸和ATP产生增加,而786-O细胞的呼吸减少(图7h, i)。EGLN3沉默细胞与未处理或非靶向siRNA转染的对照组细胞相比,它们形成稳定球状体的能力受损(图7j),但EGLN3沉默不影响细胞存活率(图7k)。

图7 候选靶基因EGLN3的功能研究


到这里这篇文章的主要结果就介绍完了,有分析意向(http://gaptechsxr.mikecrm.com/1vdMmqy)生信人WX公众号可以看出作者在实验过程中将生物信息学分析与湿实验相结合,整合多组学数据识别出了ccRCC中与HLA相关的候选的药物靶点,文章的研究的角度和方法非常值得我们学习借鉴。

你可能感兴趣的:(多组学纯生信分析套路 多组学鉴定肾癌新药靶)