2022年,TCGA数据建模真的还能到10分吗?

肿瘤浸润性B细胞和免疫球蛋白(Ig)在肿瘤微环境(TME)和免疫治疗反应均起到重要作用。肿瘤内B细胞产生的IgG抗体会驱动ADCC并增加树突状细胞的抗原呈递。B细胞可以作为抗原特异性抗原呈递来调节Th细胞的行为。然而,有关膀胱癌中B细胞在TMB中的作用还不是十分清楚。今天给大家介绍一篇2022年1月发表在CANCER IMMUNOLOGY RESEARCH(IF:11.151)上的文章。Accounting for B-cell Behavior and Sampling Bias Predicts Anti–PD-L1 Response in Bladder Cancer(根据B细胞行为和采用偏差预测膀胱癌抗PD-L1治疗反应)。这篇文章作者研究了膀胱癌患者肿瘤内免疫球蛋白组成。其研究表明高IgG1/IgA比例与患者生存期较长,对抗PD-L1治疗有反应,浸润性免疫细胞中细胞毒性发生率高,TCR信号转导增加等有关。此外,作者基于B细胞,NK细胞和T细胞特征构建预测抗PD-L1反应的特征。

结果:

1.数据集获取

从GDC获取TCGA-BLCA的FPKM数据集,共包括433例样本。从European Genome-Phenome Archive获取IMVigor210数据集。

2.免疫球蛋白亚型组成

首先,作者计算TCGA-BLCA数据集中不同亚型患者的IgG/IgA比例。对于Basal squamous亚型来说,IgG/IgA比例-高的亚组总生存期较高。结合IgG克隆性和IgG/IgA比例,对于Basal squamous亚型来说,免疫球蛋白克隆性-低和IgG/IgA-高的亚组总生存期最高而免疫球蛋白克隆性-高和IgG/IgA-低的亚组总生存期最低(图1A-1C)。

图1 免疫球蛋白特征和CD8+ T细胞特征预测Basal squamous亚型患者的生存情况

3.IgG/IgA表达比例与细胞毒性免疫特征的相关性

接下来,为了鉴定与IgG1/IgA表达比例-高有关的免疫过程。作者基于IgG1/IgA比例将Basal squamous患者分组并进行差异分析。TCR信号,CD8+ T细胞活化,NK细胞介导的细胞毒性,IL21介导的信号转导,免疫检查点,B细胞受体信号转导和细胞凋亡等富集与IgG1/IgA-高亚组中。此外,IgG1/IgA比例-高于细胞毒性基因表达水平增加有关,表明1型T细胞应答与IgG1亚型转换有关。

图2 差异分析

4.CD8+ 效应T细胞特征和IgG1/IgA的预后价值

已有研究构建了基于CD8+ 效应T细胞相关的基因特征预测抗PD-L1免疫治疗反应。作者应用CD8+ T细胞特征预测TCGA-BLCA的Basal squamous亚组,结果表明CD8+ T细胞高表达与患者生存较好有关。此外,结合CD8+ T细胞和IgG1/IgA比例的生存分析表明,CD8+ T细胞-高和IgG1/IgA-高的患者生存较好(图1D-1F)。

5.预测生存期和免疫治疗反应

接下来,作者使用CD8+ T细胞特征和IgG1/IgA比例预测IMVigor210数据集的抗PD-L1免疫治疗反应。IMVigor210数据集的样本共包括三种免疫亚型,分别为沙漠型,排斥性和炎症型。首先,作者研究三种免疫亚型中的IgG1/IgA比例,IgG1/IgA比例与IMVigor210数据集总生存期的关系,Ig克隆性与Basal squamous亚型的总生存期的关系,结合IgG1/IgA比例和Ig克隆性与IMVigor210数据集总生存期的关系(图3A-3D)。其次,作者研究三种免疫亚型中的CD8+ T细胞特征水平,CD8+ T细胞特征水平与IMVigor210数据集总生存期的关系,结合IgG1/IgA比例和CD8+ T细胞特征水平与IMVigor210数据集总生存期的关系(图3E-3L)。最后,多因素Cox比例风险回归分析表明IgG1/IgA比例和CD8+ T细胞特与IMVigor210数据集的独立预后因子。

图3 预测免疫特征对IMVgior210数据集的免疫治疗反应的预后价值

6.预测抗PD-L1免疫治疗反应的模型

为研究PD-L1水平的预后价值,作者使用ICA计算肿瘤区域内PD-L1+免疫细胞的百分比构建IC打分。结果表明,IC打分的AUC为0.62,IC2+组的总生存期最高而IC0组的总生存期最低(图4)。

图4 PD-L1的预后价值


随后,作者研究CD8+ T细胞特征的预后价值。首先,作者使用原始CD8+ T细胞特征和随机森林方法构建模型。该模型的AUROC为0.57±0.02,F1值为0.344±0.06(图5A-5C)。其次,作者使用标准化后的CD8+ T细胞特征和随机森林方法构建模型。该模型的AUROC为0.7±0.03,F1值为0.465±0.05(图5D-5F)。最后,作者进一步使用标准化后的CD8+ T细胞特征构建模型。作者对CD8+ T细胞特征进行特征选择,根据特征重要性选择了4个基因(CXCL9,CXCL10,CD8A和GZMB),还排除了没有显著预后价值的特征(免疫球蛋白克隆性,IL21R和CD80)。构建该模型的特征主要包括CXCL9,CXCL10,CD8A,GZMB,IgG1/IgA比例,KLRC2,KLRC3,KLRC4,IL21,GNLY和TGFB1。将该模型命名为PRIMUS,其AUROC为0.81±0.04,F1值为0.495±0.05(图5G-5I)。

图5 随机森林模型

7.特征重要性和互作分析

使用SHAP研究PRIMUS模型的特征重要性,排名前三的特征为CD8+ T细胞,GNLY和NK(图6A和图6B)。使用SHAP研究PRIMUS模型的特征相互作用,IgG1/IgA比例结合IL21高表达的预测效果更高,CD8+ T细胞和IL21高表达具有互相作用(图6C和6D)。生信分析意向表 (mikecrm.com)

图6 PRIMUS特征重要性和相互作用

8.预测沙漠亚型患者的免疫治疗反应

由于在三种肿瘤免疫表型中,使用CD8+ T细胞特征,TGFβ反应特征和TBM都很难预测沙漠亚型患者的免疫治疗反应。因此,作者使用IMVigor210数据集训练PRIMUS模型,PRIMUS模型可以准确预测沙漠亚型患者的免疫治疗反应(图7)。

图7 PRIMUS模型预测沙漠亚型的性能

9.模型验证

由于免疫治疗反应会影响患者的生存情况,作者使用PRIMUS预测未接受免疫治疗的膀胱癌患者的总生存期。结果表明,TCGA-BLCA患者的总生存期与PRIMUS打分显著相关。

图8 PRIMUS预测TCGA-BLCA的总生存期

结论:

目前,在参与膀胱癌患者生存和免疫治疗反应的生物学过程的研究还很少。本研究通过研究B细胞和免疫球蛋白(Ig)等特征在BLCA作用构建PRIMUS模型,该模型可以准确预测膀胱癌患者的免疫治疗反应和总生存期。小编认为本篇文章能发高分的关键在于第一,作者着眼于B细胞和免疫球蛋白(Ig)等特征构建模型而不是常规的对数据进行差异分析,一致性聚类和生存分析等构建预后模型;第二,作者使用了一些机器学习算法,例如随机森林和SVM并对特征重要性进行了分析;第三,作者构建的PRIMUS模型不仅可以预测患者免疫治疗反应并且在预测患者总生存期方面也具有较高准确性。

你可能感兴趣的:(2022年,TCGA数据建模真的还能到10分吗?)