今天跟大家分享的是三月份发表在Briefings in Bioinformatics (IF: 9.101)上的一篇文章。lncRNA可以作为免疫标志物,文章主要讲的是利用TIL-B 基因的lncRNA signature作为特征分析对膀胱癌的预后以及免疫治疗的关系。
Computational recognition of lncRNA signature of tumor-infiltrating B lymphocytes with potential implications in prognosis and immunotherapy of bladder cancer
膀胱癌中利用计算的方法识别肿瘤浸润B淋巴细胞的lncRNA signature与预后和免疫治疗的联系
5+免疫细胞
特有lncRNA筛选套路
已经有研究表明lncRNA与肿瘤免疫调节和微环境(TME)相关联。该工作提出了一种基于机器学习的方法,通过整合分析免疫、lncRNA和临床特征来鉴定肿瘤浸润B细胞(TIL-B)的lncRNA signature(简称TILBlncSig)。从141个B细胞特异的lncRNA中发现八个lncRNA(TNRC6C-AS1,WASIR2,GUSBP11,OGFRP1,AC090515.2,PART1,MAFG-DT和LINC01184)可以作为预后signature。且在不同的独立数据集中进行生存分析得到验证。TILBlncSig的功能表明它可以作为单核免疫细胞(即NK细胞,B细胞和肥大细胞)浸润的指标。此外,TILBlncSig对于抗PD-1治疗的患者生存和免疫治疗反应的预测存在一定的临床价值。总而言之。从lncRNA的角度发现TILBlncSig作为TME中免疫细胞浸润的指标的价值,证实lncRNA可作为免疫治疗反应的预测生物标志物。
材料方法
作者首先从GEO下载膀胱癌细胞系(GSE64279,GSE122306)和病人表达数据(GSE31684,GSE5287,GSE38264),从TCGA下载病人临床数据和RNAseq数据。18个免疫细胞类型的数据是来自GSE42058, GSE49910, GSE51540, GSE59237, GSE6863, GSE8059, GSE13906, GSE23371, GSE25320, GSE27291, GSE27838, GSE28490, GSE28698, GSE28726, GSE37750 and GSE39889。首先,对表达值进一步log(x+0.05)转换,利用RMA方法标准化。接下来就是方法核心(图1):(i)使用samr R包的SAM方法的计算B细胞系和其他免疫细胞系之间差异表达。在B细胞系中高表达并在其他免疫细胞系中低表达的那些lncRNA被定义为TIL-B相关的lncRNA(TILBlncRNA);(ii)单因素cox用于评估每个TILBlncRNA与生存时间之间的关联并鉴定预后相关的TILBlncRNA;(iii)应用机器学习方法,以基于多变量Cox回归模型以及通过R MASS包中的“stepAIC”函数进行的正向和反向特征选择。(iv)通过多变量Cox回归系数加权的TILBlncSig,将lncRNA的表达值随后转化为风险评分(TILBlncSig评分),以便于计算样本风险评分。
使用R survival 包中的survdiff函数比较高危和低危人群的生存分布差异。然后通过coxph函数对TILBlncSig的个体临床变量进行单变量和多变量Cox分析。并使用R survivalROC包评估TILBlncSig的预后性能。使用clusterProfiler进行基因集富集分析。使用DAVID进行GO和KEGG功能富集分析。
图1. 工作流程
结果:
1. 鉴定预后的B细胞特异性lncRNA
为了鉴定B细胞特异性lncRNA,在B细胞系和其他免疫细胞系之间进行了lncRNA的差异表达分析,鉴定了141个差异的lncRNA。这141个差异的lncRNA被认为是B细胞特异性lncRNA。随后,对202例BCa患者的生存时间与这141个lncRNA表达水平之间进行单变量Cox回归分析,发现24个lncRNA的表达与生存时间显著相关。
2. 鉴定和评估TILBlncSig以预测TCGA RNA-seq数据集中的预后
为从24个B细胞特异性lncRNA中搜索用于预后预测的生物标志物,使用前向和后向特征选择和多变量Cox回归模型。最后发现8个lncRNA(TNRC6C-AS1,WASIR2,PART1,GUSBP11,MAFG-DT,LINC01184,OGFRP1和AC090515.2)可联合作为预后标志(TILBlncSig)。使用多因素Cox回归系数对lncRNA的表达值加权得到风险评分(TILBlncSig评分):TILBlncSig评分=(-0.2438*TNRC6C-AS1) +(-0.3929*WASIR2)+(-0.2645*PART1)+(-0.4645*GUSBP11)+(0.6849*MAFG-DT)+(0.4178*LINC01184)+ (-0.3453*OGFRP)+(-0.3408*AC090515.2)。多变量Cox分析显示,TILBlncSig中的8个lncRNA的预测能力是相互独立的(图2A)。
计算每位患者的TILBlncSig得分,然后使用中位数将202位患者分为高风险组(n = 101)和低风险组(n = 101)。TILBlncSig作为风险阈值两组之间生存时间显著差异(图2B)。在评估3年和5年OS时,TILBlncSig的ROC曲线的AUC分别为0.915和0.894(图2C)。TILBlncSig在预测TCGA数据集中同样有效(图2D),TCGA数据集中,在预测3年和5年OS时,TILBlncSig的ROC曲线的AUC分别为0.717和0.695(图2C)。在单变量Cox比例风险回归分析中,发现TILBlncSig与OS显著相关(图2E)。
图2. 在TCGA和测试数据集中TILBlncSig的生存分析
3. TILBlncSig与TIL-B相关
为了探索TILBlncSig的功能,计算mRNA与八个lncRNA中的每一个之间的表达相关性,并选择了相关性排秩前1%作为与TILBlncSig共表达的mRNA。对mRNA进行GO和KEGG pathway富集分析(图3A和B)。使用单样本GSEA评估高风险组和低风险组患者的19个免疫亚群的免疫浸润水平(图3C)。TILBlncSig的四个lncRNA在B细胞系中的表达水平显著更高(图3D)。这些结果表明,TILBlncSig不仅与患者的预后有关,而且还是可以作为TIL-B的指标。
图3. TILBlncSig的功能分析
4. TILBlncSig在具有微阵列平台的多个独立验证数据集中的验证
为了评估TILBlncSig的鲁棒性,使用microarray数据集进一步验证了TILBlncSig的预测能力。对于GSE31684数据集中的93位患者,发现TILBlncSig能够区分生存风险高和低的患者(图4A)。在单变量分析中,还显示TILBlncSig与OS密切相关(图4B)。
图4. 独立数据验证
5. TILBlncSig与常规临床特征的独立性
为了进一步检查TILBlncSig是否可作为独立的预后因素,在三个BCa患者数据集中进行多变量Cox回归分析,包括TILBlncSig和其他临床因素作为协变量。不同数据集的结果均表明,TILBlncSig是对OS预测的独立预后因素(图5A和B)。在独立的GSE31684数据集中,TILBlncSig仍能预测OS(图5C)。这些结果证明TILBlncSig与OS预测的其他常规临床因素无关。
图5. TILBlncSig的稳定性
6. 仅使用lncRNA的signature和其他转录本+lncRNA的性能比较
使用包含PCG,miRNA和lncRNA表达谱的TCGA数据集,TILBlncSig与Liu等人的研究中提出的PCG-lncRNA microRNA的预后性能比较。TILBlncSig在3年和5年OS时的AUC为0.792和0.771,而PCG-lncRNA-microRNA预测在3年和5年中的相应AUC为0.588和0.594。这些结果证明,TILBlncSig在预测存活率方面比PCG-lncRNA-microRNA标志具有更好的预后能力。
7. TILBlncSig作为免疫疗法反应指标的潜力
进一步研究TILBlncSig与PD-L1表达水平之间的关联(图6A)。发现TILBlncSig与免疫检查点基因显著正相关。进一步比较了TILBlncSig分层的高、低风险组的免疫检查点基因的表达模式,发现高风险患者的免疫检查点基因表达水平明显高于低风险组(图6B)。且TILBlncSig和免疫检查点基因之间的交互作用对患者生存的影响,根据TILBlncSig和免疫检查点基因表达的高低组合将患者分为四组(图6C)。与高TILBlncSig和免疫检查点基因低表达的患者相比,TILBlncSig高和免疫检查点基因高表达的患者显示出更好的生存率(图6C)。在ccRCC免疫疗法数据集中测试了TILBlncSig的预测价值,在接受抗PD-1单药治疗的高风险组和低风险组之间,生存率存在显著差异(图7A)。当PD-1表达与TILBlncSig结合使用进行预测。AUC从0.646增加到0.719(图7B)
图6. TILBlncSig和免疫检查点基因表达对患者生存的影响
图7. TILBlncSig在基于免疫检查点抑制剂的免疫治疗中的意义
好了今天的分享到这里就结束啦,文章的整体思路比较清晰,用了多套数据进行验证,感兴趣的小伙伴可以进一步了解。