dtangle:基于反卷积的表达谱分解确定细胞组分

组织的细胞组分分析对于明确生物进程机制很重要,尤其是在bulk RNA-seq后,我们已经不满足于简单的肿瘤纯度的确定,肿瘤组织细胞成分的确定对于肿瘤治疗和肿瘤异质性研究具有重要意义,而基于反卷积的表达谱分解能够更精确的确定组织细胞组成并挖掘细胞标志基因。

dtangle是一个对RNA-seq或微整列数据进行反卷积分解确定样本细胞组分的R包,我们通过一个实例来表明如何使用:
  1. 安装 dtangle:
install.packages("dtangle")
  1. dtangle自带一个微阵列表达谱矩阵,由3个类型的细胞(liver、brain和lung)组成,涉及42个样本和600个探针组成,其中9个样本是纯细胞样本,剩下33个样本是混合样本,9个纯细胞样本如下,行是样本,列是细胞类型,数值表示该样本中细胞组分百分比:


    dtangle:基于反卷积的表达谱分解确定细胞组分_第1张图片

    其他33个混合细胞样本如下,分数表示细胞所占百分比:


    dtangle:基于反卷积的表达谱分解确定细胞组分_第2张图片

    部分表达谱数据如下,行是样本,列是探针ID:
    dtangle:基于反卷积的表达谱分解确定细胞组分_第3张图片
  2. 我们现在通过已知细胞组分的9个样本推测其他33个混合样本的细胞组分,虽然33个混合样本的细胞组分是已知的,但可以比较下dtangle的准确性,首先定义混合样本和参考样本:

mixture_samples = data[-(1:9),]
reference_samples = data[1:9,]

然后调用dtangle进行分解:

dt_out = dtangle(Y=mixture_samples, reference=reference_samples,pure_samples = pure_samples)
  1. 查看经过反卷积分解的混合样本细胞组分:


    dtangle:基于反卷积的表达谱分解确定细胞组分_第4张图片

    并与真实细胞组分比较, 发现dtangle预测的细胞组分与真实细胞组分基本相同(位于对角线)

mixture_mixture_proportions = mixture_proportions[-(1:9),]
matplot(mixture_mixture_proportions,dt_out$estimates, xlim = c(0,1),ylim=c(0,1),xlab="Truth",ylab="Estimates")
dtangle:基于反卷积的表达谱分解确定细胞组分_第5张图片
  1. 也可以查看各个细胞组分的mark genes,将这些基因单独提取后进行后续功能分析。


    dtangle:基于反卷积的表达谱分解确定细胞组分_第6张图片

当然dtangle也支持单细胞测序数据,之前我们也已经介绍过两个用于细胞组成分析的工具:使用xcell根据表达谱推断样本组成细胞的类型​ 和 ​使用MuSiC分析bulk RNA-seq中的细胞组分 ,大家可以根据自己的样本选择合适的工具。


更多原创精彩视频敬请关注生信杂谈:

dtangle:基于反卷积的表达谱分解确定细胞组分_第7张图片

你可能感兴趣的:(dtangle:基于反卷积的表达谱分解确定细胞组分)