更多精彩请至我的公众号《KS科研分享与服务》
第一次接触基因评分是在一篇文章中,也不知道这样的叫法对不对,作者选定了几个炎症基因,利用seurat包的一个打分函数AddModuleScore,依据基因的平均表达水平进行分析,最后得到的score称为炎症分数,其实这样的叫法有点欠缺,但是有这样的做法。(演示数据没有意义)
选择基因进行计算。
DefaultAssay(immune) <- "RNA"
cd_features <- list(c(
'TNF',
'CCL2',
'CCL3',
'CCL4',
'CXCL10',
'S100A8',
'CXCL1'
))
Inscore <- AddModuleScore(immune,
features = cd_features,
ctrl = 100,
name = "CD_Features")
colnames([email protected])
colnames([email protected])[27] <- 'Inflammatory_Score'
其实构建了一个Inscore的seurat对象,对其进行可视化。
VlnPlot(Inscore,features = 'Inflammatory_Score',
pt.size = 0, adjust = 2,group.by = "orig.ident")
将其映射到UMAP,更加直观。
library(ggplot2)
mydata<- FetchData(Inscore,vars = c("UMAP_1","UMAP_2","Inflammatory_Score"))
a <- ggplot(mydata,aes(x = UMAP_1,y =UMAP_2,colour = Inflammatory_Score))+
geom_point(size = 1)+scale_color_gradientn(values = seq(0,1,0.2),
colours = c('#333366',"#6666FF",'#CC3333','#FFCC33'))
a+ theme_bw() + theme(panel.grid.major = element_blank(),
panel.grid.minor = element_blank(), axis.line = element_line(colour = "black"),
panel.border = element_rect(fill=NA,color="black", size=1, linetype="solid"))
箱线图展示不同组织之间的评分差异。
data<- FetchData(Inscore,vars = c("group","Inflammatory_Score"))
ggplot(data, aes(x=group,y=`Inflammatory_Score`)) +
theme_bw()+RotatedAxis()+
theme(panel.grid = element_blank(),
axis.text.x=element_text(angle=10,hjust = 1,vjust=0.5))+
labs(x=NULL,y=NULL,title = "Regulation of necroptotic process")+ geom_jitter(col="#00000033", pch=19,cex=2.5, position = position_jitter(0.2))+
geom_boxplot(position=position_dodge(0),aes(color = factor(group)))+
NoLegend()+theme(plot.title = element_text(hjust = 0.5)) #也就加上这一行,标题居中
=======================================
AddModuleScore函数仅仅是对选定的基因进行评分,其意义有限。而另一种对基因集的打分方式---AUCell,可以鉴定某个通路活跃的基因集在细胞群上的展示,也可以理解为对通路活性的评分。初次看到这个还是在一篇NM的文章里,用了大量的AUCell分析,可以学习一下。
首先安装AUCell这个包,并加载相关R包。
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("AUCell",force = TRUE)
library(AUCell)
library(clusterProfiler)
对细胞表达矩阵排列,下载GSEA基因集文件,网址:http://www.gsea-msigdb.org/gsea/downloads.jsp,选择自己需要关注的板块。进行评分计算。
cells_rankings <- AUCell_buildRankings(immune@assays$RNA@data)
Hallmarker <- read.gmt("h.all.v7.5.1.symbols.gmt")
geneSets <- lapply(unique(Hallmarker$term), function(x){print(x);Hallmarker$gene[Hallmarker$term == x]})
names(geneSets) <- unique(Hallmarker$term)
cells_AUC <- AUCell_calcAUC(geneSets, cells_rankings, aucMaxRank=nrow(cells_rankings)*0.1)
选定某一个需要关注的通路,进行可视化。
##set gene set of interest here for plotting
geneSet <- "HALLMARK_TNFA_SIGNALING_VIA_NFKB"
aucs <- as.numeric(getAUC(cells_AUC)[geneSet, ])
immune$AUC <- aucs
library(ggraph)
ggplot(data.frame([email protected], immune@[email protected]), aes(UMAP_1, UMAP_2, color=AUC)
) + geom_point( size=1.5
) + scale_color_viridis(option="A") + theme_light(base_size = 15)+labs(title = "TNFA_SIGNALING_VIA_NFKB")+
theme(panel.border = element_rect(fill=NA,color="black", size=1, linetype="solid"))+
theme(plot.title = element_text(hjust = 0.5))
以上就是今天的分享了,关键是要找到合适的基因应用到具体的研究,找好需要的基因集。