【R语言】给富集分析的气泡图加个好看的配色

写在前面
ggplot2是一款风靡全球的绘图R包,可惜的是,我对它的理解只能到入门的水平,本着在实战中学习的理念,我就搜索一下往后可能用得到的图,进行揣摩和优化,然后我发现了一个师兄的公众号,遂跟着这个师兄学习R绘图。公众号在文末。

1.读入数据

dat<-read.table("kegg.txt",
                sep = "\t",
                header = T)
colnames(dat)

2.过滤数据并用默认参数展示

library(tidyverse)
dat %>% filter(Corrected.P.Value<0.0001) -> dat01 #这里为了减少计算量,根据P值进行了过滤
dim(dat01)
dim(dat)

library(ggplot2)
dat01$GeneRatio<-dat01$Input.number/200  #ratio的大小其实反应着出现次数的多少
ggplot(dat01,aes(x=GeneRatio,y=Term))+
  geom_point(aes(size=Input.number,color=Corrected.P.Value))
image.png

这当然无法达到我们发文章的要求,需要对其进行美化一下。

3. 美化

install.packages("paletteer")
library(paletteer)
#BiocManager::install("ggsci")
#library(ggsci)
#paletteer_c("ggthemes::Orange-Blue Diverging", 50)
ggplot(dat01,aes(x=GeneRatio,y=reorder(Term,GeneRatio))) +
  geom_point(aes(size=Input.number,color=Corrected.P.Value))+
  coord_cartesian(clip="off")+
  scale_color_paletteer_c(palette = "grDevices::topo.colors",
                          name="p.adjust")+
  theme_bw()+
  scale_size_continuous(name="Count",
                        range = c(1,10))+
  labs(y="Terms")

美化后的效果:


image.png

对上述几个参数进行解读:

  • reorder: 根据出现的次数(generatio)对不同的通路从大到小进行排序。
  • coord_cartesian() :调整画布大小,没什么好说的。
  • scale_color_paletteer_c() :调用调色板paletteer,这里面有很多的调色板可以选用,拿grDevices来说,可以选用topo.colors()、rainbow()、heat.colors()、terrain.colors()、cm.colors();这里给自己挖了坑,能不能用ggsci来配色,目前没解决,等我解决了会来更正的。
  • theme_bw() :调整网络的有无,也没什么好说的。
  • scale_size_continuous() 添加图注,并标注大小范围。

参考链接:
1.绘图 https://mp.weixin.qq.com/s/n6TZoEADyDFcGzSzoGxlsg
2.paletteer documentation:https://www.rdocumentation.org/packages/paletteer/versions/1.4.0
3.grDevices documentation:https://astrostatistics.psu.edu/su07/R/html/grDevices/html/palettes.html

ggsci填坑系列

离散型变量系列:

ggplot(dat01,aes(x=GeneRatio,y=reorder(Term,GeneRatio))) +
  geom_point(aes(size=as.factor(Input.number),color=as.factor(Corrected.P.Value)))+
  coord_cartesian(clip="off")+
  theme_bw()+
  labs(y="Terms")+scale_color_aaas()

配色确实有那味了,但是没想到内置的颜色不够用,可能通路少一点会好。


image.png

连续型变量系列:

q <- ggplot(dat01,aes(x=GeneRatio,y=reorder(Term,GeneRatio))) +
  geom_point(aes(size=Input.number,color=Corrected.P.Value))
  
q+scale_fill_aaas()

然后我发现,不管添不添加配色,都是和默认的配色保持一致,目前猜测可能是颜色不够导致的。


image.png

后记2
1.ggsci https://www.rdocumentation.org/packages/ggsci/versions/2.9
2.https://stackoverflow.com/questions/43359050/error-continuous-value-supplied-to-discrete-scale-in-default-data-set-example

你可能感兴趣的:(【R语言】给富集分析的气泡图加个好看的配色)