气泡图是在笛卡尔坐标系同加入大小的参数所形成的可以表示三个变量关系的图例。在对基因完成GO/KEGG分析后,使用气泡图可以直观的展示pathway、pvalue、count之间的关系。下面为使用R语言ggplot2包绘制气泡图所需的数据结构及代码:
由于笔者常使用read.csv读取文件,因此在第一列预留行名,建议实际操作时使用GOID以防止行名重复。
library(ggplot2)
pathway = read.csv("down2.csv",header=TRUE,row.names=1,check.names = FALSE)
p = ggplot(pathway,aes(Pvalue,Pathway))
p=p + geom_point()
# 修稿点的大小
p=p + geom_point(aes(size=Count))
# 展示三维数据
pbubble = p+ geom_point(aes(size=Count,color=-1*log10(Pvalue)))
# 设置渐变色
pr = pbubble+scale_color_gradient(low="green",high = "red")
# 绘制p气泡图
pr = pr+labs(color=expression(-log[10](Pvalue)),size="Count",
x="Pvalue",y="Pathway name",title="Pathway enrichment")
pr + theme_bw()
## 保存图片
ggsave("out.pdf")# 保存为pdf格式
ggsave("out2.png",width=4,height=4)# 设定画布大小
结果展示:
GEO芯片数据差异表达分析时需要log2处理的原因
https://blog.csdn.net/tuanzide5233/article/details/88542805
GEO芯片数据差异表达分析时是否需要log2以及标准化的问题
https://blog.csdn.net/tuanzide5233/article/details/88542558
差异表达矩阵制作教程
https://blog.csdn.net/tuanzide5233/article/details/83659768
差异表达的热图绘制详见
https://blog.csdn.net/tuanzide5233/article/details/83659501
使用edgeR对RNAseq数据进行差异表达分析教程
https://blog.csdn.net/tuanzide5233/article/details/88785486
差异表达分析(DEG)时 row.names'里不能有重复的名字 的解决方案
https://blog.csdn.net/tuanzide5233/article/details/86568155
生存分析系列教程(一)使用生信人工具盒进行生存分析
https://blog.csdn.net/tuanzide5233/article/details/83685403
富集分析与蛋白质互作用网络(PPI)的可视化 Cystocape入门指南
https://blog.csdn.net/tuanzide5233/article/details/88048439
进阶版Venn plot:Upset plot入门实战代码详解——UpSetR包介绍
https://blog.csdn.net/tuanzide5233/article/details/83109527
使用R语言ggplot2包绘制pathway富集分析气泡图(Bubble图):数据结构及代码
https://blog.csdn.net/tuanzide5233/article/details/82141817