起因
这是一个天朗气清的日子。我正无聊的翻看着聊天记录,突然一道题出现在我的视野里:
图是这样的:
顿时精神起来,思路哗啦啦的出现。
思路
1.这图应该是ggplot2,theme_bw主题的箱线图(geom_boxplot())。
2.模拟作图的数据:x轴是染色体,y轴数字用随机数,范围大概在0-3之间。
3.重点是怎么调整x轴的顺序让它按照数字排列,而非默认的ASCII
码排序,我搜到了这个网页,虽然图已经挂了, 但是代码还活着:https://blog.csdn.net/weixin_34006468/article/details/87741179
4.作为锦上添花的一笔,可以把那个红点也加上去,大概是个平均值吧。需要计算平均值,然后叠加图层(点图)。这个形状我在R数据科学第一章见过:
不就是那个23嘛。
代码实现
step1:模拟数据&数据清理
x=matrix(rnorm(2200,mean=1.5,sd = 0.2),ncol = 22)
test=as.data.frame(x)
colnames(test)=paste0("chr",1:22)
head(test,3)
## chr1 chr2 chr3 chr4 chr5 chr6 chr7 chr8
## 1 1.735900 1.592964 1.5357012 1.509799 1.427116 1.731629 1.577542 1.437874
## 2 2.044522 1.188158 1.5777756 1.402124 1.288738 1.469201 1.608938 1.541404
## 3 1.236109 1.281460 0.9248059 1.557471 1.854517 1.400657 1.499865 1.633099
## chr9 chr10 chr11 chr12 chr13 chr14 chr15 chr16
## 1 1.419864 1.473799 1.533877 1.634162 1.187985 1.277067 1.556884 1.439447
## 2 1.319382 1.416500 1.576769 1.233425 1.689680 1.365171 1.277405 1.845788
## 3 1.243472 1.573978 1.477648 1.610831 1.643301 1.218138 1.457112 1.577818
## chr17 chr18 chr19 chr20 chr21 chr22
## 1 1.182395 1.399263 1.317782 1.372491 1.276228 1.331798
## 2 1.486231 1.443116 1.864301 1.407559 2.028096 1.357263
## 3 1.411519 1.576395 1.794003 1.456685 1.141306 1.664034
可以粗暴的直接做图:
boxplot(test)
用ggplot2作图就需要扁变长,用gather函数。
if(!require(tidyr)) install.packages("tidyr")
## Loading required package: tidyr
## Warning: package 'tidyr' was built under R version 3.5.3
library(tidyr)
test2 <- gather(test,key = "chr",value = "values")
head(test2,3)
## chr values
## 1 chr1 1.735900
## 2 chr1 2.044522
## 3 chr1 1.236109
翻了一下以前的笔记,怎么画箱线图,怎么把横坐标调成倾斜的(目的是防重叠) https://www.jianshu.com/p/666de30161b2
如果直接做图,就会和题目中的图一样,注意看x轴顺序
if(!require(ggplot2)) install.packages("ggplot2")
## Loading required package: ggplot2
library(ggplot2)
p1 <- ggplot(test2,aes(x = chr, y = values)) +
geom_boxplot()+
theme_bw()+
theme(axis.text.x = element_text(angle=50,vjust = 0.5))
p1
step2:改x轴坐标顺序,不是改图,而是改作图的数据
⭐重点就是这里:要把x轴对应的那一列变成因子,按照你想要的顺序排序 :
table(test2$chr)
##
## chr1 chr10 chr11 chr12 chr13 chr14 chr15 chr16 chr17 chr18 chr19 chr2
## 100 100 100 100 100 100 100 100 100 100 100 100
## chr20 chr21 chr22 chr3 chr4 chr5 chr6 chr7 chr8 chr9
## 100 100 100 100 100 100 100 100 100 100
test2$chr <- factor(test2$chr,levels=paste0("chr",1:22),ordered = TRUE)
调完再做图:
p1 <- ggplot(test2,aes(x = chr, y = values)) +
geom_boxplot()+
theme_bw()+
theme(axis.text.x = element_text(angle=50,vjust = 0.5))
p1
step3:把红点那个图层加上
这个可能不怎么好理解,图层叠加是可以换数据的。还有,形状颜色分为边框和填充,分别用color和fill这两个参数,尺寸大小,用size,作图就像驴拉磨,一圈一圈调。
y=data.frame(mean=apply(test, 2, mean))
if(!require(tibble))install.packages("tibble")
library(tibble)
y=rownames_to_column(y,var="chr")
p1+geom_point(data = y,aes(x=chr,
y=mean),
shape=23,
fill="red",
color="black",
size=3)