散点图主要用于描述两个连续变量之间的关系,通过散点图发现变量之间的相关性强度、是否存在线性关系等。
简单散点图
上篇文章R语言与散点图介绍了如何用ggplot2包中的geom_point()函数绘制简单的散点图。
散点图参数调整
数据产生
利用rnorm()函数产生符合正态分布的随机数,data.frame()函数形成数据框。
1a <- rnorm(150,mean =2, sd = 10)2#a3b <- 2*a + rnorm(100, mean = 10, sd = 10)4#b5df <- data.frame(x = a, y = b)6#df
简单绘图
1library(ggplot2)2ggplot(data = df, mapping = aes(x = a, y = b)) + geom_point()
调整点的类型和颜色
各类符号常用于画图时设置点的不同形状,pch是plotting character 的缩写。默认参数是点状。pch范围用0:25来表示26个标识。为了使大家更清晰的了解R语言的绘图符号设置参数,我给大家画了一张“pch标识图”。
1plot(0:25,pch=0:25,cex=1.5, main="pch标识图",xlab="pch编号")
只需要添加参数pch和col即可
1ggplot(data = df, mapping = aes(x = a, y = b)) + geom_point(pch = 10, col = "red")
按照分组绘制不同颜色散点图
设置分组以后可将分组变量(因子或字符变量)赋予某种颜色或形状属性,实现分组颜色散点图的绘制。首先用sample()函数产生新的一列,为x,y设置新的属性:0或1。
1c <- sample(c(0,1), size = 150, replace = TRUE)2#c3df_abc<-data.frame(x = a, y = b, z = c)4str(df_abc)#查看变量属性
可以看到现在新的属性列z中的0或1属于数值型变量,需要转化为因子型变量才能作为属性赋予颜色或形状等等,这点一定要打笔记,后面的学习中还会经常遇到这种情况。很多小伙伴很容易忽略。可以用factor()函数实现。
1df_abc$z <- factor(df_abc$z)2str(df_abc$z)#再次查看转变后的变量属性
根据分组设置颜色
1ggplot(data = df_abc, mapping = aes(x = x, y = y, col = z)) + geom_point(size = 2.5)
根据分组设置形状
1ggplot(data = df_abc, mapping = aes(x = x, y = y, shape = z)) + geom_point(size = 2.5)
今天的分享先到这里,下次有空将继续分享。可能小伙伴不喜欢系统自动分配的颜色,下篇将给大家分享如何用多种方法实现个性化设置点的颜色和形状。欢迎大家关注评论转发。