ggplot2绘制散点图进阶(一)

散点图主要用于描述两个连续变量之间的关系,通过散点图发现变量之间的相关性强度、是否存在线性关系等。

简单散点图

上篇文章R语言与散点图介绍了如何用ggplot2包中的geom_point()函数绘制简单的散点图。

散点图参数调整

数据产生

利用rnorm()函数产生符合正态分布的随机数,data.frame()函数形成数据框。

a <-< span=""> rnorm(150,mean =2, sd = 10)#ab <-< span=""> 2*a + rnorm(100, mean = 10, sd = 10)

## Warning in 2 * a + rnorm(100, mean = 10, sd = 10): 长的对象长度不是短的对象长度## 的整倍数

#bdf <-< span=""> data.frame(x = a, y = b)#df

简单绘图

library(ggplot2)

ggplot(data = df, mapping = aes(x = a, y = b)) + geom_point()

调整点的类型和颜色

各类符号常用于画图时设置点的不同形状,pch,即plotting character。默认参数是点状。pch范围用0-25来表示26个标识。为了使大家更清晰的了解R语言的绘图符号设置参数,我给大家画了一张“pch标识图”。

plot(0:25,pch=0:25,cex=1.5, main="pch标识图",xlab="pch编号")

只需要添加参数pch和col即可实现颜色和形状设置

ggplot(data = df, mapping = aes(x = a, y = b)) + geom_point(pch = 10, col = "red")

按照分组绘制不同颜色的散点图

设置分组以后可将分组变量(因子或字符变量)赋予某种颜色或形状属性,实现分组颜色散点图的绘制。首先用sample()产生新的一列,为x,y设置新的属性:0或1。

c <-< span=""> sample(c(0,1), size = 150, replace = TRUE)#cdf_abc<-< span="">data.frame(x = a, y = b, z = c)str(df_abc)#查看变量属性

## 'data.frame': 150 obs. of 3 variables:## $ x: num 14.353 -0.171 6.116 -12.312 -3.416 ...## $ y: num 29.6936 -0.8661 10.1574 -0.0841 -2.2291 ...## $ z: num 1 1 0 1 0 0 0 0 1 1 ...

可以看到现在新的属性列z中的0或1属于数值型变量,需要转化为因子型变量才能作为属性赋予颜色或形状等等,这点一定要做笔记,后面的学习中还会经常遇到这种情况。很多小伙伴很容易忽略。因子转换可以用factor()函数实现。

df_abc$z <-< span=""> factor(df_abc$z)str(df_abc$z)#再次查看转变后的变量属性

## Factor w/ 2 levels "0","1": 2 2 1 2 1 1 1 1 2 2 ...

根据分组设置颜色

ggplot(data = df_abc, mapping = aes(x = x, y = y, col = z)) + geom_point(size = 2.5)

根据分组设置形状

ggplot(data = df_abc, mapping = aes(x = x, y = y, shape = z)) + geom_point(size = 2.5)


今天的分享先到这里,下次有空将继续分享。可能小伙伴不喜欢系统自动分配的颜色,下篇将给大家分享如何用多种方法实现个性化设置点的颜色和形状。欢迎大家关注评论转发。

你可能感兴趣的:(ggplot2绘制散点图进阶(一))