什么!棒棒糖也能画成图?—— ggplot2绘制棒棒糖图/哑铃图

欢迎关注公众号查看原文

Part 1 :棒棒糖图

棒棒糖图因其形状和棒棒糖相似而得名,具体来看实际上是一个散点和一条线段的组合。棒棒糖图是散点图的一种变体,又与柱状图非常相似,但其在清晰展示数据的同时,减少了图形量,使得读者能够更加关注于数据本身而非图形。棒棒糖图能够帮助将数值与类别对齐,非常适合比较多个类别的值之间的差异。 本期介绍棒棒糖图的基本作图方法和优化

示例1:相同数据源下柱状图和棒棒糖图展示数值差异效果对比

示例2:使用棒棒糖图画出的好图

Part 2 :图像与代码

1、快速构建基础图形:

只需在散点图基础上,增加geom_segment( )图层即可画出棒棒糖图

示例3:基础图形

library(ggplot2)

# 随机构建数据
data <- data.frame(xv = LETTERS[1:26],  #x轴:以26个字母作为类别
                   yv = abs(rnorm(26))) #y轴:取26个符合正态分布的随机数
## fig 1 :基础图形
fig3 = ggplot(data, aes(x = xv, y = yv)) +

  geom_segment( aes(x = xv, xend = xv, y = 1, yend = yv),color = "grey40")+ #控制线段的参数,见下
  geom_point(size = 4, pch = 21, bg = 5, col = 1) + #控制散点的参数
  theme_bw()
fig3

#geom_segment中的参数用于控制线条相关参数
#x=xv,xend=xv 表示x轴的线条起始位置x和终止位置xend都是xv(没有线条)
#类似的,y = 1, yend = yv表示y轴线段起始点为y=1,种植点为每个类别的值即yv

2、基础优化:

(1)对线段的控制体现在对geom_segment()函数参数的调整,该函数的详细用法可参考 https://ggplot2.tidyverse.org/reference/geom_segment.html

在此我们介绍常用的参数:

  • x - (必须) 起点的x坐标

  • y - (必须) 起点的y坐标 — 此参数用作设定基线

  • xend - (必须)终点的x坐标

  • yend - (必须)终点的y坐标

  • size - (默认:0.5)线段的宽度

  • linetype - (默认:1=solid)线段的类型,可参见下图中 lty 变量类型

  • color - (默认: "black") 线段的颜色

  • alpha - (默认:1=opaque)线段的透明度


(2)对顶点(散点)的控制则由geom_point()控制,此处不再赘述,可参考:

https://ggplot2.tidyverse.org/reference/geom_point.html?q=geom_point#null

值得一提的是,R语言本身提供了一些自定义图形外观的参数,这些参数几乎可以适用在所有基于R语言的绘图包中:

  • cex - 形状大小

  • lwd - 线条宽度

  • col - 控制颜色类型

  • lty - 线条类型

  • pch - 标记(散点)形状

  • type - 点之间的连接形状

这些参数对应的可选变量见下图:

(3)其他:

  • x、y轴坐标交换 :直接使用** coord_flip() **函数即可
  • 对变量进行排序,使图形更加美观;此处提供3种方法供参考:forcats::fct_reorder()dplyr::arrange()reorder(),具体示例参见:https://www.r-graph-gallery.com/267-reorder-a-variable-in-ggplot2.html
  • 要在散点上显示对应数值:使用geom_text()

示例4:简单优化后的棒棒糖图

library(ggplot2)
library(dplyr)
# 随机构建数据
data <- data.frame(xv=LETTERS[1:26], 
                   yv=abs(rnorm(26)))
data <- data %>% 
  mutate(mycolor = ifelse(yv>1, "Y>1", "Y<=1")) #设置分组

## fig 2 :简单优化后的图形
fig4 <- ggplot(data, aes(x=reorder(xv,-yv), y=yv,fill = mycolor)) +
  geom_segment( aes(x=reorder(xv,-yv), xend=reorder(xv,-yv), y=1, yend=yv,color=mycolor),
  size=0.5,linetype=1)+#使用reorder()排序变量
  geom_point(size = 5, pch = 21, color="black") + 
  #在散点上显示数值并保留两位小数
  geom_text(aes(label =sprintf("%.2f",yv)), color = "black", size = 1.6)+ 
  xlab("26Letters") +
  scale_y_continuous("Y_Values",breaks  =c(0,0.25,0.5,0.75,1,1.25,1.5,1.75,2)) +
  coord_flip() +
  theme_minimal()

fig4

示例5:带分组的棒棒糖图

library(ggplot2)
library(hrbrthemes)
yv1 <- abs(rnorm(6))*2
data6 <- data.frame(
  x=LETTERS[1:24], 
  val=c( yv1, yv1+1+rnorm(6, 14,1) ,yv1+1+rnorm(6, sd=1) ,yv1+1+rnorm(6, 12, 1) ),
  grp=rep(c("grp1", "grp2", "grp3", "grp4"), each=6)
) %>%
  arrange(val) %>%
  mutate(x=factor(x, x))

fig5 = ggplot(data6) +
  geom_segment( aes(x=x, xend=x, y=0, yend=val), color="grey") +
  geom_point( aes(x=x, y=val, color=grp), size=3 ) +
  coord_flip()+
  theme_ipsum() +
  theme(
    legend.position = "none",
    panel.border = element_blank(),
    panel.spacing = unit(0.1, "lines"),
    strip.text.x = element_text(size = 8)
  ) +
  xlab("") +
  ylab("Value of Y") +
  facet_wrap(~grp, ncol=1, scale="free_y")
fig5

3、变体:一个类型两个值

在棒棒糖图中,如果一个类别有两个数值,可以很方便地使用一条线段来表示二者间的差异。即在棒棒糖图中geom_segment(aes(x = xv, xend = xv, y = 1, yend = yv)中,y的起始点不再是固定的度量y=1,而是该类别的另一变量示例6:

library(ggplot2)
library(dplyr)
yv1 = abs(rnorm(26))*2
data2 <- data.frame(
  xv1 = LETTERS[1:26], 
  yv1 = yv1, 
  yv2 = yv1+1+rnorm(26, sd=1) 
)

fig6 = ggplot(data2) +
  geom_segment( aes(x=xv1, xend=xv1, y=yv1, yend=yv2),
  size=0.7,linetype=1,color="grey")+ # 此处y起始点为yv1,终止点为yv2
  geom_point(aes(x=xv1,y=yv1),size = 4, pch = 20, color="#66CCEE") + 
  geom_point(aes(x=xv1,y=yv2),size = 4, pch = 20, color="#EE6677") + 
  xlab("26Letters") +
  scale_y_continuous("Y_Values",breaks  =c(0,1,2,3,4,5,6,7)) +
  theme_minimal()
fig6

示例6这样的图形也被称之为“哑铃图”,并且已有成熟的函数可以绘制:ggalt::geom_dumbbell(),该函数的相关参数含义及用法和示例参见官方文档:https://yonicd.github.io/ggalt/reference/geom_dumbbell.html

下面给出使用该函数绘制“哑铃图”的示例:

示例7:geom_dumbbell()官方文档示例

library(ggplot2)
library(ggalt)
df <- data.frame(trt=LETTERS[1:5], l=c(20, 40, 10, 30, 50), r=c(70, 50, 30, 60, 80))

bbfig3 = ggplot(df, aes(y=trt, x=l, xend=r)) +
  geom_dumbbell(size=3, color="#e3e2e1",
                colour_x = "#5b8124", colour_xend = "#bad744",
                dot_guide=TRUE, dot_guide_size=0.25) +
  labs(x=NULL, y=NULL, title="ggplot2 geom_dumbbell with dot guide") +
  theme_minimal() +
  theme(panel.grid.major.x=element_line(size=0.05))
bbfig3

示例8:geom_dumbbell()绘制哑铃图

llibrary(ggalt)
health <- read.csv("https://raw.githubusercontent.com/selva86/datasets/master/health.csv")
health$Area <- factor(health$Area, levels=as.character(health$Area))
bbfig2 = ggplot(health, aes(x=pct_2013, xend=pct_2014, y=Area)) + 
  geom_dumbbell()+
  theme_minimal()
bbfig2

library(ggalt)
library(ggplot2)
bbfig3 = ggplot(health, aes(x=pct_2013, xend=pct_2014, y=Area)) + 
  geom_segment(aes(x=pct_2013, 
                   xend=pct_2014, 
                   y=Area, 
                   yend=Area), 
               color="#b2b2b2", size=1.5)+
  geom_dumbbell(color="light blue", 
                size_x=3.5, 
                size_xend = 3.5,
                colour_x="#edae52", 
                colour_xend = "#9fb059")+
  labs(x=NULL, y=NULL, 
       title="Dumbbell Chart", 
       subtitle="Pct Change: 2013 vs 2014")+
  geom_text(color="black", size=2, hjust=-0.5,
            aes(x=pct_2013, label=pct_2013))+
  geom_text(aes(x=pct_2014, label=pct_2014), 
            color="black", size=2, hjust=1.5)+
  theme_minimal()
bbfig3

参考:

  • https://www.r-graph-gallery.com/lollipop-plot.html
  • https://r-charts.com/ranking/lollipop-chart-ggplot2/
  • https://rpubs.com/ageek/ggplot-adv-part2

你可能感兴趣的:(什么!棒棒糖也能画成图?—— ggplot2绘制棒棒糖图/哑铃图)