柱状图也叫直方图,是展示连续性数值的分布状况。在x轴上将连续型数值分为一定数量的组,y轴显示对应值的频数。
我们用R自带的Orange数据来画图。
> head(Orange)
Tree age circumference(圆周长)
1 1 118 30
2 1 484 58
3 1 664 87
4 1 1004 115
5 1 1231 120
6 1 1372 142
我们可以先看看这些树的年龄分布。
hist(x, breaks = "Sturges",
freq = NULL, probability = !freq,
include.lowest = TRUE, right = TRUE, fuzz = 1e-7,
density = NULL, angle = 45, col = "lightgray", border = NULL,
main = paste("Histogram of" , xname),
xlim = range(breaks), ylim = NULL,
xlab = xname, ylab,
axes = TRUE, plot = TRUE, labels = FALSE,
nclass = NULL, warn.unused = TRUE, ...)
hist(Orange$age)
hist(Orange$age, col = "lightblue", border = "pink")
我们用geom_histogram来画一下,和hist做个比较。但是发现默认的图显示的y轴有点问题,需要调整一下y轴的范围。
library(ggplot2)
ggplot(data=Orange, aes=(x=age)) + geom_histogram()
调整完之后,还是一样的图,才发现是默认算数据的bin的时候和hist不一样,频率都是5,那我们可以调整一下bin的数量再看。
g1 <-ggplot(data=Orange, aes(x=age)) + geom_histogram()
g1+coord_cartesian(ylim=c(0,10))
调整一下颜色看看效果。第二幅图是我最喜欢的颜色,tomato。
ggplot(data=Orange, aes(x=age)) + geom_histogram(color="darkblue",fill="lightblue",bins=10)
ggplot(data=Orange, aes(x=age)) + geom_histogram(fill="tomato",bins=10)
我们可以试一试翻转。一个很简单的办法就是把显示的变量赋值是y。
coord_flip函数也可以达到同样的效果。
ggplot(data=Orange, aes(y=age)) + geom_histogram(fill="tomato",bins=10)
ggplot(data=Orange, aes(x=age)) + geom_histogram(fill="tomato",bins=10) + coord_flip()
我们来加入一个分组的信息看看怎么显示。
ggplot(data=Orange, aes(x=age, fill=Tree)) + geom_histogram(bins=10)