DAY4 竟然还在学ggplot

统计变换

根据现有的数据,从新的角度进行统计得出新的数据的算法叫做统计变换stat
(例子:比如现有数据知道小朋友A吃了某种糖果多少个,小朋友B吃了某种糖果多少个,小朋友C。。。直到最后一个小朋友。。。最后统计每种糖果各被吃了多少个就叫做统计变换)

每种几何对象函数(就是geom_bar, geom_boxplot等等)与每种统计变换函数一一映射,可以通过?[所想查看的几何对象](如?[geom_bar])查看。通常来说,几何对象函数可以和与之对象的统计变换函数互换使用。例如用stat_count()替换geom_bar()。

条形图的柱子颜色的调整:
geom_bar(mapping(x=cut,color=cut))中color为设置柱子边框颜色

image.png

geom_bar(mapping(x=cut,fill=cut))中color为设置柱子填充颜色

image.png

条形图的柱子位置的调整:

  1. 不加position参数,自动为堆叠效果


    ggplot(data=diamonds)+geom_bar(mapping=aes(x=cut,fill=clarity))
  2. position="fill",与堆叠效果类似,但是每个柱子有相同的高度 (用于比较组间比列

ggplot(data=diamonds)+geom_bar(mapping=aes(x=cut,fill=clarity),position="fill"
  1. position="dodge",将每组的条形依次排列
ggplot(data=diamonds)+geom_bar(mapping=aes(x=cut,fill=clarity),position="dodge")
  1. position="identy",将每组的条形重叠显示在图中,因为会重叠,所以建议设置透明度


    ggplot(data=diamonds)+geom_bar(mapping=aes(x=cut,fill=clarity),position="identity",alpha=0.2)

过绘制问题

对于散点图,可能由于许多点的位置相同(或四舍五入之后相同),导致点重合在一起(比如有200个点,但是只能显示150个点),不能看出点的分布密度


这时需要给每个点的位置加上随机抖动(position = "jitter")(代价是丧失点的精确度),这样位置相同的点也可以分开,这样的散点图可以从图中看楚点的分布密度

ggplot(data=mpg)+geom_point(mapping = aes(x=displ,y=hwy),position = "jitter")
坐标系问题

ggplot2默认坐标系是直角坐标系
交换x,y轴: coord_filp() 函数可以交换x,y轴
eg.ggplot(data=mpg)+geom_point(mapping = aes(x=class,y=hwy))+coord_flip()

极坐标系: coord_polar

你可能感兴趣的:(DAY4 竟然还在学ggplot)