《ggplot2数据分析与图形艺术》学习笔记 -- 第五章

第五章 工具箱

5.1 简介

本章列举了ggplot2中大量几乎对象和统计变换的一部分,并把它们按照用途进行细分。

5.2 图层叠加的总体策略

  • 用以展示数据本身
  • 用以展示数据的统计摘要
  • 用以添加额外的元数据、上下文信息和注解

5.3 基本图形类型

每种几何对象自身即可独立构建图形,同时也可以组合起来构建更复杂的几何对象。

这些和对象均是二维的,因此x和y两种图形属性都是不可或缺的。同时,它们都可以接受colour和size图形属性,另外,填充型几何对象(条形、瓦片和多边形)还可以接受fill图形属性。点使用shape图形属性,线和路径接受linetype图形属性。

  • geom_area():面积图

  • `geom_bar(stat = "identity")``:条形图,我们需要制定stat= "identity",因为默认的统计变换将自动对值进行技术。而统计统计变换identity将保持数据不变。

  • geom_line:线条图,group属性决定了哪些观测是连接在一起的。geom_path与geom_line类似,但前者将数据点按出现的顺序进行连接,而非从左至右进行连接。

  • geom_point:散点图

  • geom_polygon:多边形,既填充后的路径。数据中的每一行代表了多边形的一个顶点

  • geom_text:在指定点处添加标签。它是,这些几何对象中唯一一个需要额外图形属性的:它需要制定label参数。我们可以通过设置可选的图形属性hjust和vjust来控制文本的横纵位置;此外,可以设置图形属性angle来控制文本的旋转。

  • geom_tile:深图(image plot)或水平图(level plot)。

5.4 展示数据分布

5.5 处理遮盖绘制问题

散点图是研究两个连续型变量间关系的重要工具。但是当数据量很大时,这些点经常会出现重叠现象,从而掩盖真实的关系。处理办法:

  • 小规模的遮盖问题可以通过绘制更小的点(shape = ".",一像素大小的点)加以缓解,或者使用中空的符号(shape = 1
  • 对于更大的数据集产生的更为严重的遮盖问题,可以使用alpha(透明度)让点呈现透明效果。假如以比值的形式制定alpha值,则分母表示一个位置的颜色变为完全不透明时所需重叠的数量。在R中最小值为1/256

5.10 添加图形注解

  • geom_text:可添加文字叙述或为点添加标签,往往用于对离群点或其他重要的点记性标注

  • geom_vlinegeom_hline:像图形添加垂直或水平线

  • geom_abline:添加任意斜率和截距的直线

  • geom_rect:向感兴趣的区域添加矩形,拥有xmin、xmax、ymin和ymax四个图形属性。

  • geom_line, geom_path和``geom_segment`都可以添加直线。所有这些几何对象都有一个arrow参数,可以用于在线上放置一个箭头。我们也可以使用arrow()函数绘制箭头,它拥有angle, length, ends以及type几个参数。

你可能感兴趣的:(《ggplot2数据分析与图形艺术》学习笔记 -- 第五章)