ggplot2读书笔记1:认识ggplot2

Welcome to ggplot2

什么是图形的语法?

ggplot是用来绘制统计图形的R软件包,是由其背后的一套语法支持的。

图形的语法告诉我们,一张图形就是从数据(data)到几何对象的图形属性的一个映射(mapping)。图形中还包含数据的统计变换,最终绘制在某个特定的坐标系中。另外,分面可以用来生成数据不同子集的图形。总而言之,一张统计图形就是由上述这些独立的图形部件所组成的。

有一些概念需要了解:
- 几何对象(Geometric,缩写为geom)代表你在图中实际看到的图形元素,包括点、线、多边形等
- 图形属性(Aesthetic,缩写为aes)是包括颜色、形状等
- 统计变换(Statistical transformation,缩写为stats)指的是对原始数据进行某种计算和汇总,例如二元散点图加上一条回归线
- 图层(Layer)由几何对象和统计变换组成
- 标度(scale)是将数据的取值映射到图形空间,例如颜色、大小和形状表示不同的数值。展现标度的常见做法是绘制图例和坐标轴
- 坐标系(Coordinate,缩写是coord)主要控制坐标轴和网格线,描述的是数据如何映射到图形所在平面。通常使用笛卡尔坐标系
- 分面(facet)也称条件作图,控制分组方法和排列,描述如何将数据分解为各个子集,以及如何对子集作图

安装

RStudio有网页版和软件版

网页版注册后可直接使用;软件版则需要下载安装ggplot2包,运行如下命令:

> install.packages("ggplot2")

ggplot2包中自带一套数据(关于大众汽车燃油经济性)可用于学习

> library(ggplot2)
> mpg
# A tibble: 234 x 11
   manufacturer model      displ  year   cyl trans    drv     cty   hwy fl    class 
   <chr>        <chr>       <int> <int> <chr>    <chr> <int> <int> <chr> <chr> 
 1 audi         a4          1.80  1999     4 auto(l5) f        18    29 p     compa…
 2 audi         a4          1.80  1999     4 manual(… f        21    29 p     compa…
 3 audi         a4          2.00  2008     4 manual(… f        20    31 p     compa…
 4 audi         a4          2.00  2008     4 auto(av) f        21    30 p     compa…
 5 audi         a4          2.80  1999     6 auto(l5) f        16    26 p     compa…
 6 audi         a4          2.80  1999     6 manual(… f        18    26 p     compa…
 7 audi         a4          3.10  2008     6 auto(av) f        18    27 p     compa…
 8 audi         a4 quattro  1.80  1999     4 manual(… 4        18    26 p     compa…
 9 audi         a4 quattro  1.80  1999     4 auto(l5) 4        16    25 p     compa…
10 audi         a4 quattro  2.00  2008     4 manual(… 4        20    28 p     compa…
# ... with 224 more rows
> 

关于这套数据的说明

cty和hwy:城市和高速公路行驶记录每加仑行驶的英里数(miles per gallon,mpg)

displ:发动机排量(L)

drv:动力传动系统(前轮f,后轮r,四轮4)

model:汽车模型(由于1999年至2008年期间每年都有新版本,因此选择了38款)

class(未显示):描述汽车种类的变量(双座,SUV,紧凑型等)

这个数据集可以引出一系列有趣的问题,比如发动机尺寸和燃油经济性的相关性如何?哪些制造商更关心燃油经济性?在过去的10年终燃油经济性是否有所改善?我们可以通过使用ggplot2进行数据分析和作图来回答这些问题。

参考资料:

  1. Hadley Wickham(2016). ggplot2. Springer International Publishing. doi: 10.1007/978-3-319-24277-4
  2. 《R语言应用系列丛书·ggplot2:数据分析与图形艺术》

你可能感兴趣的:(ggplot2)