Data Science with R in 4 Weeks - Week 2 - Day1

ggplot2

重点介绍一下ggplot2,作图中非常常用的一个命令。ggplot2提供非常强大的图形功能。

注意:操作ggplot2之前,需要你的dataset 是dataframe的形式

例子1: 我们采用ggplot2自带的dataset mpg

library(ggplot2)

str(mpg)

> qplot(displ, hwy, data=mpg, color = drv)

图表以displ为横轴,hwy为纵轴,对不同的drv进行了颜色的区分。可以看到,随着排量(displ)的增大,hwy(highway mileage)是降低的。

Data Science with R in 4 Weeks - Week 2 - Day1_第1张图片


例子2: facets。对不同的factor进行独立的展示。上图显示的是所有驱动方式(drv)——前驱,后驱,4轮驱动——的排量和油耗关系。如果我们想把每一种驱动方式单独展示出来呢?

> qplot(displ, hwy, data=mpg, color = drv, facets = .~drv)

Data Science with R in 4 Weeks - Week 2 - Day1_第2张图片

也可以按照列来展示,

> qplot(displ, hwy, data=mpg, color = drv, facets = drv~.)


Data Science with R in 4 Weeks - Week 2 - Day1_第3张图片


如果我们进一步再想看到排量和油耗的直观关系,可以使用线性回归的方法:

geon = c("point", "smooth"), method="lm"

> qplot(displ, hwy, data=mpg, color = drv, geom =c("point", "smooth"), method = "lm",facets = .~drv)

Data Science with R in 4 Weeks - Week 2 - Day1_第4张图片

存在比较明显的负线性关系。

你可能感兴趣的:(Data Science with R in 4 Weeks - Week 2 - Day1)