qplot() 快速作图
#准备工作
library("ggplot2")
set.seed(1410)
dsmall <- diamonds[sample(nrow(diamonds), 100), ]
qplot(x, y, data)
data参数可选,如果进行了指定,那么qplot()将会首先在该数据框内查找变量名,然后再在R的工作空间中进行搜索
qplot(carat, price, data = diamonds)
qplot(log(carat),log(price),data = diamonds)
qplot(carat, price, data = dsmall, color = color)
qplot(carat, price, data = dsmall, shape = cut)
I()
手动设定图形属性
alpha,创建半透明颜色,取值从0(完全透明)到1(完全不透明),通常透明度可采用分数形式进行表示
分母表示经过多少次重叠后颜色将不再透明
qplot(carat, price, data = diamonds, alpha = I(1/200))
geom = “point”绘制散点图,是指定了x和y后的默认设置
geom = “smooth”将拟合一条平滑曲线,并将曲线和标准误展示在图中
geom = “boxplot”可以绘制箱线胡须图,用以概括一系列点的分布情况
geom = “path”和“line”可以在数据点之间绘制连线。这类图的传统的作用是探索时间和其他变量之间的关系
但连线同样可以用其他方式将数据点连接起来
geom = “histogram”直方图
geom = “freqpoly”绘制频率多边形
geom = “density” 绘制密度曲线
如果只有x参数传递给qplot(),那么直方图几何对象就是默认的选择
对于离散变量,geom = “bar”,绘制条形图
qplot(carat, price, data = dsmall, geom = c("point", "smooth"))
若不想要灰色的置信区域,可以设置se = FALSE
利用method可以选择不同的平滑器
span参数控制的是曲线的平滑程度,从0(很不平滑)到1(非常平滑)
method = "loess"
,当n较小时是默认选项,使用的是局部回归的方法
loess对于大数据并不十分适用,当n超过1000时会采用另一种平滑算法
可以使用method = "gam", formula = y ~ s(x)
来调用mgcv包拟合一个广义可加模型
对于大数据,请使用公式y ~ s(x, bs = "cs")
library(mgcv)
qplot(carat, price, data = dsmall, geom = c("point", "smooth"),
method = "gam", formula = y ~ s(x))
qplot(carat, price, data = dsmall, geom = c("point", "smooth"),
method = "gam", formula = y ~ s(x, bs = "cs"))
method = "lm"
拟合的是线性模型,默认情况下是一条直线,但可以通过指定formula = y ~ poly(x,2)
来拟合一个二次多项式
加载splines包使用自然样条,formula = y ~ ns(x,2)
第二个参数为自由度,自由度越大,曲线的波动也越大
method = "rlm"
与lm类似,但采用更稳健的拟合算法,使得结果对异常值不太敏感,需加载“MASS”包
扰动点图geom = “jitter",箱线胡须图geom = "boxplot"
对于箱线图,可以用color控制外框颜色,fill设置填充颜色,以及size调节线的粗细
qplot(color, price/carat, data = diamonds,
geom = "jitter", alpha = I(1/50))
geom = "histogram"直方图,binwidth控制组距
geom = “density”密度曲线,adjust控制曲线平滑程度(取值越大越平滑)
某个分类变量被映射到某个图形属性上,几何对象就会自动按这个变量进行拆分
qplot(carat, data = diamonds, geom = "density", colour = color)
qplot(carat, data = diamonds, geom = "histogram", fill = color)
条形图与直方图类似
qplot(color, data = diamonds, geom = "bar")
若想用其他方式对数据进行分组处理,可以使用weight几何对象
qplot(color, data = diamonds, geom = "bar",
weight = carat)++ scale_y_continuous("carat")
时间序列中的线条图和路径图
线条图从左到右连接,x轴一般是时间,展示了单个变量随时间变化的情况
路径图展现了两个变量随时间联动的情况,时间反映在点的顺序上
qplot(date, unemploy/pop, data = economics, geom = "line")
失业率和失业时间长度随时间变化的路径,为使时间方向明显,我们将年份映射到color属性上
year <- function(x) as.POSIXlt(x)$year + 1900
#as.POSIXlt(x)$year是时间转换的一种格式,年代从1900年算起。
qplot(unemploy/pop, uempmed, data = economics,
geom = "path", color = year(date) )
facets
分面参数,将图形拆分成若干个窗格,可以通过形如row_var ~ col_var的表达式进行指定
若想指定一行或一列,可以使用.作为占位符,列如row_var ~ .创建一个单列多行的图形矩阵
..density..
,表示将密度而不是频数映射到y轴
qplot(carat, ..density.., data = diamonds, facets = color ~ .,
geom = "histogram", binwidth = 0.1, xlim = c(0, 3))
xlim,ylim:设置x轴和y轴的显示区间,取值为长度为2的数值向量,如x = c(0,20)
log:表示对某个坐标轴(如果有的话)取对数,如log = "x"即对x轴取对数log = "xy",表示对x轴和y轴同时取对数
main:图形的主标题,放置在图形的顶端中部,该参数可以是一个字符串或一个表达式
xlab,ylab:设置x轴和y轴的标签文字