ggplot2:U2

qplot() 快速作图

#准备工作
library("ggplot2")
set.seed(1410)
dsmall <- diamonds[sample(nrow(diamonds), 100), ]

qplot(x, y, data)
data参数可选,如果进行了指定,那么qplot()将会首先在该数据框内查找变量名,然后再在R的工作空间中进行搜索

qplot(carat, price, data = diamonds)
qplot(log(carat),log(price),data = diamonds)
qplot(carat, price, data = dsmall, color = color)
qplot(carat, price, data = dsmall, shape = cut)

I()手动设定图形属性
alpha,创建半透明颜色,取值从0(完全透明)到1(完全不透明),通常透明度可采用分数形式进行表示
分母表示经过多少次重叠后颜色将不再透明

qplot(carat, price, data = diamonds, alpha = I(1/200))

geom = “point”绘制散点图,是指定了x和y后的默认设置
geom = “smooth”将拟合一条平滑曲线,并将曲线和标准误展示在图中
geom = “boxplot”可以绘制箱线胡须图,用以概括一系列点的分布情况
geom = “path”和“line”可以在数据点之间绘制连线。这类图的传统的作用是探索时间和其他变量之间的关系
但连线同样可以用其他方式将数据点连接起来
geom = “histogram”直方图
geom = “freqpoly”绘制频率多边形
geom = “density” 绘制密度曲线
如果只有x参数传递给qplot(),那么直方图几何对象就是默认的选择
对于离散变量,geom = “bar”,绘制条形图

qplot(carat, price, data = dsmall, geom = c("point", "smooth"))

若不想要灰色的置信区域,可以设置se = FALSE
利用method可以选择不同的平滑器
span参数控制的是曲线的平滑程度,从0(很不平滑)到1(非常平滑)
method = "loess",当n较小时是默认选项,使用的是局部回归的方法
loess对于大数据并不十分适用,当n超过1000时会采用另一种平滑算法
可以使用method = "gam", formula = y ~ s(x)来调用mgcv包拟合一个广义可加模型
对于大数据,请使用公式y ~ s(x, bs = "cs")

library(mgcv)
qplot(carat, price, data = dsmall, geom = c("point", "smooth"), 
          method = "gam", formula = y ~ s(x))
qplot(carat, price, data = dsmall, geom = c("point", "smooth"), 
         method = "gam", formula = y ~ s(x, bs = "cs"))

method = "lm"拟合的是线性模型,默认情况下是一条直线,但可以通过指定formula = y ~ poly(x,2)来拟合一个二次多项式
加载splines包使用自然样条,formula = y ~ ns(x,2)
第二个参数为自由度,自由度越大,曲线的波动也越大
method = "rlm"与lm类似,但采用更稳健的拟合算法,使得结果对异常值不太敏感,需加载“MASS”包

扰动点图geom = “jitter",箱线胡须图geom = "boxplot"
对于箱线图,可以用color控制外框颜色,fill设置填充颜色,以及size调节线的粗细

qplot(color, price/carat, data = diamonds, 
          geom = "jitter", alpha = I(1/50))

geom = "histogram"直方图,binwidth控制组距
geom = “density”密度曲线,adjust控制曲线平滑程度(取值越大越平滑)
某个分类变量被映射到某个图形属性上,几何对象就会自动按这个变量进行拆分

qplot(carat, data = diamonds, geom = "density", colour = color)
qplot(carat, data = diamonds, geom = "histogram", fill = color)

条形图与直方图类似

qplot(color, data = diamonds, geom = "bar")

若想用其他方式对数据进行分组处理,可以使用weight几何对象

qplot(color, data = diamonds, geom = "bar", 
          weight = carat)++ scale_y_continuous("carat")

时间序列中的线条图和路径图
线条图从左到右连接,x轴一般是时间,展示了单个变量随时间变化的情况
路径图展现了两个变量随时间联动的情况,时间反映在点的顺序上

qplot(date, unemploy/pop, data = economics, geom = "line")

失业率和失业时间长度随时间变化的路径,为使时间方向明显,我们将年份映射到color属性上

year <- function(x) as.POSIXlt(x)$year + 1900
 #as.POSIXlt(x)$year是时间转换的一种格式,年代从1900年算起。
qplot(unemploy/pop, uempmed, data = economics,
         geom = "path", color = year(date) )

facets分面参数,将图形拆分成若干个窗格,可以通过形如row_var ~ col_var的表达式进行指定
若想指定一行或一列,可以使用.作为占位符,列如row_var ~ .创建一个单列多行的图形矩阵
..density..,表示将密度而不是频数映射到y轴

qplot(carat, ..density.., data = diamonds, facets = color ~ ., 
         geom = "histogram", binwidth = 0.1, xlim = c(0, 3))

xlim,ylim:设置x轴和y轴的显示区间,取值为长度为2的数值向量,如x = c(0,20)
log:表示对某个坐标轴(如果有的话)取对数,如log = "x"即对x轴取对数log = "xy",表示对x轴和y轴同时取对数
main:图形的主标题,放置在图形的顶端中部,该参数可以是一个字符串或一个表达式
xlab,ylab:设置x轴和y轴的标签文字

你可能感兴趣的:(ggplot2:U2)