高、低级图形函数概述
最常用高级函数的是plot()函数。比如,
- plot(x,y)(其中x,y是向量)对两个变量画散点图。
- 用plot(z) (其中z是一个定义了x变量和y变量的列表,或者一个两列的矩阵)也可以达到同样目的。
如果x是一个时间序列对象(时间序列对象用ts()函数生成),plot(x)绘制时间序列曲线图。
- 如果x是一个普通向量,则绘制x的值对其下标的散点图。
- 如果x是复数向量则绘制虚部对实部的散点图。
- 如果f是一个因子,则plot(f)绘制f的条形图(每个因子水平的个数)。
- 如果f是因子,y是同长度的数值向量,则plot(f,y)对f的每一因子水平绘制y中相应数值的盒形图。
- 如果d是一个数值型数据框,则plot(d)对d的每两个变量之间作图(散点图等)
load("F:/R/cl.RData")
plot(cl$Sex)
低级图形函数一般需要指定位置信息,其中的坐标指的是所谓用户坐标,即前面的高级图形函数所建立的坐标系中的坐标。坐标可以用两个向量x和y给出,也可以由一个两列的矩阵给出。如果交互作图可以用下面介绍的locator()函数来交互地从图形中直接输入坐标位置。
参数 | 解释 |
---|---|
lab=c(5, 7, 12) | |
第一个数为x轴希望画几个刻度线,第二个数为y轴希望画几个刻度线,这两个数是建议性的;第三个数是坐标刻度标签的宽度为多少个字符,包括小数点,这个数太小会使刻度标签四舍五入成一样的值。 | |
las=1 | 坐标刻度标签的方向。0表示总是平行于坐标轴,1表示总是水平,2表示总是垂直于坐标轴。 |
mgp=c(3,1,0) | 坐标轴各部件的位置。第一个元素为坐标轴位置到坐标轴标签的距离,以文本行高为单位。第二个元素为坐标轴位置到坐标刻度标签的距离。第三个元素为坐标轴位置到实际画的坐标轴的距离,通常是0。 |
tck=0.01 | 坐标轴刻度线长度,单位是绘图区域大小,值为占绘图区域的比例。tck小于0.5时x轴和y 轴的刻度线将统一到相同的长度。取1时即画格子线。取负值时刻度线画在绘图区域的外面。 |
xaxs=”s”yaxs=”d” | 控制x轴和y轴的画轴方法。取值为”s”(即standard)或”e”(即extended)的时候数据范围控制在最小刻度和最大刻度之间。取”e”时如果有数据点十分靠近边缘轴的范围会略微扩大。这种画轴方式有时会在轴的一边留下太大的空白。取值为“i”(即internal)或“r”(此为缺省)使得刻度线都落在数据范围内部,而“r”方式所留的边空较小。取值设为”d”时会锁定此坐标轴,后续的图形都使用与它完全相同的坐标轴,这在要生成一系列可比较的图形的时候是有用的。要解除锁定需要把这个图形参数设为其它值。 |
一页多图用mfrow参数或mfcol参数规定,如:
par(mfrow=c(3,2))
表示同一页有三行两列共六个图,而且次序为按行填放。类似地,par(mfcol=c(3,2))
规定相同的窗格结构,但是次序为按列填放,即先填满第一列的三个再填第二列。par(mfrow=c(1,1))即可。
缺省时无外边空。为了规定外边空大小,可以用omi参数或oma参数。omi参数使用英寸为单位,oma参数以文本行高为单位,两个参数均为四个元素的向量,分别给出下、左、上、右方的边空大小。如:
par(oma=c(2,0,3,0))函数mtext用来在外边空加文字标注。其用法为
mtext(text, side = 3, line = 0, outer = FALSE)在多图环境中还可以用mfg参数来直接跳到某一个窗格,比如
par(mfg=c(2,2,3,2))
表示在三行两列的多图环境中直接跳到第二行第二列位置。mfg参数的后两个表示多图环境的行、列数,前两个表示要跳到的位置。可以不使用多图环境而直接在页面中的任意位置产生一个窗格来绘图,参数为fig,如:
par(fig=c(4,9,1,4)/10)
此参数为一个向量,分别给出窗格的左、右、下、上边缘的位置,取值为占全页面的比例,比如上面的例子在页面的右下方开一个窗格作图。
S中一个单独的图由绘图区域(绘图的点、线等画在这个区域中)和包围绘图区域的边空组成,边空中可以包含坐标轴标签、坐标轴刻度标签、标题、小标题等,绘图区域一般被坐标轴包围。
边空的大小由mai参数或mar参数控制,它们都是四个元素的向量,分别规定下方、左方、上方、右方的边空大小,其中mai取值的单位是英寸,而mar的取值单位是文本行高度。例如:
par(mai=c(1, 0.5, 0.5, 0))
par(mar=c(4, 2, 2, 1))这两个图形参数不是独立的,设定一个会影响另一个。S缺省的图形边空常常太大,以至于有时图形窗口较小时边空占了整个图形的很大一部分。
通常我们可以取消右边空,并且在不用标题时可以大大缩小上边空。例如下例可以生成十分紧凑的图形:
oldpar <- par(mar=c(2,2,1,0.2))
plot(x,y)
在一个页面上画多个图时边空自动减半,但我们往往还需要进一步减小边空才能使多个图有意义。
函数locator(n, type)运行时会停下来等待用户在图中点击,然后返回图形中鼠标点击的位置的坐标。等待点击时用鼠标中键点击可以选择停止等待,立即返回。参数n指定点击多少次后自动停止,缺省为500次;参数type如果使用则可指定绘点类型,与plot()函数中的type 参数用法相同,在鼠标点击处绘点(线、垂线,等等)。locator()的返回值是一个列表,有两个变量(元素)x和y,分别保存点击位置的横坐标和纵坐标
例如,为了在已经绘制的曲线图中找一个空地方标上一行文本,只要使用如下程序:
text(locator(1), "Normal density", adj=0)
text()函数的adj参数用一个数字表示文本串相对于给定的坐标的画法,adj=0表示给定坐标为文本串左侧的坐标,adj=1表示给定坐标为文本串右侧的坐标,adj=0.5表示给定坐标为文本串中间的坐标。
函数identify(x, y, labels)在运行时也会停下来等待用户点击,直到按了鼠标中键,任何返回用户在图形中用鼠标点击的点的序号,点击时对点击的点加标签。参数x和y给出要识别的各个点的坐标。labels参数指定点击某个点时要在旁边绘制的文本标签,缺省时标出此点的序号,如果只需要返回值而不想画任何标记则可以在调用此函数时加一个plot=F参数。
attach(cl)
plot(Height, Weight) ;
identify(Height,Weight)
这时显示转移到图形窗口,进入等待状态,用户可以点击图中特别的点,该点的序号就会在旁边标出。为了结束,只要单击鼠标中键或单击右键并选择停止。返回结果为你点击的各个点的序号:
警告: 已经找到了最近的点
警告: 没有0.25英尺的点
[1] 1 2 10 15 16
hist(x)
作向量x的直方图。缺省时自动确定分组,也可以用nclass=
参数指定分组个数,或者用breaks=
参数指定一个分组点向量。如果指定了prob=T
则纵轴显示密度估计。
stem(cl$Weight, scale = 1, width = 80, atom = 1e-08)
The decimal point is 1 digit(s) to the right of the |
4 | 1
6 | 7
8 | 3445508
10 | 0332233
12 | 83
14 | 0
例子: 作了两个图叠加,一个为subset= supp == “VC“
,另一个为subset= supp == ”OJ“
.数据ToothGrowth有两个数量变量(len,dose)
和一个属性变量(supp)
; 对每个supp
,dose
各有三个值(各形成三个盒形图). len ~ dose
意味着box
为len
所做.
data(ToothGrowth)
boxplot(len ~ dose, data = ToothGrowth, boxwex = 0.25, at = 1:3 - 0.2, subset= supp == "VC", col="yellow", main="Guinea Pigs' Tooth Growth", xlab="Vitamin C dose mg", ylab="tooth length", ylim=c(0,35))
boxplot(len ~ dose, data = ToothGrowth, add = TRUE, boxwex = 0.25, at = 1:3 + 0.2, subset= supp == "OJ", col="orange")
legend(2, 9, c("Ascorbic acid", "Orange juice"), fill = c("yellow", "orange"))
boxplot(cl$Height~cl$Sex,data=cl,col = "lightgray");
attach(cl)
coplot(Weight ~ Height | Sex)
coplot(y~x | x1+x2)
表示对x1和x2的每一水平组合绘图。coplot()
和pairs()
函数缺省绘制散点图,但可以用一个panel=
参数指定其它的低级绘图函数,如lines
,panel.smooth
等。tsplot(x1, x2, ...)
表示绘制多条曲线,自动统一曲线取值范围。如果参数非时间序列对象则以下标1,2,3等为横坐标绘图。
- qqnorm(x), qqline(x), qqplot(x,y)作分位数-分位数图。
- qqnorm(x)对向量x作正态概率(纵轴为次序统计量值,横轴为对应该次序统计量的标准正态分布分位数值)。
- qqline(x) 除作qqnorm(x)图之外还画一条拟合曲线。
qqplot(x,y)把x和y的次序统计量分别画在x轴和y 轴以比较两个变量的分布。
x <- rnorm(50)
y <- rexp(60)
qqplot(x,y)#可以判断是不是同一个类型的分布
par(mfrow=c(2,2))#准备画22的4个图
plot(compression, distance,main= "Hooke's Law") #只有标题的图
plot(compression, distance,main= "Hooke's Law", xlab= "x",ylab= "y") #标题+x,y标记
identify(compression,distance) #标出点号码
plot(compression, distance,main="Hooke's Law") #只有标题的图
text(46,120, "f=1/2*k*s")#在指定位写入文字
plot(compression, distance,main="Hooke's Law") #只有标题的图
text(locator(2), "I am here!") #在点击的两个位置写入文字
#画图 (对数变换后)
Par(cex=0.7,mex=0.7) #character (cex) & margin (mex) expansion
plot(log(body),log(brain))
text(x=log(body), y=log(brain),labels=row.names(Animals), adj=1.5)# adj=0 implies left adjusted text
#画图 (对数变换后)
plot(log(body),log(brain))
identify(log(body),log(brain),row.names(Animals))
view.colours = function(){
plot(1, 1, xlim=c(0,14), ylim=c(0,3), type="n", axes=F, xlab="",ylab="")
text(1:6, rep(2.5,6), paste(1:6), col=palette()[1:6], cex=2.5)
text(10, 2.5, "Default palette", adj=0)
rainchars = c("R","O","Y","G","B","I","V")
text(1:7, rep(1.5,7), rainchars, col=rainbow(7), cex=2.5)
text(10, 1.5, "rainbow(7)", adj=0)
cmtxt = substring("cm.colors", 1:9,1:9)
# Split "cm.colors" into its 9 characters
text(1:9, rep(0.5,9), cmtxt, col=cm.colors(9), cex=3)
text(10, 0.5, "cm.colors(9)", adj=0)
}
view.colours()
x <- seq(-pi, pi, len = 65)
plot(x, sin(x), type = "l", ylim = c(-1.2, 1.8), col = 3, lty = 2)
points(x, cos(x), pch = 3, col = 4)
lines(x, tan(x), type = "b", lty = 1, pch = 4, col = 6)
title("legend(..., lty = c(2, -1, 1), pch = c(-1,3,4), merge = TRUE)", cex.main = 1.1)
# 注意图例书写方式
legend(-1, 1.9, c("sin", "cos", "tan"), col = c(3,4,6), lty = c(2, -1, 1), pch = c(-1, 3, 4), merge = TRUE, bg='gray90')
matplot :用矩阵的列画多线图
Usage:
matplot(x, y, type = "p", lty = 1:5, lwd = 1, lend = par("lend"),
pch = NULL,
col = 1:6, cex = NULL, bg = NA,
xlab = NULL, ylab = NULL, xlim = NULL, ylim = NULL,
..., add = FALSE, verbose = getOption("verbose"))
require(grDevices)
matplot((-4:5)^2, main = "Quadratic") # almost identical to plot(*)
sines <- outer(1:20, 1:4, function(x, y) sin(x / 20 * pi * y))
matplot(sines, pch = 1:4, type = "o", col = rainbow(ncol(sines)))
matplot(sines, type = "b", pch = 21:23, col = 2:5, bg = 2:5,
main = "matplot(...., pch = 21:23, bg = 2:5)")
x=runif(100)
x=ts(x,start=1960+(3/12),frequency=12)#构造时间序列frequency=12即按个月份构造
options(digits=2)
x
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
1960 0.444 0.849 0.459 0.659 0.277 0.268 0.958 0.926 0.595
1961 0.250 0.769 0.111 0.944 0.593 0.459 0.670 0.331 0.045 0.694 0.473 0.227
1962 0.037 0.181 0.562 0.455 0.419 0.968 0.288 0.187 0.143 0.548 0.437 0.280
1963 0.149 0.623 0.937 0.108 0.755 0.077 0.963 0.781 0.660 0.458 0.787 0.176
1964 0.997 0.650 0.045 0.849 0.018 0.744 0.148 0.964 0.844 0.660 0.080 0.303
1965 0.954 0.217 0.909 0.658 0.991 0.797 0.020 0.363 0.183 0.332 0.793 0.676
1966 0.459 0.270 0.813 0.818 0.138 0.780 0.679 0.029 0.553 0.895 0.548 0.480
1967 0.898 0.212 0.299 0.223 0.637 0.167 0.102 0.424 0.438 0.058 0.048 0.474
1968 0.254 0.381 0.532 0.089 0.825 0.337 0.382
plot(x,main="Time series")