4.2.1直方图
hist()的调用格式
hist(x,breaks="Sturges",freq=NULL,probability=!freq,col= NULL,
main=paste("Histogram of" ,xname),xlim=range(breaks),ylim = NULL, xlab = xname, ylab, axes = TRUE, nclass = NULL)
说明:若选项breaks取向量,则用于指明直方图区间的分割位置;若取正整数,则用于指定直方图的小区间数.
freq取T表示使用频数画直方图,取F则使用频率画直方图.probability与freq恰好相反.col用于指明小矩形的颜色.
4.2.2核密度估计
样本的直方图粗略地描述了样本的分布,我们还可以用函数density( )得到样本的核密度估计值,并用lines()得到密度估计的曲线.density( )常用的调用格式如下:
density()的调用格式
density(x,bw="nrd0",
kernel=c("gaussian","epanechnikov","rectangular","triangular","biweight","cosine","optcosine"),n=512,from,to)
说明:选项bw指定核密度估计的窗宽,也用字符串表示窗宽选择规则,具体可参考函数bw.nrd( ).
kernel为核密度估计所使用的光滑化函数,缺省为正态核函数.
n给出等间隔的核密度估计点.from与to分别给出需要计算核密度估 计的左右端点.
从二项分布binom(100,0.9)中抽取容量为N=100000的样本.试作出它的直方图及核密度估计曲线.
N<-100000
n<-100
p<-.9
x<-rbinom(N,n,p) #从二项分布binom(100,0.9)中抽取容量为N=100000的样本
hist(x,xlim=c(min(x),max(x)),probability=T,nclass=max(x)-min(x)+1,col='lightblue', main='Binomial distribution,n=100,p=.5')
lines(density(x,bw=1),col='red',lwd=3)
从负二项分布nbinom(10,0.25)中抽取容量为N=100000的样本.试作出它的直方图及核密度估计曲线.
样本的密度函数估计也可使用局部多项式估计程序包locfit
N<-100000
x<-rnbinom(N, 10, .25)
hist(x,xlim=c(min(x),max(x)),probability=T,nclass=max(x)-min(x)+1,col='lightblue',
main='Negative binomial distribution,n=100, p=.25')
lines(density(x,bw=1),col='red',lwd=3)