R与χ²分布(1) 概率密度函数

卡方分布(chi-square distribution, χ²-distribution)是概率论与统计学中常用的一种概率分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。卡方分布是一种特殊的伽玛分布。假设检验和置信区间的计算。

由卡方分布延伸出来皮尔森卡方检定常用于:
(1)样本某性质的比例分布与总体理论分布的拟合优度;
(2)同一总体的两个随机变量是否独立;
(3)二或多个总体同一属性的同素性检定。

数学定义
若k个随机变量Z_1、……、Z_k是相互独立,符合标准正态分布的随机变量(数学期望为0、方差为1),则随机变量Z的平方和
[img]http://upload.wikimedia.org/math/1/8/1/181776d8fe5a35865529c7a7a7157f9d.png[/img]
被称为服从自由度为 k 的卡方分布,记作
[img]http://upload.wikimedia.org/math/d/f/e/dfec0484bdccc45a71e8393cb6e02c3f.png[/img]
卡方分布的概率密度函数为:
[img]http://upload.wikimedia.org/math/7/c/6/7c6754d1c597c0bfdc98d52ab3e2ff72.png[/img]
其中x≥0,当x≤0时f_k(x)=0。这里Γ代表Gamma函数

set.seed(1000)
x<-seq(0,10,length.out=1000)
y<-dchisq(x,1)

plot(x,y,col="red",xlim=c(0,5),ylim=c(0,2),type='l',
xaxs="i", yaxs="i",ylab='density',xlab='',
main="The Chisq Density Distribution")

lines(x,dchisq(x,2),col="green")
lines(x,dchisq(x,3),col="blue")
lines(x,dchisq(x,10),col="orange")

legend("topright",legend=paste("df=",c(1,2,3,10)), lwd=1, col=c("red", "green","blue","orange"))


结果如下:

[img]http://dl2.iteye.com/upload/attachment/0103/6041/bd765f2f-00a9-372b-97b3-91b3761e364f.png[/img]

你可能感兴趣的:(R,Data,analysis)