关于统计学中q-q图为什么正态分布是一条直线(R语言绘图说明)

q-q图的概念说明:http://baike.baidu.com/view/4972145.htm

标准正太分布绘制代码:

x<-seq(-4,4,0.01)
plot(x,dnorm(x),type='l')
关于统计学中q-q图为什么正态分布是一条直线(R语言绘图说明)_第1张图片


样本分布:

关于统计学中q-q图为什么正态分布是一条直线(R语言绘图说明)_第2张图片


上图中的曲线就是对样本直方图平滑后得到的,设这条曲线的函数式为:y=f(x)

如果样本是按正态分布的,那么f(x)即是一个正太分布的概率密度函数。根据正太分布的特性,我们又可以推导出:

y = f( (x-m)/std ) 就是标准正太分布的概率密度函数。其中m为样本均值,std为样本标准差。

q-q图中分位数的概念,其实就是找出样本中每一个值对应标准正太分布的x值

设标准正太分布的概率密度函数为 y= f(n),既然这些值一一对应,则有:

(x-m)/std=n

即:x=n*std+m 

这是一条斜率为样本标准差,截距为m的直线,就是在q-q图中代表着正态分布的直线。


在R语言中, q-q图还有95%置信区间, 哪位要是知道这两根虚线是怎么得到的,请不吝赐教,谢谢。



你可能感兴趣的:(数理统计,q-q,plot,R)