R QQ plot

部分借鉴 百度百科及http://blog.sina.com.cn/s/blog_7cffd14001016fan.html,http://onlinestatbook.com/2/advanced_graphs/q-q_plots.html


QQ图的作用

用于直观验证一组数据是否来自某个分布,或者验证某两组数据是否来自同一(族)分布。在教学和软件中常用的是检验数据是否来自于 正态分布。如果数据越接近直线,则它越接近服从正态分布。

QQ图的结构

若是检验一组数据是否来自某个分布,分布函数为F(x),通常图的纵坐标为 排好序的实际数据(次序统计量:x(1)
假设你有100个数据,那么每个数据都看做一个分为点,sample quantilies就是100个数据本身(1%的分为点就是100个数中最小的那个数,2%的分为点就是100个数中第二小的那个数,依次类推),theoretical quantilies是什么呢?
他是标准正态分布的分位数100个数取哪些分位点呢?具体的计算方法是这样的,(1:100-0.5)/100 你可以得到0.005 0.015 0.025 ...0.995,然后分别计算在0.005 0.015 0.025 ...0.995的面积下(也就是0.005 0.015 0.025 ...0.995的概率下)标准正态分布的分位数是什么。这样你就得到了theoretical quantilies。
在R中关于qqplot的函数有qqplot和qqnorm,可以用来验证。如下:
       作图的过程就很简单了
       x<-rnorm(100,10)
       plot(qnorm((1:100-0.5)/100),sort(x),col=2)
       可以比较一下
       qqnorm(x)

你可能感兴趣的:(R语言)