通俗讲解qq plot

此qq图和腾讯的qq图不是同一个东西啦,这个qq图是对数据的分布情况的统计检验,下面简单介绍一下qq图的原理

我的理解

qq图就是理论值和实际值的关系图,x=理论值,y=实际值。

对于实际值,我们很容易得到,但是理论值就有点不太好理解了。要得到理论值,首先就是先要得到一些列的分位点区间(分位点就是指将一个随机变量的概率分布范围分为几个等份的数值点,如0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9,分为点区间就是这些相邻的点两两组合,即0-0.1、0.1-0.2、0.2-0.3、0.3-0.4、0.4-0.5、0.5-0.6、0.6-0.7、0.7-0.8、0.8-0.9),然后求出分位点区间的中间值(即0.05、0.15、0.25、0.35、0.45、0.55、0.65、0.75、0.85、0.95),最后根据中间值和函数的反函数求出理论分布的值,再画图就好了。

上面只是简单说一下,实际中的公式应该是:
qq图公式

x值是通过分为点区间中间值和反函数求得的理论值,y值是实际值。
通俗讲解qq plot_第1张图片
qq plot

要画qq plot,可以在spss上实现,也可以在R上实现。在R上,qqplot和qqnorm不是同一个函数,qqplot应该是两样本的正态性对比,而qqnorm应该是样本与样本期望的正态性对比。

维基百科的解释

在统计学中,Q-Q(分位数 - 分位数)图是概率图,其是通过将绘制两个概率分布的分位数来比较两者分布关系的图形方法。首先,选择一系列的分为点区间。第一个分布的点(x轴)和第二个分布的点(y轴)组成了qq图上的一个点。因此,该线是具有参数的参数曲线,该参数是分位数的间隔的数量。

如果两个分布比较相似,那么qq 图上的点就大致分布在y=x的线上。如果这两个分布线性相关,那么qq 图上的点就大致分布在一条线上,但不一定在y=x上。Q-Q图也可以用作估算位置分布中的参数的图形方法。

qqplot用来比较分布的形状,提供两个分布中属性(如位置,比例和偏度)相似或不同的图形视图。Q-Q图可用于比较数据集合或理论分布。用qq图比较两组数据被认为是一种非参数的方法比较他们的可能分布情况。对于上诉这些情况,qq图是比普通的技术比较柱状图跟有说服力的方法,但同时也需要更多地方式来解释。Q-Q图通常用于将数据集与理论模型进行比较。这可以提供对图形的“适合度”的评估,而不是简化为数字摘要。 Q-Q图也用于比较两种理论分布。由于Q-Q图比较分布,因此不需要将值作为对观察,如在散点图中,或者甚至对于被比较的两个组中的值的数量相等。

术语“概率图”有时特指Q-Q图,有时表示更一般的图,有时表示不太常用的P-P图。 概率图相关系数图(PPCC图)是从Q-Q图的概念导出的量,Q-Q图测量拟合分布与观测数据的一致性,并且有时用作拟合数据分布的手段。

ps 有空了再修改吧

参考:
Quantile-Quantile (q-q) Plots
请问qqplot和qqnorm有什么区别
分位数
Q–Q plot

你可能感兴趣的:(通俗讲解qq plot)