文章目录
- 引述
- 相关的数学基本概念
-
- 雅克‐贝拉检验(Jarque‐Beratest) (大样本 n>30)
-
- 1. JB简介
- 2. 使用假设检验证明该随机变量为正态分布的步骤
- 3. 使用MATLAB进行JB检验
- 夏皮洛‐威尔克检验(Shapiro‐wilk)(小样本 3≤n≤50)
-
- 1. 使用假设检验证明随机变量符合正态分布的步骤
- 2. SPSS操作步骤
- Q-Q图(尽可能使用上述的两种检验方式)
-
- 1. Q-Q图简介
- 2.使用MATLAB绘制Q-Q图
引述
在上一节的最后,我们提到了皮尔逊相关系数检验的条件。其中,第一条提到,实验数据通常是成对的来自于正态分布的总体。因此,本节的重点将放在如何对数据进行正态分布检验。
相关的数学基本概念
偏度
![数学建模——相关系数(3)——对数据进行正态分布检验_第1张图片](http://img.e-com-net.com/image/info8/d93ee38efe4a47fd9cf1eef8225d59d6.jpg)
峰度
![数学建模——相关系数(3)——对数据进行正态分布检验_第2张图片](http://img.e-com-net.com/image/info8/db9a8c72b56145b4b253f8953067d0b0.jpg)
相关MatLab代码
x = normrnd(2, 3, 100, 1); % 生成100*1的随机向量,每个元素是均值为2,标准差为3的正态分布
skewness(x) % 偏度
kurtosis(s) % 峰度
% 将第一行的代码中的100,改成更大的数,例如10000。观察一下,偏度和峰度的大小。
% 数字越大,偏度越接近0,峰度越接近3.
雅克‐贝拉检验(Jarque‐Beratest) (大样本 n>30)
1. JB简介
对于一个随机变量{Xi},假设其偏度为S,峰度为K,那么我们可以构造JB统计量:
![数学建模——相关系数(3)——对数据进行正态分布检验_第3张图片](http://img.e-com-net.com/image/info8/b64a290ea3404c35ae23bcf062bc585f.jpg)
可以证明,如果{Xi}是正态分布,那么在大样本情况下JB~X2(2)(自由度为2的卡方分布)【正态分布的偏度为0,峰度为3】
2. 使用假设检验证明该随机变量为正态分布的步骤
- 零假设H0:该随机变量服从正态分布,备择假设H1:该随机变量不服从正态分布;
- 计算该变量的偏度和峰度,代入JB统计量,得到检验值JB*;
- 计算出该检验值对应的p值;
- 若 p < 0.05,拒绝原假设,即该随机变量不服从正态分布;否则,不能拒绝原假设,也就是该随机变量服从正态分布。
3. 使用MATLAB进行JB检验
- 语法
[h, p] = jbtest(x, alpha)
- 输入参数
alpha:显著性水平,一般取 0.05,此时置信水平为 1 - 0.05 = 0.95
x:要检验的随机变量,x必须为向量。
- 输出结果
h = 1,拒绝原假设
h = 0,不能拒绝原假设
%% 正态分布检验
% 检验第一列数据是否为正态分布
% Test是使用的测试数据(被导入的EXCEL文件)
[h, p] = jdtest(Test(:, 1), 0.05)
% 用循环检验所有列的数据
n_c = size(Test, 2); % number of column 数据的列数
H = zeros(1, 6);
P = zeros(1, 6);
for i = 1 : n_c
[h, p] = jdtest(Test(:, i), 0.05);
H(i) = h;
P(i) = p;
end
disp(H)
disp(P)
夏皮洛‐威尔克检验(Shapiro‐wilk)(小样本 3≤n≤50)
1. 使用假设检验证明随机变量符合正态分布的步骤
- 零假设H0:该随机变量符合正态分布;备择假设H1:该随机变量不符合正态分布;
- 计算出威尔克统计量后,得到相应的p值;
- 置信水平为95的前提下,若 p < 0.05,拒绝原假设,否则不能拒绝。
2. SPSS操作步骤
分析 → 描述统计 → 探索 → 点击右侧 图 → 勾选含检验的正态图
![数学建模——相关系数(3)——对数据进行正态分布检验_第4张图片](http://img.e-com-net.com/image/info8/0694c86835184e0596c85f79660f60bf.jpg)
Q-Q图(尽可能使用上述的两种检验方式)
1. Q-Q图简介
- 在统计学中,Q-Q图(Q代表分位数Quantile)是一种通过比较两个概率分布的分位数对两个概率分布进行比较的概率图方法。
- 首先选定分位数的对应概率区间集合,在此概率区间上,点(x,y)对应于第一个分布的一个分位数x和第二个分布在和x相同概率区间上相同的分位数。
- 这里,我们选择正态分布和要检验的随机变量,并对其做出Q-Q图,若要检验的随机变量是正态分布,那么Q-Q图就是一条直线。
2.使用MATLAB绘制Q-Q图
要利用Q-Q图鉴别样本数据是否近似于正态分布,只需要看Q-Q图上的点是否近似地在一条直线附近,但是其要求数据量十分巨大!
示例代码:
% 绘制第一列数据的Q-Q图
qqplot(Test(:, 1))
![数学建模——相关系数(3)——对数据进行正态分布检验_第5张图片](http://img.e-com-net.com/image/info8/d72e8131b8264c6f9218c4b0fd1d43d9.jpg)