夏皮罗-威尔克检验(Shapiro–Wilk test)

1介绍

夏皮罗-威尔克检验是一种在频率上统计检验中检验正态性的方法。它在1965年由夏皮罗和威尔克发表

2、理论

Shapiro-Wilk检验检验了样本x 1,…,x n来自正态分布总体的原假设。该检验统计量是
夏皮罗-威尔克检验(Shapiro–Wilk test)_第1张图片

3、解解释

该检验的零假设是总体呈正态分布。因此,如果p值小于所选的alpha级别,则否定假设被拒绝,并且有证据表明所测试的数据不是正态分布的。另一方面,如果p值大于选定的alpha级别,则不能拒绝零假设(数据来自正态分布的总体)(例如,对于.05的alpha级别,数据集用p小于0.05拒绝零假设的数据是从一个正态分布群体)的值。[4]

像大多数统计显着性检验一样,如果样本量足够大,则该检验甚至可以检测到零假设的微不足道的偏离(即,尽管可能具有统计学上的显着影响,但可能太小而没有任何实际意义);因此,通常建议对效应大小进行其他研究,例如在这种情况下使用Q-Q图

4、实操

import pandas as pd
import numpy as np
from sklearn import model_selection
import statsmodels.api as sn
import scipy.stats as stats
sdata = pd.read_csv("../input/traindatas/char7/Predict to Profit.csv")

st = stats.shapiro(sdata.Profit)
print(st.pvalue,st.statistic)

输出结果:
在这里插入图片描述

你可能感兴趣的:(数据科学,数据分析)