Python正态性检验(最简单的方法)

正态分布也被成为高斯分布。我最讨厌理论了,实在是网上理论太多。。。看不进去。

直接2个步骤:

  1. 做Hist图(直方图)
  2. 用KStest检验P值
import pandas as pd
import os 
import numpy as np
import matplotlib.pyplot as plt

os.chdir('C://Users//username//Desktop')

df=pd.read_csv('test.csv',encoding='gbk')

df['casual'].hist(bins=20)
df['casual'].plot(kind='kde',secondary_y=True) #设定次轴

from scipy import stats

u=df['casual'].mean() #计算均值
std=df['casual'].std() #计算标准差
stats.kstest(df['casual'],'norm',(u,std))

Python正态性检验(最简单的方法)_第1张图片
Python正态性检验(最简单的方法)_第2张图片
结论:

  1. 从直方图也能看出右偏态严重
  2. 做了高斯检验,P值<0.05就不是正态分布

你可能感兴趣的:(数据清洗)