python验证正态分布

分析建模,日常问题整理(十四)


2018.10.29~2018.11.4


    1. sns制作直方图+分布图,箱线图

sns.distplot(dat['var'])
返回数据直方图和分布图
sns.boxplot(x='days', y="B", data=dat)
返回每一天数据箱线图,异常值

    1. python验证正态分布
fig = plt.figure()
res = stats.probplot(tem['VAR'].astype(float), plot=plt)
PP图.png

通过P-P图可以检验数据是否符合指定的分布。当数据符合指定分布时,P-P图中各点近似呈一条直线。
如果需要用回归模型时,要求变量不能太偏离正态分布,如果有极大值或者极小值,则需要通过标准化或者对数化进行数据转化后再使用。

from scipy.stats import norm
from scipy import stats
sns.distplot(tem[var'].astype(float),fit=norm)
fig = plt.figure()
res = stats.probplot(tem['var'].astype(float), plot=plt)
## 验证正态分布
pp.png

从上图中可以看出,直方图的数据分布偏离了正态分布的,因此需要进行数据处理或转化。

    1. 百分数转化的几种用法

print('%s%%' % 12) %s为格式化字符串,第二个%为转义第三个%成为百分比符号,而不是格式化符号。第四个%连接需要格式的字符串或者数值。
format(0.0123, '.3%') format直接将数值转化为百分比。

你可能感兴趣的:(python验证正态分布)