几个基础概念

极差:range = max -min

方差:更适合离散趋势的描述

标准差

变异系数:标准差/均值,值越大,离散程度越大


切比雪夫定理:

在任何一个数据集中,至少有(1- 1/z^2)的数据项与平均数的距离在z个标准差之内,其中z是任意大于1的值

定理含义:

1. 至少有75%的数据项与平均数的距离在2个标准差之内

2. 至少有89%的数据项与平均数的距离在3个标准差之内

3. 至少有94%的数据项与平均数的距离在4个标准差之内


正态分布--最常用的连续型分布

关于正则分布的经验法则:

1. 约68%的数据项与平均数的距离在1个标准差之内

2. 约95%的数据项与平均数的距离在2个标准差之内

3.几乎全部数据项(99.97%)与平均数的距离在3个标准差之内



你可能感兴趣的:(几个基础概念)