统计数据初识

一、数据的集中趋势

1. 平均数

    一组数字的总和 / 数字总个数。

2. 中位数

    一组数字进行排序,中间位置的数;记其总个数为N,若N为奇数,则第(N+1)/2为中位数;若N为偶数,则第(N/2)和(N/2+1)个数的平均数为中位数。

3. 众数

    一组数字中出现频次最高的数字;若频次最高的有多个数字,则均为众数。

4. 极差

    一组数字中最大数和最小数的差值。

5. 中程数

    一组数字中最大数和最小数的平均数。

6. 分位数

    将给定的一组数字从小到大排序,其N分位数为将这组数据N等分位置处的数字;若对应的位置不是整数,则根据该非整数位置前、后整数位置数字等比例推算分位数。

    例如:求某组数字的N分位数,将改组数字从小到大排序,记其数字总个数为M;若M/N是小数,ceil(M/N)位置处的数字为a,floor(M/N)位置处的数字为b,则其1/N分位数为 = a + (M/N - ceil(M/N)) * (b - a)。

7. 算数平均数

    针对无差别的一组数据,每个数字对于平均数的贡献占比相同;计算方法:所有数字求和 / 数字总个数。

8. 加权平均数

    针对有差别的一组数据,每个数字对于平均数的贡献占比不同;计算方法:。

9. 几何平均数

    n个数字连乘积的n次方根。

二、数据的离中趋势

1. 方差

    一组数字中,各数字与该组数字平均数差值平方和的算术平均数;计算方法:。

2. 标准差

    方差的算术平方根。

3. 平均差

    一组数字中,各数字与该组数字平均数差值绝对值的算术平均数;计算方法:。

4. 四分位差

    上四分位数(3/4位置处)与下四分位数(1/4位置处)的差。

5. 异众比率

    总体中非众数次数与总体全部次数的比值。

三、相对离散程度

1. 离散系数

    又称变异系数,为标准差与平均值之比;离散系数越大,表明样本的离散程度越大。

四、分布的形状

1. 偏态系数

    又称偏差系数,反应数据分布非对称情况;以众数、中位数与均值之差对标准差之比来衡量数据分布的偏斜程度;偏态系数大于0为右偏(正偏),偏态系数小于0为左偏(负偏)。

(后补)

2. 峰态系数

    反应频数分布曲线顶端尖峭或扁平程度。

(后补)

你可能感兴趣的:(统计数据初识)