均值-异常值-中位数-众数

均值中位数众数等这些都被归为汇总数据的方法。都是为了表达数据中的集中趋势,也就是掌握数据的核心,但仅凭其中一种,是不能够准确表达这种趋势的。

注:平均数均值  我们经常说的平均数其实是算数平均数,也就是均值。因为平均数是个大概念,例如还有几何平均数、调和平均数、加权平均数等等,而均值则是指在一组数据中所有数据之和再除以数据的个数。它是反映数据集中趋势的一项指标。它与每个数据都有关,在生活中最为常见。


均值

异常值

数据集中会包含一个或多个数值异常大或异常小的值,这样的极端值称为异常值

有异常值存在,就会导致数据的集中趋势偏移,也就是均值,或偏大或偏小,因此有时候在数据分析时首先就要剔除异常值,当然要视情况而定。

中位数

将一组数据从小到大(或从大到小)排列,中间的那个数字(或最中间的两个数字的平均值)为该组数据的中位数。如果数据个数为奇数,那就是最中间的那个数,如果为偶数,就是最中间两个数的平均值。

中位数的优点:当数据中存在少数异常值时,它不受其影响,这一点是优于均值的。

                                                       (n+1)/2

众数

一组数据中出现次数最多的数值,叫众数。有时众数在一组数中有好几个,当所有数据出现次数都一样时,却没有众数。

和中位数一样,众数也不受少数的极端值影响,但它的可靠性较差。当数据类型为非数值型的数据时,它最常用。

你可能感兴趣的:(均值-异常值-中位数-众数)