统计学陷阱

1.内在有偏的样本:样本条件不一致,不具备准确性

2.精心挑选的平均数:平均数误导(算术平均数,众数,中位数在不满足正太分布的前提下,差距较大)

3.没有披露的数据:样本过低

4.毫无意义的工作:利用毫无价值的数据宣传产品,提高产品竞争力

5.惊人的统计图形:图表数据不展示基数,或省略中间部分(刻度值欺骗)

6.平面图形:在三维角度上,根据增加倍率相应变宽变高,达到视觉欺骗

7.不相匹配的资料:比如:“去年飞机失事造成的人员死亡比 1910 年多”,这是否意味着现在乘飞机要比过去危险?认为更危险的说法是不合理的,因为选择飞机作为交通工具的人已经是以前的几百倍了

8.相关关系与因果关系:相关系数,越接近1越正相关

9.如何进行统计操纵:比如:首先选择去年作为基期,也就是说,以去年的价格为 100%。既然牛奶的价格降了一半(即50%),并且面包的价格是去年的 2 倍(即 200%),将 50%与 200%进行平均得125%,与去年相比,今年的价格上涨了 25%。用另一种方法试试,以今年的价格为基期。去年牛奶的价格是今年的 200%,而面包的价格是今年的 50%,平均数又是 125%,也就是说,去年的价格比今年的高 25%,今年的价格下降了

10.对统计资料提出的五个问题:

  1. 谁说的
  2. 他是如何知道的
  3. 是否有人偷换了概念?
  4. 偷换概念还有许多值得注意的方式。
  5. 这个资料有意义吗?

你可能感兴趣的:(数据分析)