数据的诱惑

我们常见的证据中总是会有一些数据作为支撑。但是这些数据真的可信吗?我们如何看待这些数据才不被其蛊惑。

比如我们经常被平均,说全国平均的收入水平是10000元左右,很多人感叹又拖了国家的后腿啊。但是这种平均值的可适用性有多大,我的建议是你几乎可以无视。因为我们不明确统计对象到底包括了哪些人,要是你把王健林算进来的话只能呵呵了。别人的一个小目标可能是平均值的x倍。而中国还有很多人在温饱线上下。平均值这个时候能说明什么呢。我们更希望看到收入的分布趋势,这样起码知道自己在哪一个层次。

又例如一种药物治愈率达到了95%,这个时候我们要问问总体实验人群是多少。对象是100人和10000人的效果肯定不一样。又比如有1000名患者死于某种疾病,我们并不知道总体的健康人群,总体有10000人和2000人的效果又不一样。而很多结论喜欢用这些没有对比的数据,其实是隐藏了一部分数据,干扰了我们的判断。

最后一种就是表述数据的方式,例如描述一种药物的疗效。你可以说这种药可以减少50%的复发,你也可以说用过这种药物的人95%没有复发,而没有用过这种药物的人有90%没有复发。两种表述都是同一种药物,但是方式不同。后一种是相对表示法,广告商也更愿意用这种方法描述产品。

当然无论我们接触到了什么样的数据,我们应该思考这些数据从何得来,这些数据可以得出什么结论,这些数据是不是忽略掉了重要信息。经过了这些思考我们才能摆脱数据的诱惑。更多好的建议在《学会提问》,希望大家去分析分析。

你可能感兴趣的:(数据的诱惑)