我们对一个骗子深信不疑

书很薄,看的很快

看这本书的过程中,随时会想起《寻路中国》里的一段描述:

“中国官员对于数字的使用,自有他们的一种套路——极其漫不经心之间,会背出令人咂舌的各种数字来。”

不仅仅是官方,即使是我们自己,在生活中也表现出了对统计数据的毫不迟疑的信任,甚至把一个个数据当作了荣耀的勋章,骄傲不已。却不知“世界上有三种谎言:谎言、弥天大谎和统计数据。”我们身陷骗局的漩涡中却不能自拔。

以平均工资为例,根据2017年浙江省全社会单位就业人员年平均工资统计公报,浙江省全社会单位就业人员年平均工资为60665元。看到这个数据,很多人都会大呼自己扯了大家的后腿,并为自己的收入愤愤不平,但这个“60665”的数据,却很值得我们考虑一番。

一、数据的得出的样本

目前来说,这个数据的得出以统计一套表的数据为基准,包括私营单位就业人员和非私营单位就业人员。但值得注意的是,统计一套表的原始数据由各企业事业单位自行上报,能否保证所报的数据符合客观实际?企业有没有为了减免税收而错报的可能?工人工资收入是正式员工的收入,还是包括了临时聘用人员的收入?此外,浙江作为私营企业的集聚地,大老板们的收入是不是也包括在内?

二、平均数的陷阱

就业人员年平均工资,这个平均应该是算术平均(以一套表中的报告期实际支付的全部职工工资总额/报告期全部职工平均人数),而算术平均数却是几个平均数里最不能反映实际情况的一个。假定一个企业有9名员工和1名管理者,9名员工平均工资1000元而管理者597650元,那么他们所得出的平均工资依旧是60665元,但事实上这却表明高的平均工资却是一个假数据,90%的人远远低于这个数据,而这种情况在老板遍地的浙江,却完全有存在的可能性。一个算术平均,完全无法说明是因为贫富差距的持续扩大导致工资的上涨,还是共同富裕所带来的效果。

三、显著性水平和方差

只有算术平均,而没有显著性水平和方差的统计结果,完全无法表明事实的真实情况。因为我们完全不知道什么的工资水平会落在95%的置信区间内。而以此来断定浙江的居民收入都很高?那你完全可能碰到一个贫困至极的村子。

四、标准误差

虽然浙江是民营企业强省,但也不代表所有的人都在企业上班;即使假定所有人都在企业,也不能保证这次的统计已经完全包含在内。那么这次统计的误差是多少?多大的范围下可以使用这个结论?

五、非相关性

很多情况下,我们公布平均工资,是为了表明人民的收入增加了,生活更好了。但其实高工资并不等于好生活。在工资增加的同时,物价增加了多少,通货膨胀了多少。浙江人均工资所增加的部分,有多少是因为高房价所带来的,而这在房价泡沫破裂的时候都会烟消云散。

“统计学不仅是一门科学,也是一门艺术。在允许的范围内,你可以进行大量的统计操纵,甚至扭曲事实。”

所以,在看到一个统计数据的同时,我们应该认真地思考下:这个数据是谁这么说;他得出的这个数据怎么知道;公布的内容里漏掉了什么;从调查到公布的过程中有人偷换了概念吗;这是否合乎情理。我们不该再对这个骗子深信不疑了。



虽然学过统计学,但早已还给老师,所以可能表述有不甚准确的地方,欢迎指正。

你可能感兴趣的:(我们对一个骗子深信不疑)