读《大数据时代》

读《大数据时代》

作者是英国的经济学家维克托·迈尔·舍恩伯格。

1,作者以一个例子开篇,向我们直观的展示了大数据的威力。

SARS 病毒发生时,Google发布的预测数据和两周后疫情控制中心发布的实时数据比,准确率达到97%,它就是通过几十亿条的搜索信息进行分析做到的。

2,什么是大数据?

国际标准是4V,就是数量、多样、价值、速度。作者提出的大数据三原则:第一,大数据不是随机样本,而是全体数据。第二,大数据不是精确性的,而是混杂性的。第三,大数据彼此不是因果关系,而是相关关系。这三原则对人类认知带来了深刻改变。

(1)随机调查的缺陷在于无法做到绝对随机,所以一定会存在误差。同时随机调查不能深入细致地反映事情的本质,这一点作者举出了两个美国人分析日本相扑比赛的例子。

(2)通过提高测量工具来提高精确性,反而永远无法达到真正的精确。混杂才能带来真正意义上的精确。因为混杂世界的天性,只有5%的数据是可以结构化的,95%的数据是非结构化的。当我们说数据统计,那么我们就是究竟增长了多少?增长的数量是多少?这样你就把很多信息给屏蔽掉,95%以上都给屏蔽了,你调查对象是谁,他的这个习惯,他的日常生活,他的这个偏执,这些我们都不在统计之内。觉得这有什么用啊,这样我们就失去了95%的数据。那么你所反映的世界永远只是那5%的世界,那看起来确实很有规律,很有秩序,看着很漂亮。但是95%的世界在你关注之外,所以你拿着这个数据总结出的规律必然是错的。

(3)因果关系是我们在数据不够的情况下,依据少量数据而形成的一种认知,这种认知正确不正确要通过实践反复去证明它。相关关系则是这个世界更普遍的真理,它广泛的存在。

(4)在大数据时代,并不是每一个人都有收集运用大数据的能力,但是我们一定要有大数据思维,知道大数据的优势并且接受它、运用它。

(5)面对大数据我们同样不能盲目,要理性的来看待它,盲目推崇会陷入到唯数据至上的情景里。

你可能感兴趣的:(读《大数据时代》)