《大数据时代》读后的思考

转载注明出处:www.cnblogs.com/lucasysfeng

关注作者:新浪微博@小山best

 

什么是大数据?

  数字大就叫大数据吗,当然不是。数据量大就叫大数据吗,也不准确。“大”的标准是什么?1TB?还是 1PB    1EB   1ZB?“大小多少”永远都是个相对概念。

  (1TB(太)=1024GB   1PB(拍)=1024TB    1EB(艾)=1024PB    1ZB(泽)=1024EB)

  大数据里的“大”不能用一个具体的数字作为衡量标准,它是一个相对概念。那么什么时候我们称数据为“大数据”呢?书中说“大数据是指不用随机分析法这样的捷径,而是采用所有数据的方法”。简单的理解,大数据就是全体数据,而不是随机抽取的样本。举个例子,谷歌通过人们的搜索记录来预测流感,谷歌依靠的数据不是随机抽取的搜索记录,而是整个美国几十亿条互联网的检索记录。

  “样本=总体”,是大数据最简单直接的理解。

 

大数据时代的思维变革

  上面讲的 样本=总体 是大数据的基本特征,除此之外,大数据关注混杂性,而不是精确性;大数据关心相关关系,而不是因果关系。

精确性,可能会导致数据量的流失,因为精确会过滤数据;有一定的容错前提,才能研究更多的数据。“大数据通常用概率说话,而不是板着确凿无疑的面孔”。

  一旦抱着因果心态去研究问题,结论其实早就已经定了。研究数据之间的相关关系,而不是因果关系,可能会得出令人振奋的结论。美国飓风和蛋挞之间有因果关系吗?通过大数据分析,研究者发现,当美国飓风来临时,蛋挞相当好卖!如果抱着因果关系研究二者,恐怕很难得出这个结论。

  作者认为应该关心“相关关系”,而不是“因果关系”,但我以为,相关关系只能看做研究大数据的一个手段,因果关系才是推动我们研究问题的根本驱动所在!

 

大数据时代的商业变革

  Information(信息)Technology(技术),我们得到了大数据,只能说得到了信息,如果没有技术手段的处理,大数据只是未被挖掘的金矿,没有技术的支持,大数据一文不名。但是,忽略数据的获取,过分强调技术,也是不可取的,数据才是根本。

作者将大数据时代的商业分为数据掌控公司,数据技术公司和数据思维公司等,可以看做是未来大数据的商业方向。

  我们能用大数据做什么?我认为终极目的是预测!如果仅仅用大数据进行总结,那么大数据的魅力也不会这么大了,预测是震撼和惊人的!

  当然,伴随着大数据的到来,隐私和安全也是一个重要的问题,这里不再展开。

 

你可能感兴趣的:(大数据)