维克托·迈尔-舍恩伯格[英] 肯尼思·库克耶[英]著,盛杨燕 周涛译
第一部分,大数据时代的思维变革
2009年的H1N1病毒,爆发时谷歌比官方更早预测到了,这是基于海量用户搜索信息分析的结果,利用已有信息,其他公司还可以预测机票价格的变动。
人们所有行为都会留下痕迹,现在存储和分析信息的成本越来越低,大量存储和利用信息成为可能,我们进入了大数据时代。
大数据的核心就是预测,在数据使用上有三个转变:一是可以处理相关的所有数据而不是以往的取样分析。以前用随机采样的小数据方法,用最少的数据获得最多的信息,因为获取和存储分析数据难度很大,随机采样法是不可收集全部数据的情况下的选择,本身还是有许多固有缺陷。它的成功依赖于采样的绝对随机性,但在实际运用中实现随机性非常困难。大数据指不用随机分析法,而采用所有数据的方法。样本=总体。
二是不必追求数据的精确度,人们分析的是趋势而不追求精确度。大数据通常用概率说话。大数据的简单算法比小数据的复杂算法更有效。大数据要求我们必须接受混乱和不确定性,认为每个问题只有一个答案的想法是站不住脚的。
三是不再热衷于寻找因果关系,我们不必知道“为什么”只需要知道“是什么”。在大数据背景下,相关关系更能够帮助我们认识和分析事物。相关关系是指当一个数值增加时,另一个数据值很有可能也随之增加。通过找到一个现象的良好的关联物,相关关系可以帮助我们捕捉现在和预测未来。建立在相关关系分析法基础上的预测是大数据的核心。
在社会环境下寻找关联物是一种方法,另一种方法是通过找出新种类数据之间的相互联系来解决日常需要,通过找出一个关联物并监控它,我们就能预测未来。
这个系统依赖的是相关关系,而不是因果关系,他告诉你的是会发生什么,而不是为什么发生,这正是这个系统的价值。通过去探求“是什么”,而不是“为什么”,相关关系帮助我们更好的了解了这个世界。
第二部分,大数据时代的商业变革
一、数据化——一切皆可量化。
莫里的导航图是大数据的最早实践之一。大数据发展的核心动力来源于人类测量、记录和分析世界的渴望!
“数据化”是指一种把现象转变为可制表分析的量化形式的过程。与之不同的是,数字化指的是把模拟数据转换成用0和1表示的二进制码。量化一切是数据化的核心。
当文字变成数据,人可以阅读,机器也可以用之分析。位置信息能够变成数据,人的沟通也能变成数据,世间万物都可以数据化。将世界看作信息,看作可以理解的数据的海洋,为我们提供了一个从未有过的审视现实的视角,它是一种可以渗透到所有生活领域的世界观。
二、数据的首要价值被发掘后仍能不断给予,它的真实价值就像冰山一样,绝大部分都隐藏在表面之下。
在数字化时代,数据支持交易的作用被掩盖,数据只是被交易的对象。而在大数据时代,事情再次发生变化。数据的价值从它最基本的用途转变为未来的潜在用途。这一转变意义重大,它影响了企业评估其拥有的数据及访问者的方式,促使甚至是迫使公司改变他们的商业模式,同时也改变了组织看待和使用数据的方式。
不同于物质性的东西,数据的价值不会随着它的使用而减少,而是可以不断地被处理。
数据的价值并不仅限于特定的用途,它可以为了同一目的而被多次使用,也可以用于其他目的。要了解大数据时代究竟有多少信息对我们有价值,后面这一点尤其重要。
最终,数据的价值是其所有可能用途的总和。这些似乎无限的潜在用途就像是选择,这里不是指金融工具意义上的选择,而是实际意义上的选择。这些选择的总和就是数据的价值,即数据的“潜在价值”。
数据创新1:数据再利用,2:重组数据,3:可扩展数据,4:数据的折旧值,5:数据废气,6:开放数据。
数据价值的关键是看似无限的再利用,即它的潜在价值。收集信息固然至关重要,但还远远不够,因为大部分的数据价值在于它的使用,而不是占有本身。
三、数据、技术与思维的三足鼎立。如今,我们正处在大数据时代的早期,思维和技术是最有价值的,但是最终大部分的价值还是必须从数据本身中挖掘。
大数据价值链的3大构成:第一种是基于数据本身的公司,第二种是基于技能的公司,第三种是基于思维的公司,所谓大数据思维,是指一种意识,认为公开的数据一旦处理得当就能为千百万人急需解决的问题提供答案。
到目前为止,前两种因素一直备受关注,因为在现今世界,技能依然欠缺,而数据则非常之多。近年来,一种新的职业出现了,那就是“数据科学家”。数据科学家是统计学家、软件程序员、图形设计师与作家的结合体。与通过显微镜发现事物不同,数据科学家通过探寻数据库来得到新的发现。全球知名咨询管理公司麦肯锡,就曾极端地预测数据科学家是当今和未来稀缺的资源。如今的数据科学家们也喜欢用这个预测来提升自己的地位和工资水平。
会出现一种全新的数据中间商。现今,我们正处在大数据时代的早期,思维和技能是最有价值的,但是最终,大部分的价值还是必须从数据本身中挖掘。因为在未来,我们可以利用数据做更多的事情,而数据拥有者们也会真正意识到他们所拥有的财富。因此,他们可能会把他们手中所拥有的数据抓得更紧,也会以更高的价格将其出售。继续用金矿来打比方:只有金子才是真正值钱的。随着数据价值转移到数据拥有者手上,传统的商业模式也被颠覆了。
同样地,人类从依靠自身判断做决定到依靠数据做决定的转变,也是大数据做出的最大贡献之一。行业专家和技术专家的光芒都会因为统计学家和数据分析家的出现而变暗,因为后者不受旧观念的影响,能够聆听数据发出的声音。他们的判断建立在相关关系的基础上,没有受到偏见和成见的影响。
大数据让处于行业两端的公司受益良多,而中等规模的公司要么向两端转换,要么破产。传统行业最终都会转变为大数据行业,无论是金融服务业、医药行业还是制造业。当然,大数据不会让所有行业的中等规模的公司消亡,但是肯定会给可以被大数据分析所取代的中等规模公司带来巨大的威胁。