一、大数据时代的思维变革
1、更多 - 不是随机样本,而是全体数据
当数据处理技术已经发生了翻天覆地的变化时,在大数据时代进行抽样分析就像在汽车时代骑马一样。一切都改变了,我们需要的是所有的数据,“样本=总体”。
》让数据发声
1)首先,要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本;
2)其次,我们乐于接受数据的纷繁复杂,而不再追求精确性;
3)最后,我们的思想发生了改变,不再探求难以捉摸的因果关系,转而关注事物的相关关系;
》小数据时代的随机采样,最少的数据获得最多的信息
》全数据模式,样本 = 总体
大数据中的“大”不是绝对意义上的大,虽然在大多数情况下是这个意思。大数据是指不用随机分析这样的捷径,而采用所有数据的方法。
拥有全部或几乎全部的数据,我们就能够从不同的角度,更细致地观察和研究数据的方方面面。
1 ZB = 1024 EB; 1 EB = 1024 PB; 1 PB = 1024 TB; 1 TB = 1024 GB;
2、更杂 - 不是精确性,而是混杂性
执迷于精确性是信息缺乏时代和模拟时代的产物。只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法被利用,只有接受不精确性,我们才能打开一扇从未涉足的世界的窗户。
》允许不精确
》大数据的简单算法比小数据的复杂算法更有效
》纷繁的数据越多越好
大数据时代要求我们重新审视精确性的优劣。执迷于精确性是信息缺乏时代和模拟时代的产物。
大数据不仅让我们不再期待精确性,也让我们无法实现精确性。因为拥有更大数据量所能带来的商业利益远远超过增加一点精确性,所以通常我们不会再花大力气去提升数据的精确性。
》混杂性,不是竭力避免,而是标准途径
》新的数据库设计的诞生
相比依赖于小数据和精确性的时代,大数据因为更强调数据的完整性和混杂性,帮助我们进一步接近事实的真相。
3、更好 - 不是因果关系,而是相关关系
知道“是什么”就够了,没必要知道“为什么”。在大数据时代,我们不必非得知道现象背后的原因,而是要让数据自己“发生”
》关联物,预测的关键
相关关系通过识别有用的关联物来帮助我们分析一个现象,而不是通过揭示其内部的运作机制。通过给我们找到一个现象的良好的关联物,相关关系可以帮助我们捕捉现在和未来。
建立在相关关系分析法基础上的预测是大数据的核心。
》“是什么”,而不是“为什么”
》改变,从操作方式开始
》大数据,改变人类探索世界的方法
就是因为不受限于传统的思维模式和特定领域里隐含的固有偏见,大数据才能为我们提供如此多新的深刻洞见。
大数据时代将要释放出的巨大价值使得我们选择大数据的理念和方法不再是一种权衡,而是通往未来的必然改变。但是在我们到达目的地之前,我们有必要了解怎样才能到达。大数据趋势的深层原因,就是海量数据的存在以及越来越多的事物是以数据形式存在的。
二、大数据时代的商业变革
4、数据化 - 一切皆可“量化”
大数据发展的核心动力来源于人类测量、记录和分析世界的渴望。信息技术变革随处可见,但是如今信息技术变革的重点在“T”(技术)上,而不是在“I”(信息)上。现在,我们是时候把聚光灯打向“I”,开始关注信息本身。
》数据,从最不可能的地方提取出来
》数据化,不是数字化
数据化,是指一种把现象转变为可制表分析的量化形式的过程。
》量化一切,数据化的核心
》当文字变成数据
》当方位变成数据
》当沟通变成数据
》世间万物的数据化
将世界看作信息,看作可以理解的数据的海洋,为我们提供了一个从未有过的审视现实的视角。它是一种可以渗透到所有生活领域的世界观。
5、价值 - “取之不尽、用之不竭”的数据创新
数据就像一个神奇的钻石矿,当它的首要价值被发掘后仍能不断给予。它的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而绝大部分都隐藏在表面之下。
》数据创新1:数据的再利用
》数据创新2:重组数据
随着大数据的出现,数据的总和比部分更有价值。当我们将多个数据集的总和重组在一起时,重组总和本身的价值也比单个总和更大。
》数据创新3:可扩展数据
》数据创新4:数据的折旧值
即使数据用于基本用途的价值会减少,但潜在价值却依然强大。
》数据创新5:数据废气
》数据创新6:开放数据
》给数据估值
数据价值的关键是看似无限的再利用,即它的潜在价值。收集信息固然至关重要,但还远远不够,因为大部分的数据价值在于它的使用,而不是占有本身。
6、角色定位 - 数据、技术与思维的三足鼎立
如今,我们正处在大数据时代的早期,思维和技术是最优价值的,但是最终大部分的价值还是必须从数据本身中挖掘。
》大数据价值链的3个构成
1)基于数据本身的公司;
2)基于技能的公司;
3)基于思维的公司;
“如果你想成功,你不应该成为一个普通的、可被随意替代的任人,你应该成为稀缺的、不可替代的那类人”。
》大数据掌控公司
》大数据技术公司
》大数据思维公司和个人
他们思考的只有可能,而不考虑所谓的可行。
所谓的大数据思维,是指一种意识,认为公开的数据一旦处理得当就能为千百万人急需解决的问题提供答案。
》全新的数据中间商
谁在这个大数据价值链中获益最大呢?现在看来,应该是那些拥有大数据思维或者说创新性思维的人。
》专家的消亡与数据科学家的崛起
一个似乎经过了理智探讨的事情,其实是在没有什么实际标准的情况下做出的决定。
》大数据,决定企业竞争力
企业的规模仍然很重要,但是如今重要的是数据的规模,也就是说要掌握大量的数据而且要有能力轻松地获得更多的数据。所以,随着拥有的数据越来越多,大数据拥有者将大放异彩,因为他们可以把这些数据转化为价值。
三、大数据时代的管理变革
7、风险 - 让数据主宰一切的隐忧
我们时刻都暴露在“第三只眼”之下:亚马逊监视着我们的购物习惯,谷歌监视着我们的网页浏览习惯,而微博似乎什么都知道,不仅窃听到了我们心中的“TA”,还有我们的社交关系网。
》无处不在的“第三只眼”
》我们的隐私被二次利用了
》预测与惩罚,不是因为“所做”,而是因为“将做"
大数据的不利影响并不是大数据本身的缺陷,而是我们滥用大数据预测所导致的结果。
》数据独裁
》挣脱大数据的困境
8、掌控 - 责任与自由并举的信息管理
当世界开始迈向大数据时代时,社会也将经历类似的地壳运动。在改变人类基本的生活与思考方式的同时,大数据早已在推动人类信息管理准则的重新定位。然而,不同于印刷革命,我们没有几个世纪的时间去适应,我们也许只有几年时间。
》管理变革1:个人隐私保护,从个人许可到让数据使用者承担责任
》管理变革2:个人动因 VS 预测分析
》管理变革3:击碎黑盒子,大数据算法师的崛起
》管理变革4:反数据垄断大亨
结语:正在发生的未来
大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,而是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。
大数据是一种资源,也是一种工具。它告知信息但不解释信息。它指导人们去理解,但有时也会引起误解,这取决于是否被正确使用。