大数据四十二条

作者:何宝宏

  1. 每个时代的人,都会认为自己所面对的数据太大了。

  2. 每个时代对大的理解都不同,古汉语中“三”就很大了,后来是“九”。

  3. 所谓大数据,就是一个如何将数据变小的过程。

  4. 2019年,大数据的“大”已不再是核心问题,核心是如何更快,比如流计算。

  5. 数据大了价值不一定就高,价值更可能被大噪音淹没掉。

  6. 主张让大数据放弃追求因果关系,就是要让我们回退到巫术时代。

  7. 主张大数据不再采样而是全集,只是技术外行的YY而已。

  8. 大数据主张用数据说话,但数据也会说谎,而人类更喜欢听故事。

  9. 数据的内涵在不断丰富中:数据是信息,数据是资产,数据是隐私,数据是可回收垃圾(如大数据),数据是有害垃圾(如DDOS攻击、垃圾邮件)等。

  10. 数据的内涵日益丰富,将导致管理技术必然走向碎片化、层级化或分布式。

  11. 数据管理技术正在:1)底层数据模型,2)业务方向,3)架构方式和4)处理时效性,从四个维度四散开来。

  12. 分布式的浪潮最早发生在分析型和非关系型领域(即传统大数据),现在杀了个回马枪,回到事务型和关系型了。

  13. 数据分析技术的几个发展趋势:向上与AI融合,向下与云和异构计算结合,中间正流批结合、分析事务融合和一体化等。

  14. 大数据是因为数据大,区块链是因为数据贵。

  15. 数据可视化是因为机器看懂了但人看不懂,AI是因为人看懂了机器看不懂。

  16. 开源已经垄断了大数据生态。

  17. 云计算的优点主要被城里的数据享受了,环境破坏的代价却留给了村里的数据,于是就有了边缘计算。

  18. 大数据被夹在两座大山中,一边是隐私要保护,一边是资产要流通。

  19. 一年来,GDPR带来了全球隐私保护立法的热潮。

  20. 你不能在拥有100%安全的情况下,同时拥有100%的隐私和100%便利性。(时任美国总统奥巴马,2012年)

  21. 现在,每个人的数字化身都是数字奴隶,没有归宿的灵魂在数字世界里飘荡。

  22. 现在电话号码是隐私,而30年前,会公开刊登在邮局的黄页上。

  23. 你没有隐私, 忘记这事吧。

  24. 1993年,”在互联网上,没有人知道你是一条狗”。而在大数据时代,没有人不知道你是一条狗。

  25. 现在,人与人见面打招呼“你还记得我啊”,是一种幸福。将来,打招呼时说“我还记得你啊”,是一种威胁。

  26. 数据资产化,资产数据化,数据托管化(云)。

  27. 2019年,业界从关注数据技术,转向了关注数据资产。

  28. 以前数据更多的是信息,现在数据更多的是资产。

  29. 传统的三大数据管理框架,都假设数据是信息,而不是资产。

  30. 就像河伯还没遇见大海时,任何企业所拥有的大数据其实都是小数据。

  31. 数据流通,还处于男耕女织的时代。

  32. 比特是计量数据规模的基本单位,不应作为计量数据流通价值的基本单位。

  33. 经济学是建立在工业经济的假设上的,而现在已经是数字经济了。

  34. 亟需数据流通的经济理论突破,这个问题是诺奖层级的,当然也可能是图灵奖的。

  35. 信息技术革命前人类是信息的饿汉,就像工业革命前人类是食品的饿汉。

  36. 拥有知识的不一定是知识分子,也可能只是个知识的吃货。

  37. 数据是21世纪的石油,但别忘了20世纪前石油不是战略资源。

  38. 石油应用也曾经历过至暗时期:当洛克菲勒让石油(煤油)主要用于照明时,爱迪生发明了电灯。石油的主要用途转向动力,是因为汽车的发明和亨利福特将其平民化。

  39. 记忆是例外,忘记是常态,于是我们发明了文字、书籍和大数据来当人脑的外设。人类社会的诸多规则和习惯,是建立在人人都有健忘症的假设上的,但这个假设正在被大数据连根拔掉。

  40. 算法是数字世界的运行规则。

  41. 算法没有偏见,只有人才会有。

  42. 电磁介质的普遍寿命是5-30年,1000年后“它们”如何考古呢?

原文链接:原文地址​​​​​​​

你可能感兴趣的:(大数据)