大数据四十二条

年底了,小结下我对大数据的一些言论。版权所有,引用请注明出处。

  1. 每个时代的人,都会认为自己所面对的数据太大了。
  2. 每个时代对大的理解都不同,古汉语中“三”就很大了,后来是“九”。
  3. 所谓大数据,就是一个如何将数据变小的过程。
  4. 2019年,大数据的“大”已不再是核心问题,核心是如何更快,比如流计算。
  5. 数据大了价值不一定就高,价值更可能被大噪音淹没掉。
  6. 主张让大数据放弃追求因果关系,就是要让我们回退到巫术时代。
  7. 主张大数据不再采样而是全集,只是技术外行的YY而已。
  8. 大数据主张用数据说话,但数据也会说谎,而人类更喜欢听故事。
  9. 数据的内涵在不断丰富中:数据是信息,数据是资产,数据是隐私,数据是可回收垃圾(如大数据),数据是有害垃圾(如DDOS攻击、垃圾邮件)等。
  10. 数据的内涵日益丰富,将导致管理技术必然走向碎片化、层级化或分布式。
  11. 数据管理技术正在:1)底层数据模型,2)业务方向,3)架构方式和4)处理时效性,从四个维度四散开来。
  12. 分布式的浪潮最早发生在分析型和非关系型领域(即传统大数据),现在杀了个回马枪,回到事务型和关系型了。
  13. 数据分析技术的几个发展趋势:向上与AI融合,向下与云和异构计算结合,中间正流批结合、分析事务融合和一体化等。
  14. 大数据是因为数据大,区块链是因为数据贵。
  15. 数据可视化是因为机器看懂了但人看不懂,AI是因为人看懂了机器看不懂。
  16. 开源已经垄断了大数据生态。
  17. 云计算的优点主要被城里的数据享受了,环境破坏的代价却留给了村里的数据,于是就有了边缘计算。
  18. 大数据被夹在两座大山中,一边是隐私要保护,一边是资产要流通。
  19. 一年来,GDPR带来了全球隐私保护立法的热潮。
  20. 你不能在拥有100%安全的情况下,同时拥有100%的隐私和100%便利性。(时任美国总统奥巴马,2012年)
  21. 现在,每个人的数字化身都是数字奴隶,没有归宿的灵魂在数字世界里飘荡。
  22. 现在电话号码是隐私,而30年前,会公开刊登在邮局的黄页上。
  23. 你没有隐私, 忘记这事吧。
  24. 1993年,”在互联网上,没有人知道你是一条狗”。而在大数据时代,没有人不知道你是一条狗。
  25. 现在,人与人见面打招呼“你还记得我啊”,是一种幸福。将来,打招呼时说“我还记得你啊”,是一种威胁。
  26. 数据资产化,资产数据化,数据托管化(云)。
  27. 2019年,业界从关注数据技术,转向了关注数据资产。
  28. 以前数据更多的是信息,现在数据更多的是资产。
  29. 传统的三大数据管理框架,都假设数据是信息,而不是资产。
  30. 就像河伯还没遇见大海时,任何企业所拥有的大数据其实都是小数据。
  31. 数据流通,还处于男耕女织的时代。
  32. 比特是计量数据规模的基本单位,不应作为计量数据流通价值的基本单位。
  33. 经济学是建立在工业经济的假设上的,而现在已经是数字经济了。
  34. 亟需数据流通的经济理论突破,这个问题是诺奖层级的,当然也可能是图灵奖的。
  35. 信息技术革命前人类是信息的饿汉,就像工业革命前人类是食品的饿汉。
  36. 拥有知识的不一定是知识分子,也可能只是个知识的吃货。
  37. 数据是21世纪的石油,但别忘了20世纪前石油不是战略资源。
  38. 石油应用也曾经历过至暗时期:当洛克菲勒让石油(煤油)主要用于照明时,爱迪生发明了电灯。石油的主要用途转向动力,是因为汽车的发明和亨利福特将其平民化。
  39. 记忆是例外,忘记是常态,于是我们发明了文字、书籍和大数据来当人脑的外设。人类社会的诸多规则和习惯,是建立在人人都有健忘症的假设上的,但这个假设正在被大数据连根拔掉。
  40. 算法是数字世界的运行规则。
  41. 算法没有偏见,只有人才会有。
  42. 电磁介质的普遍寿命是5-30年,1000年后“它们”如何考古呢?

转自
https://mp.weixin.qq.com/s?__biz=MzAxMjIyMjYxOA==&mid=2651465828&idx=1&sn=1aaa24d9cc2fca0b5be7c270be15f78c&scene=21#wechat_redirect

解读
https://www.infoq.cn/article/hDfWp57jJTOwN5FgrilA

你可能感兴趣的:(大数据四十二条)