大数据时代思维变革的反思


文 | 又在路上Y0Y0 于 2019.6.11
读书 | 《大数据时代》第一部分 大数据时代的思维变革

日记
毒月天气真是毒,家中开始明显感觉闷热难耐。
心心念念的大连樱桃也及时寄到了家里。
默念一句,心静自然凉。

我在几年前读过《大数据时代》这本书,那时这本书还刚出不久,很是引领潮流,当然,现在这本书依然是讲大数据思潮的经典之作。

今年以来,我对数据处理工具有了一段时间的研究,于是驱使我再次打开这本书,反思这一切变化的源头。


本书最重要的思想,就是提出了大数据时代的三大思维变革,即:

  • 更多,不是随机样本,而是全体数据
    数据处理技术已经发生了翻天覆地的变化,在大数据时代进行抽样分析就像在汽车时代骑马一样。现如今,我们需要的是所有的数据,“样本=总体”。
  • 更杂,不是精确性,而是混杂性
    执迷于精确性是信息缺乏时代和模拟时代的产物。大数据时代研究的数据如此之多,以至于我们不再热衷于追求精确度。只有接受不精确性, 我们才能挖掘一直未被利用的非结构化数据。
  • 更好,不是因果关系,而是相关关系
    知道“是什么”就够了,没必要知道“为什么”。在大数据时代,我们不必非得知道现象背后的原因,而是要让数据自己“说话”。

针对以上三大思维变革,我想提出我自己的思考:

  • 大数据时代是否是第一次到来?

是的。站在历史的长河上,人类第一次具备了以数据立体化描述事物的能力。这种从0到1的改变,必然会对人类认知世界的方式带来影响。

  • 大数据之大,其力量的极限在哪里?

作者在定义大数据之大时,有两个维度:第一,因信息技术的发展,数据体量以指数型增长,即绝对数量。第二,强调不采用随机分机法干扰数据,而直接使用所有数据,即多维度、全量。

那么,在此定义之下,如果技术条件允许,数据规模和维度都可以无限增长,大数据力量是否有极限呢?它的极限在哪里呢?

我认为,大数据力量的极限在于人对数据的应用。本质上,大数据是应用于机器分析的原材料,其变革意义是变革了机器的分析方法和工作产出。大数据本身并不能直接应用于人脑,很简单,人脑的处理性能并未如摩尔定律一般提高。人类无法直接应用大数据,而是应用了大数据机器分析后的结果。

因此,大数据的无限增大并不能直接转化为应用效果的提升,这中间还差一环,就是人类在人脑这个不变系统上应用大数据分析结果的能力。

举个例子,书中提到亚马逊的推荐算法的优化,带来销售的提升。然而,如今的问题是,由于信息量过载,人们对于各种推荐越来越视而不见。这是算法的问题吗?不是。这是因为信息量过大,越来越多的人直接屏蔽了此类信息,其最后的应用效果也就无从体现了。

  • 相关关系可以替代因果关系吗?

作者并没有否认因果关系的重要性。这里只是延申讨论是否有这种可能。人们会不会满足于相关关系,而不再追求因果关系了呢?我认为是不可能的。

与第二点的观点的根据相同,即人脑处理信息的系统并未改变。用相关关系来描述周围的世界,即使是一个很小的范围,也将是一个非常繁杂、庞大的描述,不是人脑可以直接处理的关系。这就是为什么人类天生倾向以因果归因的方式来理解世界,无它,简单快捷,最适用于人脑系统。

相关关系可以应用于机器,机器分析的结果可以为人类所用。但人脑无法直接应用大规模的相关关系进行思考。

综合以上观点,我认为,面对大数据时代,
1)应当先明确,大数据是应用于机器分析的,而无法直接变革人类思维。
2)拥抱大数据,是指我们要学会将机器分析的结果应用于人脑思维系统中。
3)人脑思维本身,并不会因大数据时代的变革而有什么变化。坚持逻辑推理、因果论仍是最适合人脑思维的系统理论。

我是Y0Y0,这里记录着我的成长故事。
欢迎围观、留言、分享。
人生还长,何不结伴同行?

你可能感兴趣的:(大数据时代思维变革的反思)