《智能时代》读书笔记3:思维革命

在无法确定因果关系时,数据为我们提供了解决问题的新方法,数据中所包含的信息可以帮助我们消除不确定性,而数据之间的相关性在某种程度上可以取代原来的因果关系,帮助我们得到我们想知道的答案,这便是大数据思维的核心。

在过去的三个多世纪里,机械思维可以算得上是人类总结出的最重要的思维方式,也是现代文明的基础。

思维方式决定科学成就:从欧几里得、托勒密到牛顿

欧洲之所以能够在科学上领先于世界其他地方,在很大程度上是依靠从古希腊建立起来的思辨的思想和逻辑推理的能力,依靠它们可以从实践中总结出最基本的公理,然后通过因果逻辑构建起整个科学的大厦。

欧几里得最大的成就不是发现了那些几何定理,而是在人类所积累起来的几何学和数学知识的基础上,创立了基于公理化体系的几何学。

托勒密的方法论可以被概括为“通过观察获得数据模型的雏形,然后利用数据来细化模型”。

托勒密的思想影响了西方世界一千多年,这倒不完全是因为他的地心说,而是他这种思维方式和方法论。

托勒密等人的方法论的简单概括,其核心思想有如下两点:首先,需要一个简单的元模型,这个模型可能是假设出来的,然后再用这个元模型构建复杂的模型。其次,整个模型要和历史数据相吻合。

思维方式和方法远不如方法论对科学的发展至关重要,东方的文明长期以来在技术上领先于西方,但是在科学体系的简历上远远落后于西方,关键是输在方法论上。

不过,托勒密的方法论有两大缺陷。首先整体模型很复杂,原因是元模型用了再简单不过的圆,这么复杂的模型依靠手工计算就难以准确。

托勒密方法论的第二个缺陷是致命的。那就是确定性假设。它假定模型一旦产生,就是确定的和不会改变的。机械论延续了这种先验假设。

笛卡尔的贡献在于提出来科学的方法论,即大胆假设,小心求证,这个方法论在我们今天的工作中还在使用。

牛顿最直接的贡献,在于他用简单而优美的数学公式破解了自然之美。

牛顿作为思想家的贡献还在于他指出了任何正确的理论从形式上讲都是简单的,同时又有非常好的通用性,这与东方哲学中的大道至简思想不谋而合。

人们将牛顿的方法论概括为机械思维,其核心思想可以概括成如下这样几句话:

第一,世界变化的规律是确定的,这一点从托勒密到牛顿大家都认可。

第二,因为有确定性做保障,因此规律不仅是可以被认识的,而且是可以用简单的公式或者语言描述清楚。这一点在牛顿之前大部分人并不认可,而是简单地把规律归结为神的作用。

第三,这些规律应该是放之四海而皆准,可以应用到各种未知领域指导实践,这种认识是在牛顿之后才有的。

工业革命,机械思维的结果

后人这样评价牛顿和瓦特这两位英国的杰出人物:牛顿找到了开启工业革命大门的钥匙,而瓦特拿着这把钥匙开启了工业革命的大门。

机械的广泛使用和机械的思维方式直接导致了人类迄今为止最为伟大的事件-----工业革命。

机械思维更广泛的影响力是作为一种准则指导人们的行为,其核心思想可以概括成确定性(或者可预测性)和因果关系。

当然,机械思维的局限性更多拉源于它否认了不确定性和不可认知性。

在制药这个行业,直到今天起核心的方法都是遵循“研究病理找到真正治病的原因,然后针对这个原因找到解决方案”。

从牛顿开始,人类社会的进步在很大程度上得益于机械思维但是到了信息时代,它的局限性越来越明显。

首先,并非所有的规律都可以用简单的原理描述;

其次,像过去那样找到因果关系已经变得非常困难,因为简单的因果关系规律性都被发现了。另外随着人类对世界的认识越来越清楚,人们发现世界本身存在着很大的不确定性,并非过去想象的那样一起都是可以确定的。

世界的不确定性

世界的不确定性来自两方面,首先是当我们队这个世界的方方面面了解的越来越细致之后,会发现影响世界的变量其实非常多,已经无法通过简单的办法或者公式算出结果,因此我们宁愿采用一些针对随机事件的方法来处理它们,人为地把它们归为不确定的一类。

不确定性的第二个因素来自客观世界本身,它是宇宙的一个特性。

在概率论的基础上,香农博士建立起一套完整的理论,将世界的不确定性和信息联系了起来,这就是信息论。信息论不仅是通信的理论,也给了人们一种看待世界和处理问题的新思路。

熵一种新的世界观

1948年,克劳迪·香浓在它的著名的论文《通信的数学原理》中提出来“信息熵”的概念,才解决了信息的度量问题,并且量化地给出了信息的作用。

信息量与不确定性有关:假如我们需要搞清楚一件非常不确定的事,或是我们一无所知的事情,就需要大量的信息。相反,如果我们对某件事已经有了较多的了解,那么不需要太多的信息就能把它搞清楚。所以,从这个角度来看,可以认为,信息量的度量就等于不确定性的多少,这样香侬就把熵和信息量联系起来了。他还指出要想消除系统内的不确定性,就要引入信息。

在科学上,香侬的贡献在于第一次量化的度量信息,并且用数学的方法将通信原理解释的一清二楚。

信息论的作用远不止在科学和工程上-----它也是一种全新的方法论。与机械思维是建立在确定性的基础上截然不同的是,信息论完全是建立在不确定性基础上,而要想消除这种不确定性,就要引入信息。至于要引入多少信息,则要看系统中的不确定性有多大。这种思路成为信息时代做事情的根本方法。

信息时代的方法论:谁掌握了信息,谁就能够获得财富,这就如同在工业时代,谁掌握了资本就能获得财富一样。

用不确定性这种眼光看待世界,再用信息消除不确定性,不仅够赚钱,而且能够把很多智能型的问题转化成信息处理的问题,具体说,就是利用信息来消除不确定性的问题。

人类在机器智能领域的成就,其实就是不断地把各种智能问题转化成消除不确定性的问题,然后再找到能够消除不确定性的信息,如此而已。

香农第一定律讲的是,对于信源发出的所有信息设计一种编码,那么编码的平均长度一定大于该信源的信息熵,但同时香农还指出,一定存在一种编码方式,使得编码的平均长度无限接近于它的信息熵。

至于怎呢才能做到,霍夫曼给了一个非常简单的方法-----------只要把最短的编码分配给最常见的信息即可,这种编码方法具有通用性,又称为霍夫曼编码,它可以被认为是对香农第一定律的补充。

经济学上的吉尔德定律,即尽可能多采用便宜的资源,尽可能节省贵的资源,与信息论中的霍夫曼编码从本质上是相同的。

在过去的半个世纪里,生产力的提高实际上就是靠用便宜的机器取代人工,这种做法有意无意地和信息论的原理相符合。

香农第二定律,通俗地讲就是信息的传播速率不可能超过信道的容量,这和我们现实生活也是契合的。

互联网发展的各个阶段实际上是建立在不断拓宽带宽的基础上的。

香农第二定律不仅描述了通信领域的最基本的规律,而且它是自然界本身所固有的规律,能够解释很多商业行为。比如我们常说做生意靠人脉,其实这个人脉就是人与人交往的带宽。如果人脉不够,发出的信息和获得的信息都有限,生意一定做不大。

现代通信手段的本质,就是以相对低廉的成本让人们获得人脉,而媒体行业的不断进步,本质上是不断地在位企业拓宽对外链接的带宽,使得他们做生意越来越方便。

最大熵原理:这个原理的大意是说,当我们要对未知的事件寻找一个概率模型时,这个模型应当满足我们所有已经看到的数据,但是对未知的情况不要做任何主观假设。

大数据的本质

大数据的科学基础是信息论,它的本质就是利用信息消除不确定性。

从因果关系到强相关关系

数据公司 Google

你可能感兴趣的:(《智能时代》读书笔记3:思维革命)