它们都要简化,剥离不必要的细节,抽象掉若干现实世界中的因素,或者需要从头重新创造。
它们都是形式化的,要给出精确的定义。模型通常要使用数学公式,而不是文字。模型可以将信念表示为世界状态的概率分布,可以将偏好表示为各备选项之间的排序。通过简化和精确化,模型可以创造易于处理的空间,我们可以在这些空间上进行逻辑推理、提出假说、设计解决方案和拟合数据。模型创建了我们能够以符合逻辑的方式进行思考的结构。正如维特根斯坦在《逻辑哲学论》(Tractatus Logico -Philosophicus )一书中所写的:“逻辑本身就能解决问题,我们所要做的,就是观察它是如何做到的。”是的,逻辑有助于解释、预测、沟通和设计。但是,逻辑也不是没有代价的,这就导致模型的第三个共同特征。
所有模型都是错误的,正如统计学大师乔治·博克斯(GeorgeBox)所指出的那样。所有模型概莫能外,即使是牛顿提出的那些定律和法则,也只是在特定的条件下成立。所有模型都是错误的,还因为它们都是简化的,它们省略掉了细节。通过同时考虑多个模型,我们可以实现多个可能情况的交叉,从而克服单个模型因严格而导致的狭隘性。
事实上,我们永远不应指望任何一个模型能够准确预测1万年后的海平面将上升多少,甚至也不应该指望任何一个模型能够准确预测10个月后的失业率。我们需要同时利用多个模型才能理解复杂系统。
宫:我觉得这句话让我更进一步的理解了复杂系统,任何一个单一模型都无法精确的解释或者预测什么,而且都是必须在一定条件下才生效的,下面我需要学习并且理解怎么利用多个模型才能构建复杂系统。
我们不能满足于双重模型、三重模型甚至四重模型,我们要成为多模型思考者
宫:感觉到了难度,但是也有个疑问,多模型到底是多少个模型,不能是越多越好吧?
模型的7大用途:推理(reason)、解释(explain)、设计(design)、沟通(communicate)、行动(act)、预测(predict)和探索(explore)。这些用途的首字母,构成了一个缩略词“REDCAPE”。这个缩略词的字面含义为“红色披风”,提醒我们:多模型思维可以赋予我们强大的力量。
宫:redcape->红色披风——>强大的力量————>好厉害****
构建模型的第一种方法是具身法(embodiment approach)。用这种方法构建的模型包括重要部分,同时对于不必要的维度和属性,要么剥离,要么将它们整合在一起考虑。生态沼泽模型、关于立法机构和交通系统的模型都是用这种方法构建的,气候模型和大脑模型也是如此。
建模型的第二种方法是类比法(analogy approach),可以对现实进行类比与抽象。我们可以将犯罪行为传播类比为传染病传播,将政治立场的选择类比为在一个左-右连续线段上的选择。球形牛是类比方法的一个最直观的例子:为了估计一头牛身上牛皮的面积,我们会假设那头牛的形状是球形的。之所以要这样做,是因为微积分教科书所附积分表中的公式,会出现tan(x)和cos(x),但是不会出现类似cow(x)这样的东西
构建模型的第三种方法是另类现实法(alternative reality approach),也就是有意不去表征、不去刻画现实。这类模型可以作为分析和计算的“演练场”,我们可以利用这类模型探索各种各样的可能性。这种方法使我们能够发现适用于物理世界和社会世界之外的一般结论。这类模型有助于我们更好地理解现实世界中各种约束条件的含义,比如如果能够通过空气安全有效地传输能量,那么将会怎样?这类模型还允许我们进行现实世界中不可能的(思想)实验:如果我们能够加快大脑的进化,那么将会怎样?本书包含了不少这种类型的模型,其中一个是“生命游戏”(Game of Life),它是一个很大的棋盘,棋盘上的每一个方块要么是活的(黑色),要么是死的(白色),并根据某个特定规则在生死之间切换。虽然这个模型与现实世界并不一致,但是它能够帮助我们加深对自组织、复杂性现象的认识,甚至是许多关于生命本身的洞见。
宫:我觉得要是加快人类大脑的进化,我们将无处不在。
推理: 识别条件并推断逻辑含义。
解释: 为经验现象提供(可检验的)解释。
设计: 选择制度、政策和规则的特征。
沟通: 将知识与理解联系起来。
行动: 指导政策选择和战略行动。
预测: 对未来和未知现象进行数值和分类预测。
探索: 分析探索可能性和假说。
阿罗定理(Arrow’sTheorem)就是一个可以说明逻辑如何揭示不可能性的极佳例子。这个模型解决了个人偏好是否集结为集体偏好的问题。在这个模型中,偏好表示为各备选项之间的排序。以对餐馆进行排名为例,假设有5家意大利餐馆,分别用字母A到E表示,这个模型允许120种排序中的任一种。阿罗要求集体排序是单调的(如果每个人都将A排在B之前,那么集体排序也是如此)、独立于无关的备选项(在其他备选项的排名发生了变化的情况下,如果任何人对A和B的相对排名都没有发生变化,那么A和B在集体排名中的顺序也不会改变),且是非独裁的(没有任何一个人能够决定集体排序)。然后阿罗证明,如果允许任何偏好都存在,那么就不存在集体排序。
辛普森悖论:当人们尝试探究两种变量(比如新生录取率与性别)是否具有相关性的时候,会分别对之进行分组研究。然而,在分组比较中都占优势的一方,在总评中有时反而是失势的一方。
帕隆多悖论:两个没有胜算的赌局,当交替轮流进行时,是有可能带来正的预期回报的
孔多塞陪审团定理是从一个解释多数规则长处的模型中推导出来的。在这个模型中,陪审员要做出要么有罪、要么无罪的二元决策。每个陪审员正确决策的时候比错误的时候多。为了将这个定理应用于模型集合而不是一组陪审员,我们将每个陪审员的决策解释为模型的一个类别。这种分类可以是行动(买入或卖出),也可以是预测(美国民主党胜出还是共和党胜出)。孔多塞陪审团定理告诉我们,通过构建多个模型并使用多数规则,将比只使用其中一个模型更加准确。这个模型依赖于世界状态(state of theworld)的概念,它是对所有相关信息的完整描述。对于一个陪审团来说,世界状态包括了审判时呈现的所有证据。对于那些衡量某个慈善项目的社会捐献的模型来说,世界状态则可能与项目的团队、组织结构、运营计划以及项目所要解决的问题的特征或状况相对应。
孔多塞陪审团定理 总数为奇数的一组人(模型)将未知的世界状态分为真或假。每个人(模型)正确分类的概率为p,并且任何一个人(模型)分类正确的概率在统计上都独立于任何其他人(模型)分类的正确 性。
孔多塞陪审团定理: 多数投票正确的概率比任何人(模型)都更高;当人数(模型数)变得足够 大时,多数投票的准确率将接近100%。
那么,如何将这个定理的原理应用于多模型方法呢?生态学家理查德·莱文斯(Richard Levins)对 此给出了详细的阐述:“因此,我们尝试用几个不同的模型来处理同一个问题,这些模型的简化方法各不 相同,但都有一个共同的生物学假设。如果这些模型(尽管它们有不同的假设)都导致相似的结果,那我们就得到了一个强有力的定理,它基本上不受模型细节的影响。因此,我们的真理就是若干独立的谎言的 交集。” 需要注意的是,在这里,莱文斯渴望达成一致的分类。当许多模型都给出了相同的分类时,我们会信心大增。 多样性预测定理则适用于给出数值预测或估值的模型,它量化了模型的准确性和多样性对所有模型平均准确性的贡献。
多样性预测定理 :
多模型误差=平均模型误差-模型预测的多样性,即:
假设我们用两个模型来预测某一部电影会获得多少项奥斯卡奖。一个模型预测它将获得两项奥斯卡奖,另一个模型则预测它将获得8项。这两个模型预测的平均值,也就是多模型预测的结果等于5。如果最后这部电影获得了4项奥斯卡奖,那么第一个模型的误差等于4(2^2 ),第二个模型的误差等于16(4 ^2 ),而多模型误差则等于1,模型预测的多样性等于9(因为每个模型的预测与平均预测均相差3)。这样一来,多样性预测定理就可以表达为:1(多模型误差)=10(平均模型误差)-9(模型预测的多样性)。
这个定理的原理在于,相反类型的误差(正负)会相互抵消。如果一个模型的预测值太高,同时另一个模型的预测值太低,那么这些模型就会表现出预测多样性。两个模型的误差相互抵消,模型的平均值将比任何一个模型更加准确。即便两个模型的预测值都太高,这些预测值的平均误差仍然不会比两个高预测值的平均误差更糟。
但是,多样性预测定理并不意味着任何不同模型的集合的预测必定是准确的。如果所有模型都有一个共同的偏差,那么它们的平均值也会包含那个偏差。不过,这个定理确实意味着,任何多样性的模型(或人)的集合将比其普通成员的预测更加准确,这种现象就是通常所说的“群体的智慧”(wisdom ofcrowds)。这是一个数学事实,它解释了计算机科学中集成方法(ensemble method)成功的原因,这种方法对多个分类加以平均,也解释了使用多个模型和框架进行思考的人比使用单个模型的人预测的准确性更高的事实。任何一种看待世界的单一方式都会遗漏掉某些细节,使我们更容易产生盲点。单模型思考者不太可能准确预测到重大事件,例如2008年的金融危机。
这两个定理为我们利用多个模型提供了令人信服的理由,至少在进行预测的情况下。然而,这个理由在一定意义上可能显得过强。孔多塞陪审团定理意味着,如果有足够多的模型,我们几乎永远不会犯错。多样性预测定理则意味着,如果能够构建一组多样的中等准确性的预测模型,我们就可以将多模型误差减少为接近于零。但是,正如接下来将会看到的,我们构建多个多样性模型的能力是有限的。