区块链丛书笔记十六:纳什均衡与博弈论
本人按:博弈论的概念很早就有耳闻,也知道囚徒困境的案例;博弈,只要有人的地方,甚至按本书所论述其它生物如猴子、蚂蚁等都不自觉地用到博弈论的理论知识,都有博弈的存在,都会使用博弈的方法为个体谋得最大化的利益;博弈论也是一门综合性的科学,基于数学,可以应用到战争、商业、社交、社会心理、生物学、物理学、计算机科学、脑科学等等领域,也是一种类似哲学、数学一样的学科之王、科学之上的科学;博弈论也是一门有趣和有用的科学,特别是在当下个人研究区块链技术之时,博弈论也是区块链行业包括币圈、链圈的从业者和技术体系时刻存在的方法论,这个知识体系,虽然人类自古、生物界久已存在--是实践先于理论的科学,但也只有区区百年时间不到的系统化研究,一方面其理论体系还在发展中,另一方面又已有诸多理论和实践结果出来了;所以,除了本书较宏观、两百页不到的阅读研究外,后面还会阅读几本经典的博弈论相关著作。
纳什均衡与博弈论/[美]齐格弗里德(Siegfried, T.)著;洪雷,陈玮,彭工译.—北京:化学工业出版社,2009.11
在当前社会,心理史学还没有出现;在将来很长的一段时间里也都还不会出现。但全世界范围内,有很多的机构都在致力于研究人类行为来预测未来世界的走向。这些研究所用的数学方法与阿西莫夫提到的心理史学相似,其核心就是数学家约翰·福布斯·纳什(John Forbes Nash)提出的理论
在当今科学界,人们普遍认为,与牛顿和爱因斯坦的数学理论相比,纳什的数学理论触及到的学科更多。牛顿和爱因斯坦的数学旨在处理物理问题,而纳什的数学却可以应用在生物学和社会学领域。
博弈论起源于研究人们玩扑克(poker)、国际象棋(chess)等室内游戏时的行为决策,后来作为一种研究人类经济行为的数学工具得到了充分的发展。从根本上讲,博弈论涉及从打网球到指挥战争的任何涉及策略的情景。博弈论提供了一种计算各种可能决策所产生效益的数学方法,该理论为在各种竞赛场合做出最佳决定建立了一套具体的数学公式。正如经济学家赫伯特·金迪斯(Herbert Gintis)所说,博弈论是我们“研究世界的一种工具”。但它不仅仅是一种工具,“它不仅研究人们如何合作,而且研究人们如何竞争”。同时,“博弈论还研究行为方式的产生、转变、散播和稳定”。 博弈论不是纳什发明的,但他扩大了该理论的范围,为之提供了解决实际问题的更有力工具。在一开始,他的研究成果并没有受到人们的重视。他的文章发表在20世纪50年代,在当时博弈论仅在冷战分析家之间流传,这些分析家认为国际侵略和利益最大化之间有一些相似之处。在经济学界,博弈论还被视为一种新奇事物。经济学家萨缪尔·鲍尔斯(Samuel Bowles)告诉我说:“当时博弈论羽翼未丰,如同经济学中其他许多优秀的思想一样,它还没有受到人们的关注”。 然而在20世纪70年代情况发生了改变,进化论学派的生物学家开始采用博弈论研究动植物中的生存竞争现象。紧接着在20世纪80年代,经济学家终于开始以各种不同方式将博弈论应用于经济学中,尤其是将它用在设计真实试验以验证经济学理论方面。到20世纪80年代末,博弈论在经济学领域已经充分显示了它的作用,这最终促成了纳什等获得1994年诺贝尔经济学奖。
现今,经济学家继续使用博弈论分析人们如何做出有关金钱的决策;生物学家用它来建立假说以解释适者生存原理和利他主义的起源;人类学家使用它来研究原始文化,从而说明人性的多样化;神经科学者也加入了博弈论研究的行列,通过研究博弈者的大脑,试图发现决策如何反映人们的动机和情感。事实上,神经经济学——一个完全新的研究领域——也已基本成型。该学科将博弈论的思想方法与脑部扫描技术相结合,旨在探测、测量与人类决策行为相关的神经活动。神经科学家瑞德·蒙特格(Read Montigue)说:“我们正在以研究波音777机翼上气流的精度程度定量研究人类的行为”。 简言之,纳什的数学理论连同在其基础上建立起来的现代博弈论已经成为科学家研究众多与人类行为相关课题时的首选方法
在某深层层面,统计力学和博弈论是同一种基本思想两种表达形式。这种观点认为博弈论也是一个非常灵敏的社会“温度计”。 这种新认识——博弈论和统计力学源于同一个数学思想——提高了博弈论的地位,使它成为将生命科学和物质科学统一到一起的首选工具。博弈论受到各个领域科学家的青睐绝不是毫无原因的。有一天,博弈论会成为将所有七零八碎的科学难题粘贴在一起的万能胶。
而生物进化就像永无休止的奥林匹克比赛。如果复杂的生命产生进化过程遵循博弈论原理,那么人脑的发展变化无疑也应该遵循同样的规律。大脑科学家想要发掘人们经济决策背后的神经生理学机制就要设法了解人脑是如何工作的,因此,博弈论在该领域的盛行是一件非常自然的事情。 反过来看,人脑又决定了人类所有其他行为,如个人的行为、人与人之间的行为、社会行为、政治行为以及经济行为。所有这些行为又决定着个人、社会、政治和经济活动体系的发展变化,这正如适者生存的世代延续决定了生命的复杂性;随着社会或政府的建立、衰败,人类文化一步步发展;企业的成立和倒闭决定了经济的发展;网页的添加和链接的终止决定了万维网的发展。因此,纳什的数学理论似乎能够促进各种认识个人行为、生物和社会手段的融合。
牛顿建立了物理世界的自然法则,斯密则尝试在经济交互的社会世界收到异曲同工之效。牛顿的无从解释的万有引力定律穿过太空引导行星的运动;斯密的“看不见的手”则指导个体劳动者和商人们制造国家财富。牛顿和斯密的工作,让伟大的思想家们相信世界的各个方面——物理的还是社会的——都可以被科学来认识和解答。当1776年斯密的《国富论》发表时,理性时代到达了它的顶峰。
斯密的思想对查尔斯·达尔文产生了深远的影响。达尔文意识到,把描述经济世界竞争的原则应用到物种的生存斗争中,也有同样的意义。斯密所推崇的劳动力分工和自然界中新物种的出现十分吻合。因此,当今将经济博弈论应用于进化论研究作为一个重大智力产业绝非偶然。
实际上,斯密关于自由市场经济的理念是精辟而且缜密的,远比现在人们一谈到他的名字就不假思索地想到的完全自由市场概念要深刻(除了自由市场之外,斯密还提到,只有当生意人不造假不行骗时,看不见的手才能有效地发挥它的作用)。他相信政府对商业的干预——不管是支持还是限制——都会损害正常的自由企业的利益。通过消除优待(或者说“鼓励”)和限制,“明了简单的天赋自由系统会自主地建立起来。”但即便如此,他将关注的范围局限于“特别的鼓励”或“特别的限制”。他指出了政府应该扮演的3个角色:保卫国家不受入侵,执法保护个人免受不公平之害,提供个人无法从中牟利的公共设施和机构
如果斯密的“自然法典”受了其所处时代的影响,那也只不过是和很多其他在他之前、之后的人的成就一样。存在着人类行为和合作的“自然秩序”,这个观点的很多版本影响了形形色色试图了解社会的哲学家、科学家和政治革命家,从拥护君主专制的哲学家托马斯·霍布斯到热衷科学、做过撰稿人的卡尔·马克思。斯密关于道德哲学和财富规律的两本最伟大的著作,是一个伟大的才智事业的一部分,这个事业最终产生了经济学和“人类科学”——社会学和心理学。如科学史学家罗杰·史密斯指出的,18世纪——斯密的世纪——是一个深刻的思维才智融合的年代,涵盖了物理科学和社会学,经济交互和人类本性,以及所有关于理解和诠释生活、宇宙乃至世间万物方面相互激发出的新颖观点。
在某种程度上,达尔文的《物种起源》代表了19世纪末,可以总结为对世界的科学认识的三部曲中的第三部。正如牛顿征服了17世纪的物理世界,斯密编码了18世纪的经济学,19世纪的查尔斯·达尔文将生命添加到这个名单中。斯密追随着牛顿的足迹,而达尔文又追随了斯密。因此到了十九世纪末,全面理性地认识一切的根基已经建立。
博弈论的一个贡献在于,它使“消费者怎样比较各种选择”这个曾经模糊的经济学概念得以精确化(通过一种叫做“效用”的度量,但是这个词看似简单,其实并不容易);更重要的是,它能展示如何决定获取最大可能“效用”所必须要采取的战略,即为了获得最大利润——假定这也是激烈的经济生活中每个理智的参与者的目标。
尽管人类进行博弈游戏的历史已经有上千年,进行经济交换的时间可能也有这么长,但直到20世纪,才有人把这两者用数学方法明确地结合在一起。采取把真实世界的各种选择和金钱用数学方法变换到牌局和象棋这类游戏领域的方法,把博弈游戏和经济结合起来,这种结合方式是人类用数学量化人类行为的一大创举。博弈论的创立主要是由天才数学家冯·诺依曼(John von Neumann)完成的,他是20世纪最杰出的思想家之一。他对物理、数学、计算机科学和经济学都做出了杰出贡献,并因此在上述每个领域都作为具有突出贡献的伟大科学家被后人瞻仰。
绝大多数人认为,冯·诺依曼于1928年发表的一篇学术文章标志着博弈论的诞生。但博弈论的根源更为广远,毕竟从人类之初便有了博弈游戏,且睿智的思想家们一直在思考如何更为有效地进行游戏。但是,直到20世纪,博弈论才作为数学的分支以现代的形式出现,与另外两个颇为简单的思想相融合——效用和策略,前者是对你想得到的东西的度量;后者讨论如何得到你想要的。 效用主要是对价值或者选择的一种度量。这种思想有着悠久且错综复杂的历史,与被称之为功利主义的哲学理念密不可分。
效用,这个人人都想最大化的东西有时变得非常复杂。但在许多通常情况下,“效用”简单明了。打篮球时,效用是获得最多的得分。国际象棋比赛时,效用是将死对手的王牌局里,效用是赢得那个放赌注的盘子里所有的钱。很多时候,难的不是如何定义“效用”,而是如何选择一个好的战略来使其最大化。寻找最佳战略,这正是博弈论的目的所在。
国际象棋游戏是个很好的例证选择,因为它是“二人零和博弈”这种重要的策略博弈的一个完美的例子。在这种博弈中,只要一人赢了,不管赢的是什么,另一个人的结果就是输,对决双方的利益是相反的,所以称为“二人零和博弈”(国际象棋游戏也是一种“完全信息”游戏,这就是说任何时候,棋局的局势、所有的当局者的决定都是透明的,比如玩扑克牌的时候,出的牌都是翻开的)。
在1928年的论文里,冯·诺依曼只是进行严格的数学研究,讨论的是战略博弈论的理论,并没有想到要与经济相联系。只是在几年以后,在经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern)的协助下,他才开始把博弈论与经济学结合起来。
摩根斯特恩立即着手写论文讨论博弈论与经济学的关系。冯·诺依曼审阅了初稿并提出了很多意见,最终,冯作为合著者参与到论文的写作中来,论文不断地得到了补充。到1940年的时候,这篇论文已经涵盖了很多十分重要的内容,但两人仍然对其不断完善,最后以一本书——《博弈论与经济行为》的形式,于1944年由普林斯顿大学出版社出版了(不过,后来的历史研究者认为冯·诺依曼一人独自完成了这本书中的大部分内容)。 这本书立即被誉为“博弈论中的圣经”,在坚信“博弈论”的人眼中,它在经济学中的地位与牛顿定律在物理学中的地位等同,是牛顿化的亚当·斯密,为描述个体之间的相互作用对整体经济的影响提供了严格的数学工具。
这也正是冯·诺依曼和摩根斯特恩在1944年的著作中强调的。鲁宾逊·克鲁索经济从根本上与盖里甘岛经济不同。它不仅仅是影响你关于商品价格和服务的选择的来自他人的社会影响的综合。你的选择结果,以及获得你想得到的利益的能力,这些不可避免地都与他人的选择联系在一起。两位认为,“如果两个或更多的人相互之间交换货物,那么通常每个人的结果不仅依赖于他自己的行为,也受到其他人行为的影响”。
。如何来衡量效用呢?对于商人,用金钱(作为利润)来衡量是合乎逻辑的;对于消费者,付出(最小的花销)是个不错的选择,或者你也可以认为一个物体的效用就是你愿意为它付出的价钱。金钱可以被用作货币,将任何人的需求转化为更为具体的物体、事件、体验或者其他的任何东西。所以,将效用与金钱等同是一个方便简化的假设,在这种假设下,理论就可以集中关注如何获得你想要的东西,而不必陷于如何界定你想要的东西的复杂问题之中。
温度是对分子运动快慢的衡量,总体而言,描述单个分子的速度就像计算鲁宾逊·克鲁索的效用一样简单。但是对于“盖里甘岛”,就变得很困难了,这就像热力学中,要想计算较少数目的相互作用的分子的速度实际上是不可能的。但是如果计算的是亿万以上的分子,情况又不一样了,此时分子间的相互作用趋于平均,利用热力学理论就可以对温度做出精确的预测
在博弈论中,策略是一种特定的行为过程,而不是游戏中的一般玩法。例如,这和打网球不同,网球中,策略仅仅指“主动进攻”和“保守打法”。博弈论中的策略是对可能出现的种种情况所做出的一系列的选择。在网球比赛中,你的战略可能是“当对手发球时绝不冲到网前;无论比赛时是平局还是领先都要尽力发球和截球;落后时一定要呆在后场”。当然对其他情况你还有其他的应对策略。 博弈论中有关策略的另外一个关键点是——“单纯策略”与“混合策略”的区别。在网球赛中,你可能会在每次发球后迅速地冲到网前(这是一个单纯策略),你也可能每3次发球中有一次冲到网前,另两次守在底线(这就是混合策略)。通常,要想让博弈论发挥作用,混合策略是不可或缺的。
在二人零和博弈中使用最小最大化原理的奥秘在于,你要铭记,一方赢得什么,另一方就失去什么(这正是零和的定义)。所以,你的策略就是尽可能使自己的收益最大化,这必将使对手的收益最小化。不过,显然你的对手也会这么想。在二人零和博弈中,你总是能找得到一种最佳策略,而在很多情况下,最佳策略即混合策略。
利用随机方法,从多种纯策略中进行选择并组成混合策略的思想正是冯·诺依曼证明最小最大化原理中的本质核心内容。通过选择正确的混合策略,在对手也精通博弈论的情况下,能够保证你获得可能获得的最大收益。如果对手不懂博弈论,那你可能会收益更大。
博弈论并不仅仅针对扑克牌或象棋游戏,甚至不仅仅关于经济学。它讨论的是做决策性的决定——不论是在经济中还是现实生活中的任何其他领域。任何人与人之间为了追求某种目标而相互竞争并交互作用的场合都是博弈论的用武之地,它可以清楚地描述使用各种不同策略所预期达到的结果。一旦你明确想要得到的结果,博弈论就可以计算出最合理的策略来实现它。如果你也赞同下面这个观点,即一群相互影响的人都在寻找他们的最佳策略,以获取自己心中渴望的东西,那么认为博弈论潜在地与指导人类行为的自然法则这个现代的观点相关就不难接受了。
纳什成功地引导博弈论走向数学均衡的命运。虽然最初并不受欢迎,但是纳什的方法最终获得了大部分理论经济学家的认同,并使他摘取了1994年的诺贝尔经济学奖的桂冠。那个时候,博弈论已经应用于进化生物学并且在政治科学、心理学和社会科学中占了一席之地。在纳什诺贝尔奖光环的影响下,博弈论渗透到人类学、神经科学,甚至物理学之中。毫无疑问,纳什的数学方法使博弈论在科学世界中的广泛应用成为可能。
“纳什确立的非合作博弈理论已经发展成了一种有效衡量动机的算法,它能够帮助我们更好地了解无论在任何社会、政治或是经济背景下的冲突和合作问题的实质。”
冯·诺伊曼的方法存在着矛盾,使博弈论的内在完整性遭到了破坏。二人零和博弈的核心是选择一个你所能做的最优策略来对抗一个理性的对手。你的最佳选择是不管对手做什么,都采取你自己的最优(很有可能是混合的)策略。但如果在多人博弈中形成了联盟,如冯·诺伊曼相信的那样,你的策略就必须依赖于与他人的协调。无论如何,当博弈论应用于非零和情况下的多人博弈时——也就是应用于现实生活时——还需要补充一些最初的博弈论所不能提供的理论。这正是约翰·纳什所为我们带来的。
在纳什的“讨价还价”博弈论文中,他讨论了存在多种途径达到互惠结果的情形。问题是找到一种使双方的利益(或效用)最大化的方式——其前提是双方都是理性的(知道如何量化他们的期望),是具有同等技能的协商者,并且都了解彼此的期望。 当对资源交换进行讨价还价时(在纳什的例子里,如书本、球、笔、小刀、球拍和帽子一类的东西),博弈双方可能会对物品有不同的估价(运动员可能会认为球拍比书更有价值,但是偏于智力导向的议价者可能会认为书比球拍更有价值)。纳什展示了如何评价这些不同的估价,计算每个人在各种交换中的效用,并提供了精确的数学图解,找寻最佳成交点——促成最佳交易发生的点(即最大化各自效用的增长)。
关于讨价还价理论的论文本身已确立了纳什作为博弈论领军人物之一的地位,但是真正使他成为博弈论先驱的是他的博士论文。这篇文章引入了最终成为博弈论卓越构架的“纳什均衡”。 无可非议,均衡的概念对很多科学领域都有着重要的意义。均衡表明事物处于平衡或稳定状态。而稳定性恰恰是了解很多自然过程的核心概念。生态系统、化学和物理系统,甚至社会系统,无不在寻求稳态。因此,确定如何达到稳态常常是预测未来的关键。如果状态不稳定——大多数的情况下都是如此——你可以通过找到获得稳态所需要的条件来预测事物的发展趋势。了解稳态是一种掌握事物发展方向的途径。
化学反应中,一旦达到均衡,各种化学物质的量不再发生变化;在博弈中,一旦达到均衡,人们将不再有改变策略的动机——所以对策略的选择将维持不变(换句话说,博弈达到了稳定的状态)。所有的玩家都对自己所采取的策略感到满意,认为当前策略比其他任何策略都要好(只要其他人也不改变策略)。类似的,在社会环境中,稳态指每个人都满足于现状。你不一定喜欢当前的状态,但是改变现状只会让事情变得更糟。因此没有改变的动机,就像山谷里的石头,达到了一个平衡点。
通过两种不动点定理的任何一个[分别来自鲁伊兹·布劳威尔(Luitzen Brouwer)和角谷静夫(Shizuo kakutani)]纳什用了不同的方法推导出了他的证明。对不动点定理的详细解释需要复杂的数学,但是展示其核心观点却非常简单。取两张同样的纸,揉皱其中一张,并将它放在另一张之上,在揉皱的纸上必然存在着一点位于平整的纸上和其相对应点的正上方。这个点就是不动点。
“均衡点,”他在博士论文中写道,“意味着…在其他玩家的策略不变时,每个玩家采取的混合策略都最大化其自身收益。”换句话说,在博弈中至少存在着这样一种策略组合,如果你改变你的策略(其他任何人的策略都不改变)你会获得比之前差的结果。
纳什均衡的真正关键之处在于它将博弈论数学和物理定律进行了类比——博弈论描绘社会系统,物理定律描绘自然系统。在自然界中,每个事物都寻求稳态,也就是寻求一种能量最小的状态。
纳什的均衡观念却抓住了社会的一个关键特征。运用纳什的数学方法,你可以和适当情形下的博弈作比较,从而得出人们如何在一个社会情境中达到稳态。因此如果你想将博弈论应用于现实生活,你需要设定一种能体现你所关注的现实生活情境本质特征的博弈。
细读博弈论的文献,你便会发现便士匹配博弈、小鸡博弈、公共物品博弈和性别大战,还有猎鹿博弈、最后通牒博弈和“长吸管”博弈,以及数以百计的其他博弈。但至今这些博弈中最有名的是一个被称为“囚徒困境”的博弈。
虽然囚徒困境只是现实生活的简化,但是它确实体现了诸多社会交互的本质。但显然你不能通过计算纳什均衡来轻易地估计任何社会情况。现实生活中的博弈通常涉及很多人和复杂的利益规则。虽然纳什证明了至少存在着一个均衡,但算出这个均衡是什么就是另外一回事了(而且通常有不止一个纳什均衡点存在,这使得事情变得非常复杂)。记住,每个人的“策略”都是精心地从数十数百数千(或者更多)的“特定”的纯策略中提取出来的混合策略。在大多数多人博弈中,计算所有选择组合的概率超出了英特尔、微软、IBM和苹果四大厂商计算能力的总和。
假设你的社区决定集资建一个公园。你喜欢这个提议,但是如果你认为会有足够的邻居捐了足够的钱来建它,你可能不会捐款。如果每个人都这样想,就不会有公园了。但假设背叛(拒绝捐款)和合作(捐出你的份额)并非仅有的可行策略。可能会有第三种策略,称之为双赢策略。如果你是一个互惠者,你只在确保一定数量的其他人捐款的情况下才会捐钱。计算机对这种博弈的模拟告诉我们,玩家采取这些策略的混合策略可能达到纳什均衡。
纳什关于多人博弈均衡的研究与他关于讨价还价问题的论文(讨论了合作博弈的情形)一起,对冯·诺伊曼和摩根斯特恩的合著做了极大的拓展,为当今的大多数博弈论研究提供了基础。当然,博弈论不仅仅是纳什均衡,但是纳什均衡仍然是今天人们致力于将博弈论应用于现实生活的核心。
自然地,博弈论描述了简化的情形——毕竟,它是真实生活的模型,而非真实生活本身。在这方面它就像其他所有的科学一样,提供现实的简化模型,并且模型足够精确到让你可以从中得到关于现实生活的有用结论。
博弈论(其初始形式)是建立在参与者的行为理性并且自私的基础之上的。如果现实生活的行为偏离了博弈论的预测,可能是理性和自私的概念出了问题。在这种情况下,结合人类心理学(特别是在社会情形中的心理学)与博弈论的均衡理论,可以极大地提高对人类行为的预测并且有助于解释有时的惊人之举。这正是卡默热的研究方向——行为博弈论想要实现的。
近年来,博弈论的应用已扩展到诸多领域。经济学中不乏它的身影,从指导工会与管理层间的协商到拍卖电磁波频谱仪的开发执照。博弈论对将住院医师合理分配到医院、了解疾病的传播、如何接种疫苗以更好对抗各种疾病——甚至对解释医院为克服细菌对抗生素的抗药性进行投资的动机(或动机缺乏的原因)都非常有用。博弈论对于了解恐怖组织和预报恐怖分子的行动,对于分析投票行为、了解意识和人工智能、解决生态问题、研究癌症都有一定的价值。你还可以用博弈论来解释为什么男性和女性的出生率大体相当,为什么人在年纪大时变得更小气,为什么人们喜欢谈论他人的八卦。 实际上,流言是博弈论行为研究的一个重要结果,因为它是了解人类社会行为的核心,使得通过利己的斗争在丛林中生存下来从而建立起人类文明成为可能的“自然法则”。正是在生物学中,在解释达尔文进化论神秘的结论方面,博弈论显示了其强大的力量。
实验者通过扔不同大小的面包片将情况复杂化,鸭子需要既考虑扔面包的速率还要考虑扔一次面包的数量。即使这样,尽管会花长一些的时间,鸭子们最终也能分成相应规模的组,并且每组的规模满足纳什均衡。 现在你不得不承认,那看起来有点奇怪。博弈论是用来描述“理性的”人如何最大化他们的利益。但现在事实证明,博弈论所描述的对象无需理性,或者甚至不必是人类。我认为,鸭子的实验证明将会有更多的博弈论问题出现在你的眼前。博弈论不仅是一种理解如何玩扑克牌的聪明的方法,而且捕捉到关于世界如何运作的一些信息。
进化的过程决定相互作用的产生和结果。这是关键:进化不仅关于从共有祖先到新物种的起源。进化实际上与生物学的一切事情有关——个体的生理学,种群中多样性的出 你猜发生了什么?鸭子们大约花了一分钟的时间便弄明白了道理。它们几乎按照博弈论所示的准确的规模,分成两组。鸭子知道如何进行博弈! 实验者通过扔不同大小的面包片将情况复杂化,鸭子需要既考虑扔面包的速率还要考虑扔一次面包的数量。即使这样,尽管会花长一些的时间,鸭子们最终也能分成相应规模的组,并且每组的规模满足纳什均衡。 现在你不得不承认,那看起来有点奇怪。博弈论是用来描述“理性的”人如何最大化他们的利益。但现在事实证明,博弈论所描述的对象无需理性,或者甚至不必是人类。我认为,鸭子的实验证明将会有更多的博弈论问题出现在你的眼前。博弈论不仅是一种理解如何玩扑克牌的聪明的方法,而且捕捉到关于世界如何运作的一些信息。 至少生物世界是如此。事实上,博弈论最初描述生物学并给出成功的科学解释,并已捕捉到许多生物进化的特征。许多专家认为它可以解释人类合作的秘密,人类自身的文明是如何从个体遵守的丛林法则中出现的。它甚至似乎可以解释语言的起源,以及为什么人们喜欢说闲话。 第一节 生活和数学
通过访问普林斯顿的高级研究中心,我了解了进化和博弈论。在博弈论出现初期,该中心是冯·诺依曼的工作地点。作为早已得到世界认可的知名数学和物理学研究中心之一,该研究所很晚才承认生物学在自然科学中的重要地位。尽管如此,20世纪90年代末,该所便决定启动一个理论生物学的项目来早早跃入21世纪。
正如新生所跨越太平洋把冯·诺依曼、爱因斯坦和其他的科学家带到了美国一样,该研究所为其生物项目从欧洲招募到一个指导者——马丁·诺瓦克,奥地利人,曾在英国牛津大学工作。马丁·诺瓦克是一位杰出的数学生物学家,在他读大学期间,就把生物化学和数学相结合,并于1988年,在维也纳大学拿到了博士学位。不久,他便到牛津工作,在那里他最终成为数学生物学项目的领头人。1998年秋天,我在普林斯顿拜访他,向他咨询了该研究所关于将数学与生命科学相结合的计划。 马丁·诺瓦克描述各种类型的研究项目,涉及到从免疫系统到推断人类语言的起源的一切方面。例如,在免疫系统方面,破译对抗艾滋病病毒背后的数学原理。他的大部分工作都是基于一个普通的主题:博弈论的深入广泛的相关性。当时,我对此并不欣赏。
当然,它非常有意义。在生物学中,几乎所有一切都涉及到相互作用。最明显的例子,两性交互用于繁衍后代。免疫系统中的细胞与病毒斗争,或有毒分子与DNA分子相互纠缠导致癌症发生,这些都是生命系统强烈的相互作用。当然,人类也是如此,相互合作,或彼此竞争,或是互相交流。 进化的过程决定相互作用的产生和结果。这是关键:进化不仅关于从共有祖先到新物种的起源。进化实际上与生物学的一切事情有关——个体的生理学,种群中多样性的出现,生态系统中物种的分布,个体对其他个体或种群与其他种群的相互作用或影响。进化构筑所有生物行为的基础,而支撑进化的主要理论源于博弈论数学。“博弈论已经成功地运用到生物进化上,”诺瓦克告诉我,“生物进化中的大量问题本质上都是博弈论”。
尤其,博弈论有助于解释在动物(包括人类)世界中社交行为的进化,解开了达尔文进化论中初始的谜团:为什么动物会合作?你可能会认为,斗争的生存法则将会助长自私。然而,合作在生物世界却相当普遍,从寄生虫与寄生主体的共生关系到人们经常向陌生者展示的利他主义。如果没有如此广泛的合作,人类的文明绝不会形成;如果不理解合作是如何演变的,那么描述人类社会行为的自然法则也将不可能存在。这一理解的关键线索来自于博弈论。
梅纳德·史密斯发现有必要从两个方面对经典博弈论进行修饰:用“适者生存”的进化思想来代替效用;用“自然选择”来代替理性。他注意到在经济学的博弈理论中,“效用”是某种人为意义上的;它是一个概念,试图“将一系列定性式的截然不同的结果分配于线性标度上”
事实证明最佳生存策略取决于在这个群体里有多少头鹰。如果鹰的数目很少,鹰式策略便是最佳的,因为其大部分的对手是鸽子,鸽子一见到鹰便会远离争斗。但是,如果鹰的数目较多,它们会陷入代价惨痛的混战——这时,鸽式策略是明智的。因此,社会会进化成既有鸽又有鹰的共同社会。争斗的代价越高,鹰的数目就越少。确切地说,鹰与鸽的比例取决于争斗确切的代价和逃跑时丧失食物的代价。
鲁弗斯·约翰斯顿,来自剑桥大学,将偷听者这一因素考虑在内,扩展了鹰-鸽博弈论中的数学理论。在这种博弈论下,偷听者知道它的对手在前一次打斗中是赢了还是输了。一个偷听者如果遇到一个失败者,那么它在打斗中的行为会像鹰一样,但是如果该偷听者遇到一个胜利者,那么该偷听者会采取鸽式策略,放弃赢得资源的机会。
纳什均衡的一个基本概念——已知他人正在做什么,任何人都尽其可能做得最好。换句话说,最佳生存策略取决于你周围的人以及他们的行为如何。当你的生存取决于他人的行为时,那么无论你愿意与否,你都已经处于博弈之中了。 用进化论的语言表述,在生存博弈中成功等价于“适应”。最适应者得以生存且繁衍后代。显然一些个体和其他的个体相比,会在这个博弈中得到更好的成绩。
没有一个物种像鲁宾逊那样,孤独地生活在海岛上。因此,什么时候你该做什么事取决于你周围的人在做什么,解释该现象的理论就叫做博弈论。
人类的这种与非家族成员之间的合作是人类区别于地球上其他生物的主要特征之一。另一个特征是语言 利他主义的秘密,诺瓦克认为,是声誉的力量。“通过帮助别人,我们会提高自己的声誉,”他说,“而且在群体中的好名声会增加别人帮助你的机会。” 名誉的重要性解释了为什么人类语言变得很重要——所以人们喜欢说闲话。