《动态合作:尖端博弈论》导论

  人生,无论是长或短,在一生中,甚至每一天,总要面对很多各式各样的决策情况。这些决策情况,或大或小,串联了人生的每个环节。从每日烦琐零星的生活 小节,诸如乘车、上班、上学等,到人生大事,诸如嫁娶、经商、入伍等,都是实例。这些决策情况当中存在着决策者与决策者之间的互动,包括人与人之间、企业 与企业之间、企业与人之间,甚至国与国之间的互动等。譬如说,每日的乘车、上班或上学本身便是一个由多方参与的决策情况,当中不单乘客与乘客之间的利益相 互依存,乘客与公共汽车公司之间也存在着互动,而公共汽车公司的营业政策与国家的政策也是密不可分的。因为这些互动关系的存在,决策情况总是相互依存,牵 一发而动全身。亦由于这种互动关系,不单一国的决策足以影响全世界,有时,即使一个人的决定也会影响未来。这些由多于一方组成并且相互依存的决策情况称为 博弈,人生亦是由博弈组成的。

1.1  博弈论

  博弈不单串联起人生的每个环节,也串联起整个人类社会和世界。基于博弈的重要性,博弈论作为研究博弈的理论因而诞生。
   博弈论(Game Theory),又称为对策论或赛局理论,诞生于20世纪的中叶,其奠基人为冯•诺伊曼 (Von Neumann)和莫根斯特恩(Morgenstern)。博弈论的发展一日千里,人才辈出,它的诞生令经济学起了翻天覆地的变化,时至今日它 已经成为经济分析的标准工具。基于博弈论对经济学的贡献,瑞典皇家科学院分别在1994年和2005年颁授诺贝尔经济学奖予纳什、豪尔绍尼 (Harsanyi)与泽尔滕(Selten)和谢林(Schelling)与奥曼(Aumann)。除了以上五位,其他有名的博弈论学者包括:宾摩尔 (Binmore)、伊萨克(Isaacs)、约恩森(Jorgensen)、马施勒(Maschler)、克瑞普斯(Kreps)、鲁本施泰恩 (Rubenstein)、沙普利(Shapley)、苏比克(Shubik)、沃罗比约夫(Vorob'ev)、彼得罗相(Petrosyan)和杨荣 基等。时至今日,博弈论已成为一门独立的学科。博弈论的范围极广,当中所涉及的学科知识包括:数学、统计学、运筹学、工程学、生物学、经济学、金融学、市 场学、政治科学、管理学等,可以说得上是包罗万象,应有尽有。譬如,从军事上的战机与导弹的最优控制,到商业上的市场拓展与资源开采的最优策略,或从国家 的宏观政策与外交到企业的投资与资本管理,都可应用到博弈论。
  根据博弈论的标准说法,如果一个决策情况存在着多于一个决策者并存地追求各自的目标,这个决策情况便可称为博弈。而博弈论所研究的是,在这些决策情况(博弈)当中,找出每位决策者的最优决策和这些最优决策所构成的每个可能结果以及这些结果的相关特性。

1.2  人生是动态博弈

   在博弈论的研究和应用范畴中,动态(微分)博弈论[dynamic (differential) game theory],可算得上是最为艰深而又 成果甚丰的。动态博弈论研究的是动态博弈,亦即随着时间而转变的决策互动。现实中很多决策情况,例如战机与导弹的最优控制,皆与时间密不可分,相互依存。 每一刻的决策也与下一刻的决策相互依存,其中的互动关系,轻则可以影响未来事情的进展,重则可以左右未来局势的变化。可以说,时间为这些决策情况添上了动 态。譬如说,一部军机在某一刻的最优航道,不单依赖于在这一刻其他军机(包括敌我两方)在这一刻的航道,还依赖于在下一刻以及以后每辆战机的可能航道。这 些与时间并生的依存关系,使得动态博弈既艰深而又实用。动态博弈其中一个最为困难之处是,在前一刻最优的决策,在下一刻可能不再为最优。换句话说,一部军 机原本的最有利位置,随着时间的转变,可以不再为最有利,甚至可能变为不利位置。所以我们可以说,时间为博弈添上了动态。人们生活在时间中,每时每刻总要 为不同的事项作出决策,而决策与决策之间又互相影响,有时一刻的决定,足以影响终生。这样说来,人生亦是一个动态博弈。

1.3  合作的利益与困难

   在人生这漫长的动态博弈中,总会遇到合作的机会。合作就是各方都齐心合力,放低短暂的个人利益,为更美更好的目标共同进发。成功的合作,往往能通过协同 效应,发挥各方的所长与优势,共同创造共赢的结果,甚至达至帕累托最优(Paretooptimal)局面。帕累托最优局面是资源分配的理想状态,假设 现时的人口和可分配的资源都是固定的,那么在不减少任何人的既得利益的前提下,如果从一个分配转到另一个分配,能使得至少一个人获益更多,我们便称这分配 的转变为帕累托改进。帕累托最优局面就是一个不存在更多的帕累托改进的局面。故此,帕累托最优局面是既公平而又有效率的理想局面。
  与之相反, 在各方皆不合作的情况下,各方的整体利益,往往远离帕累托最优,甚至达到两败俱伤、皆不讨好的局面。引用政治大师托马斯•霍布斯 (Thomas Hobbes,1651)的名句,其结果是“孤独的、贫乏的、龌龊的、残酷的和短暂的 ”(solitary, poor, nasty, brutish and short)。动态博弈当中各方的利益既是相互依存,很多时候亦唇齿相依。 合作的时候,各方能携手创建繁荣;不合作的时候,各方则会共同损失。自第二次世界大战以来,世界的整体财富(尤其是西方各国)的增幅绝对是有目共睹的。这 半个世纪以来的大致和平,为人类社会创造出历史上前所未有的科技发达和文明。反观非洲各国的经济发展一直落后,这与非洲各国的政局不稳定与当地连续不断的 零星战火,实在不无关系。可是,合作并不容易,合作的困难,很多时候源于搭便车问题(freerider problem),更深入的原因是各方的短暂 利益存在冲突。
  搭便车的问题,可说是老生常谈,很多经济学家都常有提及,这是一个非常现实的问题。因为各方皆有搭便车的想法,致使很多公共服 务被滥用,我国大西北的沙漠化问题,与全球性的温室效应,都是实实在在而又非常严重、必须尽早解决的大问题。搭便车的问题不能解决是因为各方的利益存在着 冲突,当其他人都共同合作的时候,独自偏离合作路线的一方是有利可图的,其他没有搭便车的各方却因此而蒙受损失。换句话说,当其他人都跟从合作路线,搭便 车的人所得到的将大于与其他人一同合作。譬如说,当其他渔民都尊重休渔期的时候,独自违反休渔协议的渔民将所获更多。可是,如果所有人都这样想的话,合作 便变得十分困难。

1.4  动态合作

  合作的问题在动态的环境中更是困难。如前所述,在动态的环境下,前一刻的最有利 决定在这一刻或下一刻可能已不是最有利,甚至可以是最不利的。在动态合作的问题上,前一刻各方皆赞同的合作方案,在这一刻和下一刻,可能已不再为各方所赞 同,因为动态的转变可以使其中一方的利益从有利变为不利。现实的环境充满动态的合作情况,包括世界贸易谈判、境内境外的投资、跨国的污染控制、市场的共同 开拓与整合、技术和科学的研究、资源的共同开采、地方合作和军备削减,等等。这些动态的合作问题,不单涉及每个人和社会在未来的繁荣和稳定,更将决定人类 文明的未来方向。如何在动态的环境下合作可以说是人类当前最重要的问题之一。

1.5  本书的目的和编排

  本书的目的是讲述如何在动态的环境下合作,故此本书名为《动态合作》。本书分为两大部分,前半部分主要是通过静态博弈论和冲突解拆,来讲解博弈论的基本概念和阐述在非动态(微分)环境下的局限。后半部分主要是讲述动态(微分)博弈论和如何在动态的环境下合作。
在 第2章,我们讲述静态非合作博弈(static noncooperative game)。我们先通过简单的例子讲解博弈论的基本概念,然后再分门别类 介绍静态非合作博弈的各种均衡概念,包括纯粹策略纳什均衡(pure strategy Nash equilibrium)和混合策略纳什均衡 (mixed strategy Nash equilibrium)、占优策略均衡(dominant strategy equilibrium)和 重复剔除的占优均衡(iterated dominance equilibrium)、贝叶斯纳什均衡 (Bayesian Nash equilibrium)以及各均衡概念的应用。
由于静态非合作的情况往往导致两败俱伤的不利局面,所以在第3 章,我们讲述能缔造帕累托最优局面的静态合作博弈(static cooperative game)。我们首先讨论静态合作的基本概念,然后再介绍各种 静态合作博弈的不同解法,包括核心(core)、稳定集(stable sets)、谈判集(bargaining sets)、内核(kernel)、 核仁(nucleolus)、沙普利值(Shapley value)、班茨哈夫-科莱曼权力指数(BanzhafColeman index)和纳什 谈判解法(Nash bargaining solution),我们还举出各种解法的应用例子。

  虽然静态合作博弈能缔造帕累托最 优,但是静态合作博弈所要求的具约束力的协议,在很多现实生活情况中并不存在。在这些情况下,参与各方的个体理性与整体理性往往发生冲突。在第4章,我们 讲述解拆这些冲突的理论,主要包括重复博弈(repeated game)和策略性让步(strategic concession),我们首先讲述有限 次和无限次重复博弈及其应用,然后讲解策略性让步均衡(strategic concession equilibrium)及其应用。

  在第5章,我们讲述诺奖的由来和通过对博弈论的研究而获得诺奖的学者的研究贡献。我们讲述在第2、3和4章中所提及的和所没有提及的诺奖贡献并指出它们的局限。
   如前所述,随着时间的流动,很多现实的经济活动都带有动态(微分)元素。在这带有动态的复杂环境下合作,是一门艰深的学问,现实的世界不单与时间密不可 分,当中更是变幻无常,正是沧海桑田、白云苍狗,这些变化随机发展,为决策情况添上许多不确定性。这些随机因素使动态博弈的复杂性大为增加,比决定性的情 况远为难解。这种复杂的决策情况称为随机动态(微分)合作博弈 [cooperative stochastic differential (dynamic) game]。在这些情况下,合作的问题要比在单纯带有 动态的决策情况下合作更为复杂和难解,而单纯带有动态的决策情况当中所涉及的数学理论和技术,相比诺奖贡献,又更为复杂。最近杨荣基与彼得罗相合著,由斯 普林格出版社发行的《随机微分合作博弈》则为此问题提出了解法。本书的后半部分的主要内容取材自该书,目的是阐述如何在这极为复杂的决策环境下合作。
   为了使读者们对非合作动态(微分)博弈有所了解,我们在第6章讲述非合作动态(微分)博弈,我们讲述决定性微分博弈 (deterministic differential game)和随机微分博弈(stochastic differential game)的各 种均衡及其应用。然后在第7和第8章,我们将分别讲述微分合作博弈和随机微分合作博弈。我们首先总结微分博弈的非合作结果,继而介绍合作的安排。我们讲述 动态(随机动态)合作所必须具备的整体理性(group rationality)、个体理性(individual rationality)和时间 (子博弈)一致性[time (subgame) consistency]。我们详述能导致动态平稳的协调转型补贴 (equilibrating transitory compensation),然后更以三地的基建合作方案为例,阐述如何在带有动态(随机动态)的 环境下成功合作,以缔造帕累托最优的共赢局面。最后,在第9章,我们将总结全书。
本书主要取材于杨荣基、彼得罗相两位的博弈论课程讲义及研究成果,并由李颂志辑录、阐释及书写成中文。

你可能感兴趣的:(生活,生物,出版,金融,活动,工具)