Yale开放课程博弈论15

15. 落后的感应------国际象棋、战略和可信的威胁

 

通过上节课最后的小游戏尼姆博弈(Nim Game)来承上启下。这个游戏的结论是当两堆石子数目一致时,后行者每次选择与先行者对称的策略(先行者选择A堆的x个,后行者就选择B堆的x个)来取胜。当两堆石子数目不一致时,先行者选择较多的那堆石子将两堆数目变得一致,即先行优势可以在自己进行一轮后将局势转换成后行优势。

 

这里要介绍策梅洛(Zermelo)定理,假设为完全信息博弈(知道之前的决策)、有限结点、博弈结果有三种可能,那么先行或后行者当一必有一方有必胜/必不败的策略。

 

有了这个定理,我们就可以知道譬如井字过三关(tic-tac-toe)平局博弈、西洋跳棋、国际象棋等博弈都会有结果。

 

而策梅洛定理可以采用归纳法证明,归纳的对象是博弈的最大长度N(也可以看成博弈树的高度)。

 

首先证明对长度为1时的博弈成立,然后假设长度小于等于N的博弈成立,推出博弈为N+1的博弈也成立。

在后一步的推导过程中我们定义了子博弈问题(subGame),例如在长度为N的博弈中第一个节点处一号参与者选择向上或者向下走之后的子树对应一个子博弈问题,其长度为N-1。

我们首先假设所有长度为N或者更小的博弈都有解,我们指出所有长度为N+1的博弈都可看作是一号参与者走了整个博弈的第一步之后的长度为N或者更小的子博弈。每个长度为N或者更小的步数的博弈都有解,那么一号参与者只需要早这里选择一个对他来说更优的子博弈,我们的证明就结束了。

 

玩游戏

石子阵列,N行M列(如5行3列,4行5列)

参与人按顺序博弈,当轮到你时,选择一颗石子,然后它东北方向(右上角包括自己)所有的石子都被拿走,谁拿走最后一颗石子,谁输。

根据策梅洛定理,无论N和M取值如何,这个游戏都有解。而homework就是找出这个解。

提示:记住有解是很有意义的。

 

形式化定义:

完全信息(perfectinformation), 就是在任一节点上被轮中的参与者都知道自己处在整个博弈的哪个节点的博弈。即她知道她是怎么走到这里的,知道之前走的步骤。

 

博弈中的策略,纯策略,指在一个完全信息博弈中,一号参与者的纯策略是一个完整的行动计划,一号将要在每个节点上采取怎样的行动。

 

下面这个例子将告诉我们策略告诉你在某个节点该怎么走,无论能不能让她走到这个节点。

(为了方便记录,这里按照博弈树中的路径表示树,纯自创,不具有数学意义。第一条路径表示1选择策略U之后2选择策略L,1再选择策略u,最终1号的收益为2,而2号的收益为4)

1  -U->  2  -l->  1  -u->  2, 4

1  -U->  2  -l->  1  -d->  3, 1

1  -U->  2  -r->  0, 2

1  -D->  1, 0

 

采用逆向归纳法我们可以求得两者的最优决策:1号选择D,2号选择R(如果有选择的机会)。在逆向归纳的时候我们不仅要考虑2号怎么做,还要考虑2号这样做之后1号会怎样做。

 

也就是说上面问题的策略集合是Uu/Ud/Du/Dd,我们可以采用以前学习的方法,将博弈树画成收益矩阵,发现矩阵中存在冗余,寻找纳什均衡NE得到(Dd, r)和(Du, r)。

 

其中(Du, r),表示第一步1号选择D,2号选择r,第二步1号选择u,在第二步中1号的选择明明d是最优的,为什么会选择u呢?实际中在1号选择D之后,2号根本没有机会选择r。

陷阱:如果你只是机械地寻找博弈中的纳什均衡,轮到人们做选择时你会发现人们采取的策略是很愚蠢的。

 

经济学的例子

市场中有一个垄断者Inc,和一个将要选择进入该市场的人Ent,他选择观望out或者进入in,若观望,垄断者会继续垄断价格,若加入,垄断者可能打压F,也可能不打压NF。博弈树如下:

Ent  -in-> Inc  -F->  -1,0

Ent  -in->  Inc  -NF->  1,1

Ent  -out->  0,3

 

纳什均衡NE:(in, NF)、(out, F)

采用逆向归纳法,我们能得到(in, NF),另一个均衡怎么了?

 

假设你毕业后要开一个公司买操作系统,比尔盖茨告诉你如果你进入市场,他会打压你,你肯定就不会进入市场。但是这个威胁并不可信,因为根据收益情况看,若你进入市场,他为了自己的利益肯定会选择不打压你。

这样看起来这个均衡似乎有点存在的道理,但它建立在相信一个不足信的威胁的基础上。

 

假设你的进入已经成为一个可信的承诺或事实,我们知道,垄断者选择不反击是一个均衡。

但是现实情况可能不是这样的,因为如果你一旦成功进入,其他的参与者也会蜂拥而入,他的垄断者地位将不存在,所以这里可能需要杀鸡儆猴,吓退之后的可能进入者。

你可能感兴趣的:(Yale开放课程博弈论15)