博弈论小结


下面是网上的关于组合博弈的一些资料的汇总:

SG函数:

给定一个 有向无环图和一个起始顶点上的一枚棋子,两名选手交替的将这枚棋子沿有向边进行移动,无法移 动者判负。事实上,这个游戏可以认为是所有Impartial Combinatorial Games的抽象模型。
也就是说,任何一个ICG都可以通过把每个局面看成一个顶点,对每个局面和它的子局面连一条有向边来抽象成这个“ 有向图游戏”。下 面我们就在 有向无环图的顶点上定义Sprague-Grundy函数。首先定义mex(minimal excludant)运算,这是施加于一个集合的运算,表示最小的不属于这个集合的 非负整数。例如mex{0,1,2,4}=3、mex{2,3,5}=0、mex{}=0。
对于一个给定的有向无环图,定义关于图的每个顶点的 Sprague-Grundy函数g如下:g(x)=mex{ g(y) | y是x的后继 }。
来看一下SG函数的性质。首先,所有的terminal position所对应的顶点,也就是没有出边的顶点,其SG值为0,因为它的后继集合是 空集。然后对于一个g(x)=0的顶点x,它的所有前驱y都满足 g(y)!=0。对于一个g(x)!=0的顶点,必定存在一个后继y满足g(y)=0。
以上这三句话表明,顶点x所代表的postion是P-position当且仅当g(x)=0(跟P-positioin/N-position的 定义的那三句话是完全对应的)。我们通过计算 有向无环图的每个顶点的SG值,就可以对每种局面找到必胜策略了。但SG函数的用途远没有这样简单。如果将有 向图游戏变复杂一点,比如说, 有向图上并不是只有一枚棋子,而是有n枚棋子,每次可以任选一颗进行移动,这时,怎样找到必胜策略呢?
让我们再来考虑一下顶点的SG值的意义。当g(x)=k时,表明对于任意一个0<=i<k,都存在x的一个后继y满足g(y)=i。也 就是说,当某枚棋子的SG值是k时,我们可以把它变成0、变成1、……、变成k-1,但绝对不能保持k不变。不知道你能不能根据这个联想到 Nim游戏, Nim游戏的规则就是:每次选择一堆数量为k的石子,可以把它变成0、变成1、……、变成k-1,但绝对不能保持k不变。这表明,如果将n枚棋子所在的顶 点的SG值看作n堆相应数量的石子,那么这个Nim游戏的每个必胜策略都对应于原来这n枚棋子的必胜策略!
对于n个棋子,设它们对应的顶点的SG值分别为(a1,a2,…,an),再设局面(a1,a2,…,an)时的Nim游戏的一种必胜策略是把ai 变成k,那么原游戏的一种必胜策略就是把第i枚棋子移动到一个SG值为k的顶点。这听上去有点过于神奇——怎么绕了一圈又回到 Nim游戏上了。
其实我们还是只要证明这种多棋子的 有向图游戏的局面是P-position当且仅当所有棋子所在的位置的SG函数的 异或为0。这个证明与上节的Bouton’s Theorem几乎是完全相同的,只需要适当的改几个名词就行了。
刚才,我为了使问题看上去更容易一些,认为n枚棋子是在一个有向图上移动。但如果不是在一个有向图上,而是每个棋子在一个有向图上,每次可以任选一个棋子(也就是任选一个有向图)进行移动,这样也不会给结论带来任何变化。
所以我们可以定义有向图游戏的和(Sum of Graph Games):设G1、G2、……、Gn是n个有向图游戏,定义游戏G是G1、G2、……、Gn的和(Sum),游戏G的移动规则是:任选一个子游戏Gi 并移动上面的棋子。Sprague-Grundy Theorem就是:g(G)=g(G1)^g(G2)^…^g(Gn)。也就是说,游戏的和的SG 函数值是它的所有子游戏的SG函数值的 异或。
再考虑在本文一开头的一句话:任何一个ICG都可以抽象成一个 有向图游戏。所以“SG函数”和“游戏的和”的概念就不是局限于有向图游戏。我们给每 个ICG的每个position定义SG值,也可以定义n个ICG的和。所以说当我们面对由n个游戏组合成的一个游戏时,只需对于每个游戏找出求它的每个 局面的SG值的方法,就可以把这些SG值全部看成Nim的石子堆,然后依照找Nim的必胜策略的方法来找这个游戏的必胜策略了!
回到本文开头的问题。有n堆石子,每次可以从第1堆石子里取1颗、2颗或3颗,可以从第2堆石子里取奇数颗,可以从第3堆及以后石子里取任意颗…… 我们可以把它看作3个子游戏,第1个子游戏只有一堆石子,每次可以取1、2、3颗,很容易看出x颗石子的局面的SG值是x%4。第2个子游戏也是只有一堆 石子,每次可以取奇数颗,经过简单的画图可以知道这个游戏有x颗石子时的SG值是x%2。第3个游戏有n-2堆石子,就是一个 Nim游戏。对于原游戏的每 个局面,把三个子游戏的SG值 异或一下就得到了整个游戏的SG值,然后就可以根据这个SG值判断是否有必胜策略以及做出决策了。其实看作3个子游戏还是保 守了些,干脆看作n个子游戏,其中第1、2个子游戏如上所述,第3个及以后的子游戏都是“1堆石子,每次取几颗都可以”,称为“任取石子游戏”,这个超简 单的游戏有x颗石子的SG值显然就是x。其实,n堆石子的 Nim游戏本身不就是n个“任取石子游戏”的和吗?
所以,对于我们来说,SG函数与“游戏的和”的概念不是让我们去组合、制造稀奇古怪的游戏,而是把遇到的看上去有些复杂的游戏试图分成若干个子游 戏,对于每个比原游戏简化很多的子游戏找出它的SG函数,然后全部异或起来就得到了原游戏的SG函数,就可以解决原游戏了。

有一种很有意思的游戏,就是有物体若干堆,可以是火柴棍或是围棋子等等均可。两个
人轮流从堆中取物体若干,规定最后取光物体者取胜。这是我国民间很古老的一个游戏
,别看这游戏极其简单,却蕴含着深刻的数学原理。下面我们来分析一下要如何才能够
取胜。

(一)巴什博奕(Bash Game):只有一堆n个物品,两个人轮流从这堆物品中取物,规
定每次至少取一个,最多取m个。最后取光者得胜。

    显然,如果n=m+1,那么由于一次最多只能取m个,所以,无论先取者拿走多少个,
后取者都能够一次拿走剩余的物品,后者取胜。因此我们发现了如何取胜的法则:如果
n=(m+1)r+s,(r为任意自然数,s≤m),那么先取者要拿走s个物品,如果后取者拿走
k(≤m)个,那么先取者再拿走m+1-k个,结果剩下(m+1)(r-1)个,以后保持这样的
取法,那么先取者肯定获胜。总之,要保持给对手留下(m+1)的倍数,就能最后获胜。
    这个游戏还可以有一种变相的玩法:两个人轮流报数,每次至少报一个,最多报十
个,谁能报到100者胜。
(二)威佐夫博奕(Wythoff Game):有两堆各若干个物品,两个人轮流从某一堆或同
时从两堆中取同样多的物品,规定每次至少取一个,多者不限,最后取光者得胜。

    这种情况下是颇为复杂的。我们用(ak,bk)(ak ≤ bk ,k=0,1,2,…,n)表示
两堆物品的数量并称其为局势,如果甲面对(0,0),那么甲已经输了,这种局势我们
称为奇异局势。前几个奇异局势是:(0,0)、(1,2)、(3,5)、(4,7)、(6,
10)、(8,13)、(9,15)、(11,18)、(12,20)。

    可以看出,a0=b0=0,ak是未在前面出现过的最小自然数,而 bk= ak + k,奇异局势有
如下三条性质:

    1。任何自然数都包含在一个且仅有一个奇异局势中。
    由于ak是未在前面出现过的最小自然数,所以有ak > ak-1 ,而 bk= ak + k > ak
-1 + k-1 = bk-1 > ak-1 。所以性质1。成立。
    2。任意操作都可将奇异局势变为非奇异局势。
    事实上,若只改变奇异局势(ak,bk)的某一个分量,那么另一个分量不可能在其
他奇异局势中,所以必然是非奇异局势。如果使(ak,bk)的两个分量同时减少,则由
于其差不变,且不可能是其他奇异局势的差,因此也是非奇异局势。
    3。采用适当的方法,可以将非奇异局势变为奇异局势。

    假设面对的局势是(a,b),若 b = a,则同时从两堆中取走 a 个物体,就变为了
奇异局势(0,0);如果a = ak ,b > bk,那么,取走b  – bk个物体,即变为奇异局
势;如果 a = ak ,  b < bk ,则同时从两堆中拿走 ak – ab – ak个物体,变为奇异局
势( ab – ak , ab – ak+ b – ak);如果a > ak ,b= ak + k,则从第一堆中拿走多余
的数量a – ak 即可;如果a < ak ,b= ak + k,分两种情况,第一种,a=aj (j < k)
,从第二堆里面拿走 b – bj 即可;第二种,a=bj (j < k),从第二堆里面拿走 b – a
j 即可。

    从如上性质可知,两个人如果都采用正确操作,那么面对非奇异局势,先拿者必胜
;反之,则后拿者取胜。

    那么任给一个局势(a,b),怎样判断它是不是奇异局势呢?我们有如下公式:

    ak =[k(1+√5)/2],bk= ak + k  (k=0,1,2,…,n 方括号表示取整函数)

奇妙的是其中出现了黄金分割数(1+√5)/2 = 1。618…,因此,由ak,bk组成的矩形近
似为黄金矩形,由于2/(1+√5)=(√5-1)/2,可以先求出j=[a(√5-1)/2],若a=[
j(1+√5)/2],那么a = aj,bj = aj + j,若不等于,那么a = aj+1,bj+1 = aj+1
+ j + 1,若都不是,那么就不是奇异局势。然后再按照上述法则进行,一定会遇到奇异
局势。

(三)尼姆博奕(Nimm Game):有三堆各若干个物品,两个人轮流从某一堆取任意多的
物品,规定每次至少取一个,多者不限,最后取光者得胜。

    这种情况最有意思,它与二进制有密切关系,我们用(a,b,c)表示某种局势,首
先(0,0,0)显然是奇异局势,无论谁面对奇异局势,都必然失败。第二种奇异局势是
(0,n,n),只要与对手拿走一样多的物品,最后都将导致(0,0,0)。仔细分析一
下,(1,2,3)也是奇异局势,无论对手如何拿,接下来都可以变为(0,n,n)的情
形。

    计算机算法里面有一种叫做按位模2加,也叫做异或的运算,我们用符号(+)表示
这种运算。这种运算和一般加法不同的一点是1+1=0。先看(1,2,3)的按位模2加的结
果:

1 =二进制01
2 =二进制10
3 =二进制11 (+)
———————
0 =二进制00 (注意不进位)

    对于奇异局势(0,n,n)也一样,结果也是0。

    任何奇异局势(a,b,c)都有a(+)b(+)c =0。

如果我们面对的是一个非奇异局势(a,b,c),要如何变为奇异局势呢?假设 a < b
< c,我们只要将 c 变为 a(+)b,即可,因为有如下的运算结果: a(+)b(+)(a(+)
b)=(a(+)a)(+)(b(+)b)=0(+)0=0。要将c 变为a(+)b,只要从 c中减去 c-(
a(+)b)即可。

    例1。(14,21,39),14(+)21=27,39-27=12,所以从39中拿走12个物体即可达
到奇异局势(14,21,27)。

    例2。(55,81,121),55(+)81=102,121-102=19,所以从121中拿走19个物品
就形成了奇异局势(55,81,102)。

    例3。(29,45,58),29(+)45=48,58-48=10,从58中拿走10个,变为(29,4
5,48)。

    例4。我们来实际进行一盘比赛看看:
        甲:(7,8,9)->(1,8,9)奇异局势
        乙:(1,8,9)->(1,8,4)
        甲:(1,8,4)->(1,5,4)奇异局势
        乙:(1,5,4)->(1,4,4)
        甲:(1,4,4)->(0,4,4)奇异局势
        乙:(0,4,4)->(0,4,2)
        甲:(0.4,2)->(0,2,2)奇异局势
        乙:(0,2,2)->(0,2,1)
        甲:(0,2,1)->(0,1,1)奇异局势
        乙:(0,1,1)->(0,1,0)
        甲:(0,1,0)->(0,0,0)奇异局势
        甲胜。

取火柴的游戏
题目1:今有若干堆火柴,两人依次从中拿取,规定每次只能从一堆中取若干根, 
可将一堆全取走,但不可不取,最后取完者为胜,求必胜的方法。 
题目2:今有若干堆火柴,两人依次从中拿取,规定每次只能从一堆中取若干根, 
可将一堆全取走,但不可不取,最后取完者为负,求必胜的方法。
嘿嘿,这个游戏我早就见识过了。小时候用珠算玩这个游戏:第一档拨一个,第二档拨两个,依次直到第五档拨五个。然后两个人就轮流再把棋子拨下来,谁要是最后一个拨谁就赢。有一次暑假看见两个小孩子在玩这个游戏,我就在想有没有一个定论呢。下面就来试着证明一下吧
先解决第一个问题吧。
定义:若所有火柴数异或为0,则该状态被称为利他态/必败态,用字母T表示;否则, 为利己态/必胜态,用S表示。
[定理1]:对于任何一个S态,总能从一堆火柴中取出若干个使之成为T态。
证明:
    若有n堆火柴,每堆火柴有A(i)根火柴数,那么既然现在处于S态,
      c = A(1) xor A(2) xor … xor A(n) > 0;
    把c表示成二进制,记它的二进制数的最高位为第p位,则必然存在一个A(t),它二进制的第p位也是1。(否则,若所有的A(i)的第p位都是0,这与c的第p位就也为0矛盾)。
    那么我们把x = A(t) xor c,则得到x < A(t).这是因为既然A(t)的第p位与c的第p位同为1,那么x的第p位变为0,则该数一定小于原来第t堆的A[t]。所以x < A(t).(注意此处不能等于)而
    A(1) xor A(2) xor … xor x xor … xor A(n)
  = A(1) xor A(2) xor … xor A(t) xor c xor … xor A(n)
  = A(1) xor A(2) xor… xor A(n) xor A(1) xor A(2) xor … xor A(n)
  = 0
这就是说从A(t)堆中取出 A(t) – x 根火柴后状态就会从S态变为T态。证毕
[定理2]:T态,取任何一堆的若干根,都将成为S态。
证明:用反证法试试。
      若
      c = A(1) xor A(2) xor … xor A(i) xor … xor A(n) = 0;
      c’ = A(1) xor A(2) xor … xor A(i’) xor c xor … xor A(n) = 0;
      则有
c xor c’ = A(1) xor A(2) xor … xor A(i) xor … xor A(n) xor A(1) xor A(2) xor … xor A(i’) xor c xor … xor A(n) = A(i) xor A(i’) =0
      进而推出A(i) = A(i’),这与已知矛盾。所以命题得证。
[定理 3]:S态,只要方法正确,必赢。 
  最终胜利即由S态转变为T态,任何一个S态,只要把它变为T态,(由定理1,可以把它变成T态。)对方只能把T态转变为S态(定理2)。这样,所有S态向T态的转变都可以有己方控制,对方只能被动地实现由T态转变为S态。故S态必赢。
[定理4]:T态,只要对方法正确,必败。 
  由定理3易得。 
接着来解决第二个问题。
定义:若一堆中仅有1根火柴,则被称为孤单堆。若大于1根,则称为充裕堆。
定义:T态中,若充裕堆的堆数大于等于2,则称为完全利他态,用T2表示;若充裕堆的堆数等于0,则称为部分利他态,用T0表示。
 
孤单堆的根数异或只会影响二进制的最后一位,但充裕堆会影响高位(非最后一位)。一个充裕堆,高位必有一位不为0,则所有根数异或不为0。故不会是T态。
[定理5]:S0态,即仅有奇数个孤单堆,必败。T0态必胜。 
证明:
S0态,其实就是每次只能取一根。每次第奇数根都由己取,第偶数根都由对 
方取,所以最后一根必己取。败。同理,  T0态必胜#
[定理6]:S1态,只要方法正确,必胜。 
证明:
若此时孤单堆堆数为奇数,把充裕堆取完;否则,取成一根。这样,就变成奇数个孤单堆,由对方取。由定理5,对方必输。己必胜。  # 
[定理7]:S2态不可转一次变为T0态。 
证明:
充裕堆数不可能一次由2变为0。得证。  # 

[定理8]:S2态可一次转变为T2态。 
证明:
由定理1,S态可转变为T态,态可一次转变为T态,又由定理6,S2态不可转一次变为T0态,所以转变的T态为T2态。  # 
[定理9]:T2态,只能转变为S2态或S1态。 
证明:
由定理2,T态必然变为S态。由于充裕堆数不可能一次由2变为0,所以此时的S态不可能为S0态。命题得证。 
[定理10]:S2态,只要方法正确,必胜. 
证明:
方法如下: 
      1)  S2态,就把它变为T2态。(由定理8) 
      2)  对方只能T2转变成S2态或S1态(定理9)
    若转变为S2,  转向1) 
    若转变为S1,  这己必胜。(定理5) 
[定理11]:T2态必输。 
证明:同10。 
综上所述,必输态有:  T2,S0 
          必胜态:    S2,S1,T0. 
两题比较: 
第一题的全过程其实如下: 
S2->T2->S2->T2->  ……  ->T2->S1->T0->S0->T0->……->S0->T0(全0) 
第二题的全过程其实如下: 
S2->T2->S2->T2->  ……  ->T2->S1->S0->T0->S0->……->S0->T0(全0) 
下划线表示胜利一方的取法。  是否发现了他们的惊人相似之处。 
我们不难发现(见加黑部分),S1态可以转变为S0态(第二题做法),也可以转变为 
T0(第一题做法)。哪一方控制了S1态,他即可以有办法使自己得到最后一根(转变为 
T0),也可以使对方得到最后一根(转变为S0)。 
  所以,抢夺S1是制胜的关键! 
  为此,始终把T2态让给对方,将使对方处于被动状态,他早晚将把状态变为S1.

 
推荐HDOJ题目
http://acm.hdu.edu.cn/showproblem.php?pid=1907
http://acm.hdu.edu.cn/showproblem.php?pid=2509
看完上面的结论,就能顺利解决上面2道了
 
 
S-Nim
http://acm.hdu.edu.cn/showproblem.php?pid=1536
http://acm.hdu.edu.cn/showproblem.php?pid=1944
 
 
 
博弈算法入门小节 1536 1517 1907
小子最近迷途于博弈之中。。。感触颇深。
为了让大家能够在学习博弈的时候少走弯路,最重要的也是为了加深自己的影响,温故而知新,特发此贴与大家共勉。
学博弈先从概念开始:
特别推荐LCY老师的课件:博弈入门。
下载地址: http://acm.hdu.edu.cn/forum/read.php?tid=6875
这个课件个人认为从博弈的基本思想,一直到解博弈的中心算法做了很好的诠释。但是特别要注意的是。课件后面一部分英语写的讲义是重中之重。小子英语很弱,在这困扰很久。现在为大家大概介绍一下。
主要是后继点和SG值的问题:
SG值:一个点的SG值就是一个不等于它的后继点的SG的且大于等于零的最小整数。
后继点:也就是按照题目要求的走法(比如取石子可以取的数量,方法)能够走一步达到的那个点。
具体的有关SG值是怎么运用的希望大家自己多想想。
课件后面有一个1536的代码。可以放在后面做做
看到这里推荐大家做几道题:1846(最简单的博弈水题)
1847(求SG值)

有了上面的知识接下来我们来看看组合博弈(n堆石子)
推荐大家看个资料:
博弈-取石子游戏(推荐等级五星级)
http://acm.hdu.edu.cn/forum/read.php?fid=20&tid=5748
http://hi.baidu.com/netnode/blog/item/30932c2edc7384514fc226ea.html
这里提出了一个奇异状态的问题。看了这篇文章你会发现异或运算在博弈中使用的妙处。当然这里指出的只是组合博弈中一种特殊情况。
王道还是对SG值的求解,但是知道这么一种思路无疑对思维的广度和深度扩展是很有帮助的。
ZZ博弈
http://acm.hdu.edu.cn/forum/read.php?fid=9&tid=10617
这里介绍了组和博弈的两种大的类型,一种是最后取的是N状态一种是最后取的是P状态,两个状态的解题方法能看懂很有帮助。当然,能够把推导过程理解,吃透无疑是大牛级的做法~小子也佩服的紧~   
    1536题推荐做做这题,这题前面提醒大家是一个求SG值的题目,题目前面是对异或运算运用在组合博弈问题中的很好的解释。当然题目本身是有所不同的。因为在这里面对取法有所要求。那么这样就回归到了解决博弈问题的王道算法——求SG值上。
    有关运用求SG值的博弈题目有: 1850(也可基于奇异状态异或)
1848(中和的大斐波那契数列的典型求SG值题)
1517(个人认为有点猥琐的题目。。。。在此题上困扰很久。当然搞出来很开心。小子是用比较规矩的求SG值的方法求出来的,但是论坛有人对其推出来了规律,这里佩服一下,大家可以学习一下)
1079(更猥琐的题目,对新手要求较高,因为按传统方法需要比较细致的模拟加对边角状态的考虑,同样有人推出来了公式)
当你全部看完以上的东西。做完以上的题目的话。。。小子恭喜你~你博弈入门了~~~~
    这里小子告诉大家。博弈很强大。学习要耐心~谢谢

----------------------------------------------------------------------------------------------------------------------------------

博弈小结:

(忽略从word上复制过来之后的奇葩缩进)

看了张一飞+贾志豪+方展鹏+曹钦翔的论文都讲得超好,这些应该到处都可以找到的。

终于会基本的博弈了。

仅仅只是看完之后的回忆录而已,基本上和论文相似,仅总结加深记忆用。

看到本文的人轻点喷。

也许看论文会更清晰。

以前博弈各种弱,只是零零星星的了解一些知识,严格的证明之类的没有接触。

现在终于都搞清啦!不过碰上奇葩博弈还是做不出。。。

 

1.极大极小搜索

        

         好吧!表示最后才看到这个的。还是比较好理解的。

         还有α-β剪枝,这个应该自己随便yy都可以搞出来的。

         好吧!用来做五子棋,3连棋之类的。

         至少会了这个,一般的博弈都可以拿0分以上了。

 

2.普通NIM游戏

       

         概念题:一堆石子n个,每次最多取m个,求先手必胜还是必败。

 

     N表示比生态,P表示必败态。

         终止状态是P状态,然后找出能到达这个点的点标记为N状态,

         继续扫,找到只能到达N状态的点标记为P状态,如此循环往复。

         这个比较直观。类似拓扑的扫一次即可。

        

         对于很多堆石子的话张一飞论文说得很清楚,小结一下。

 

         首先看两堆石子,如果个数完全一样,那么后手必胜,因为现手在一堆中拿走了

         一些棋子之后,后手总能在另一堆中拿一样多的棋子。

        

         考虑把局面S分解成AB,先手必胜成为S胜,后手胜为T胜。

        

如果A=B,T胜。如S={3,3,2,2}分解成{3,3}{2,2}.

 

如果对于AS胜,BS(由于AB等价,反过来亦然)S只需要先拿A,然后T如果拿AS也拿ATBS也拿B,那么S因为对于AS是先手,所以S总是可以拿到A的最后一个,并且可以逼着TB的先手。因为B先手必败,S也可以拿掉B的最后一个。

        

如果对于AB都是S败,那么A先随便拿一个,对于T来说就变成了上一种情况了。那么此时T胜。

 

AB都是S胜时,S肯定不会第一步把局面变成一胜一负,他会继续变成AB都对于T必胜,那么T又纠结了。如此往复,就无法确定了。

 

上面的分解,归纳一下,如果对于BS必败,那么整个局面的胜负和A一样。

那么如果原几何是{2,2,2,7,7,3,3,9}就可以分解成A{2,9},B{2,7,3},C{2,7,3}。因为B+C是必败的,所以A+B+C的胜负和A一样,这样就转化成了一个不重集合了,打裸就少了一堆状态了。

 

好吧!以上就可以类比出XOR运算了。沿着这个思路,就可以想到一个函数来优化打裸了。

 

         f[x]=x(一下xor+代替)

         那么对于一堆石子S={a1,a2,a3…..an}

         p=f[a1]+f[a2]+…..+f[an]

如果p=0则该状态是S败,否则S胜。

 

因为终止状态是p=0,要证明这个结论的正确性,只需要证明从p0能够转移到p=0,而从p=0只能转移到p0即可。

首先,明确xor的基本性质。

1.a+b=c,则有a+c=b.

2.p=a1+a2+…..an0,必然存在k,使p+ak<ak,因为p的最高位为1,肯定有一个ak该位也是1p+ak该位就是0了。所以得证。

 

证明从p0能够转移到p=0

         因为p=f[a1]+f[a2]+…..f[an]=a1+a2+…+an

         找到p+ak<akka1交换。

         x=p+a1<a1,直接把a1变成x1,那么p=p+a1+a2+…..+an=0.

 

证明从p=0只能转到p0

         如果a的全部序列都是0了,你就玩完了。

其他时候,随便你选什么数ak,那么其他数的xor和肯定等于ak

p=(ak-xxx) + ak,xxx为正数且小于ak,那么p显然就不为0了。

 

至此,证明了f[a1]=a1的正确性了。

 

现在题目稍稍拓展一下。

N堆石子,每次任选一堆,可以从这堆拿走不超过m个的石子。求先手必胜还是必败。

 

这个的f[a1]=a1%m.

 

因为游戏的分解之类的东西与前一个游戏一样,所以只需考虑一堆石子即可。

考虑最开始的那个打裸,从后往前推一下NP就可一直到a1%m=0时必败。

 

来个终极版NIM游戏。

 

有若干排石子,每次必须选相邻的两个拿走,把原来的那排变成了两排。

谁无路可走了谁就挂了。

 

分析这个题,发现各种分解的性质和前面的两个游戏一样的。现在就需要求f值了。

和前面的游戏一样,我们设计的f值必须满足

终止状态p=0,从p0能够转移到p=0,p=0只能转移到p0即可。

第一个条件是显然成立的。

回忆论文,先假设#S表示S这个状态的f值之xor和,

 

 

要满足第二个条件

         p=f[a1]+f[a2]+….+f[an]0,x=f[a2]+f[a3]+….+f[an]=p+f[a1].

         p+f[a1]<f[a1],所以x<f[a1].

         a1干掉后可能变成了{b1,b2,…..bm}

         那么必须#{b1,b2,….bm}+x=0,如果1~f[a1]-1,都被#{b1,b2….bm}包含了,

         那么肯定是可以找到满足条件的x的。

 

要满足第三个条件

         p=f[a1]+f[a2]+…+f[an]=0时。f[a1]=f[a2]+…+f[an]=x;

         同样把a1干掉,得到{b1,b2….bm}

         Pn=#{b1,b2,…..bm}+x0,必须对于任意b都成立。

         所以x不能出现在a1能转到的状态中。

 

                  所以f值就是他的后继的f值中没有出现过的值的最小值就行了。

其实,这就是sg值了。以前一直觉得这东西特别神奇,原来就这样就证明出来了。

 

sg函数的使用条件:

1.       谁无法操作就输,与就是能找到必败态。

2.       满足类似拓扑序的东东

3.       各个游戏独立

4.       平等游戏

5.       对操作的限制,至于常数有关。

 

 

 

3.anti-nim游戏

 

         如果定义拿最后一个棋子的人输就成了anti-nim游戏。

         传说中的SJ定理登场了。实际上很多定理都会披上这么牛叉的名字。

         我们就一种情况一种情况的玩吧。

         这里的SG应该还是指的NIM中的SG

 

先手必胜有两种状态:

1.如果每一个小游戏都只剩下一个石子了,SG0

2.至少一堆石子>1,SG不为0.

 

证明

         1显然成立。

         2的话分两种情况

a.       只有一堆石子>1,好吧!整个生杀大权都交你主宰了。你可以把它变成1

b.       至少两队石子>1,你只需要把SG值边为0就可以了,这个操作之后,至少还有两堆石子>1,然后对方随便怎么操作,都会把SG变成非0,你们就一直这么玩就行了。

还需要证明1,2的反面是必败的。

1显然了。

2的话,你会把SG变成非0,而且因为现在至少两堆石子>1了,所以你还会给人家至少留一个>1的,那么无论怎么搞,都会送给后手一个必胜态。

 

 

4.every-SG游戏

        

    就是多线程博弈。

形象的说就是红队和蓝队每个队n个人,然后进行n个博弈,最后结束的一场博弈的胜者胜利。

显然,每个博弈的胜者都想让时间坚持得更久,每个败者都想让这场博弈早点结束。

不难列出每个点到终止的步数的DP方程。

如果v是先手必胜,则f[v]=max(f[u])+1,其中uv的后继且u为先手必败。

否则f[v]=min(f[u])+1,uv后继。

         然后可以求出每一个博弈的步数。

         求出这个最大值,如果最大值是奇数,那么先手必胜。这个显然。

 

 

        还有黄金分割那道题,二分图有关的博弈,k倍动态减法游戏。写在应用里了。

 

5.不平等博弈

        

         传说中的超现实数(也译成超实数)登场了。

         首先明确超现实数的两个定义

         定义surreal number x={XL|XR},满足XL中的任意一个数小于等于XR中的任意一个数。

         然后是看他们如何比较大小

         x={XL|XR}y={YL|YR},要满足x<=y,必须满足XL的任意一个元素<y,YR的任意一个元素>x.

         首先{|}=0.

         然后可以构造出第一批新数{0|},{|0}

         根据定义可以知道{|0}<{|}<{0|}

         那么{|0}=-1,{0|}=1.

         然后可以继续构造出一堆数。

         接下来是加法运算法则。

         x+y={XL|XR}+{YL|YR}={XL+y,YL+x|XR+y,YR+x} XL+y运算即把XL中的每一个元素+y

         这个公式十分美观,应该一眼就能记住了。

         加法的交换律和结合律都是满足的。

       然后就类比到不平等博弈问题。

       两个人A,B面临着不同的局面恰好可以分成LR,我们可以把它构造成超现实数。

       于是乎整个局面变成了x={SA|SB},比如A可以转移到xyzB可以转移到w

       就变成了{x,y,z|w}.

 

         如果x>0

则说明x>=0成立,且x<=0不成立。

也就有SA中的元素都>=0,y中的元素都>0,那么A能转移到的状态总是有>=0的,y能转移到的总是>0的,那么A总是有状态可转,那么A必胜。

 

如果x<0

         说明x>=0不成立,x<=0成立。

         也就是SA的元素都<0,SB则有<=0,同理B必胜。

 

如果x=0

         也就是说x>=0x<=0同时成立。

         那么SA<0,SB>0.那么A先手的话会转移到<0的,然后B必胜,B同理。

         所以此时先手必败。

 

真的很佩服方展鹏神犇能想到把博弈和超现实数结合起来。

弱菜就只有膜拜的份了。

 

理论知识终于准备得差不多了,接下来就是刷更多题熟练了。


你可能感兴趣的:(ACM,博弈论)