转贴:定式中的“纳什均衡”与“有限理性”

      关于围棋的定式,棋界有不同解说,但也有一些基本共识,如定式之“定”只有相对含义,定式经历历史沿革,可见其非自然法则,乃人之发明,而且行棋中出“变着”也为常见。甚至有求道者如小林光一痛思“定式”之束缚,打破“思维定势”和行棋惯例,进而天马行空追求“随心所欲而不逾矩”的境界。但毕竟,人人都用定式,且亦步亦趋,不轻易越雷池为多,职业高手也常不例外。可见定式自然有其符合“棋理”之处。本文拟对定式之“理”以及定式的局限作一理论探讨。
    定式与“纳什均衡”
    何为“定式”,小林光一有如下定义:“在局部战斗中,用最稳妥的顺序,而且能经得住以后的检验,从而被固定下来的就是定式”。在此定义中,“局部”较易理解,但何为“稳妥”?如何“检验”?均语焉不详。下面就用博弈论(game theory)——尤其是“纳什均衡”(Equilibrium)作一诠释。
    博弈论的基本前提为:某人或某物的行为效果如何,有赖于他人或他物的行为。由于世上人间的事物很少不依赖于其他事物而存在,因此博弈论用途甚广,从军事,政治,经济等社会科学,到工程学和生物学等自然科学,均留下印记。在日常生活中,从待人接物到谈情说爱,无不涉及博弈过程。
    初期博弈论强调利益的冲突,即非合作甚至对抗状态。比如,“零和理论”指一方得益则意味着另一方遭损。这在围棋中早有运用,如“他人之急所即我之急所”。棋,包括围棋,既然讲的是胜负之道,就规定了它的对抗性。军事行为、经济行为、政治行为、国际均有对抗的因素,但如果这个宇宙只有对抗和冲突,它又如何避免分崩离析的结果呢?这样的问题,在美苏冷战
时期(双方都拥有毁灭性核武器),尤其显得重要。数学家约翰·纳什(John Nash,1928——)就是在这样的背景下提出了他的均衡理论,后称为“纳什均衡”,这一理论也是他1994年获诺贝尔经济学奖的主要理由。
    纳什早年入普林斯顿大学数学系做研究生即与围棋结缘。对于纳什来说,棋局中的博弈隐喻着人间事物的基本规律。事态如棋局,而棋局是可以用策略思维加以概括的。比如“过分”,“本手”与“缓着”之间,一般都会选择本手,着法过分如不遇反击,可能占到便宜,如遇反击则可能亏损,因此如果棋力相当,则应考虑到对手的反击手段。对手也同样考虑到在追求利益中不可能占尽便宜。这就导致双方都能接受的方案。
    纳什的均衡理论的要义在于:即使在对抗条件下,双方可以通过向对方提出威胁和要求,找到双方能够接受的解决方案而不至于因为各自追求自我利益而无法达到妥协,甚至两败俱伤。稳定的均衡点建立在找到各自的“占优策略”(dominant strategy),即无论对方作何选择,这一策略优于其他策略(所谓“本手”是也)。“定式”即是许多变化中双方都认为“不亏”的一种变化。
    纳什均衡与定式的关系可以从两个层面看。从策略层面看,如一方的策略是“捞地”,另一方是“取势”,而结果相当,互有所得,双方就愿意那样下。“捞地”(考虑现实利益),“取势”(考虑将来发展)便形成一个“纳什均衡”;另一方面,可以从具体行棋效果来看,如果一步棋能考虑到对手各种应手而依然成立,对手也运用同样法则找到应对,则可以说双方达成了“纳什均衡”。
    这样看,定式是一系列纳什均衡的累计直至局部达到稳定的一种变化,直到一方认为可以根据形势选择任何变化或脱先而无局部受损之虞。由于定式是在大量实战基础上不断被验证并长期积累而成,可以说定式是围棋中科学成份最大的。
    但是,围棋的变化无穷,定式之外其他种种变化难以穷尽。一个定式少则几步,多则几十步。有些定式具有强大必然性,不然有崩溃之虞,或明显亏损,有些可能具有弹性空间,将来趋势也未必明了。在某一局部具有均衡意义(即双方地考虑了对方可能的策略而达成的对等的占优策略)的变化可能有多种,而“定式”只是在前人经验总结出的一部分。从而会有新的定式出现。而在任何对局中,全局情况,对手棋风,都会决定一个定式是否真正具有“均衡”意义。比如,一个棋风锐利、咄咄逼人的棋手碰到处处忍让的棋手,可能占到便宜,遇到同类棋手,则会陷入恶战和险境。
    由此可见,在变化的棋局中,“均衡”只有相对意义。因而小林光一说定式不可通用,局部构思不利于全局时就应该使用变着。再者,棋手的日的常常不是寻找均衡点,而是利用对方的弱点打破均衡而获得优势。解决这些问题,还需要从心理学入手。
    定式与“有限理性”
    赫勃特·赛蒙(Herbert Simon,1916——1997)用心理学原理探讨经济行为——尤其是商业
行为的第一人,他也是对国际象棋进行心理学研究的先行者之一。他对传统经济学提出挑战。经
典经济学假定人的经济决策是高度理性的,即掌握完全信息,有能力作出最优化的选择。“纳什均衡”同样基于竞争对手双方都拥有完全信息(如对手有哪些应对手段),和完全理性的假设(如考虑到对手有A、B、C三种手段,自己的选择中哪一种可立于不败之地)。
    而赛蒙认为:人无法获得决策所需的所有信息,即使能获得所有信息,人也无法实现充分理性,因为我们能力有限,而且面临时间压力,不可能无限制地周全思考一个问题的全部复杂关系及行动后果。这就是赛蒙“有限理性”的命题。那么,有此缺陷的人究竟如何决策呢?赛蒙用了“满意/牺牲”(satisfice)概括人或经济实体的行为,人并非追求利益最大化,而是满意即可。这一理论使他获得1978年诺贝尔经济学奖。
    “有限理性”应用于“定式”,可得出如下结论:定式未必是解决双方利害冲突的最优化的均衡结果,而是我们达到双方满意的权宜手段。主要原因是围棋变化过于复杂,数学上称为“组合爆炸”(combinatory explosion)。
    这样,小林光一所说的“稳妥的顺序”可以这样解释:面对纷乱的变化可能,定式“避免了计算带来的认知超载,并由于经过前人检验,其结果有可预测性且相对对等(即如按定式下不会坏到哪里)。从这个意义上说,定式所依据的不是客观上的绝对均衡(即纳什均衡),而是主观上双方都不愿意看到一开始就纷乱失控的局面而作的妥协(追求结果的稳定性和可预测性)。定式成为可能也是因为局部对全局的战略意义尚不明了。但对于高手来说,定式的选择运用早有战略的企图,只是我们尚不能领会而已。从这一角度看定式,也可见有意识地打破定式的意义,一方面,打破定式是追求利益最大化,即优化选择的必然结果,因为定式作为双方满意的权宜之计不可能考虑到周围和全局的变数。另一方面,打破定式也可以是心理战术,对方造成心理压力,因为增加了棋的变数和不可预测性。
    如果定式仅仅是达到双方满意的结果,又如何解释小林光一所言一个定式必然“经得住以后的检验”呢?这是指一种变化既然为大家认可而成为定式,就必然具有合理性,具有了纳什均衡的实质效果,但是“有限理性”决定了纳什均衡只是理论的假定,因为全知能力只属于上帝,而不为任何一方所有。任何定式都只能实现相对的均衡,每一步棋都蕴含着新的不平衡(形势向某一方的倾斜)。而所谓棋高一筹,正是看到了不平衡所带来的契机,进而获得胜机。
     由此念及初学定式可能带来的弊病。视定式为百试不爽的招数,盲目地,机械地,不经思考地照搬定式,在初学阶段可能尚不成问题,但很快就会成为提高棋艺的障隘。反过来说,能够活用定式,甚至能恰到好处地打破定式,则体现了对棋的悟性。
    同理,在围棋教学中不仅传授定式(知其然),更要教授定式的合理运用和局限(知其所以然),才不至于束缚学童的想象力,创造力。定式能够变通,其存在才具有价值。
    (作者尝试撰写围棋心理学面面观文章系列,该文为首篇。)
    作者简介
     戴耘博士,90年代初赴美国普度大学(Purdue)攻读心理学,毕业后任美国人才培养国家研究中心博士后。现任教于纽约州立大学(Albany)教育与咨询心理学系,博士生导师。
    在欧美学术刊物和书籍上发表论文近三十篇,编著有《动因,情绪,认知:智能及发展整合观》(与耶鲁大学教授罗勃特·斯腾博格合著,2004版)。
    近年着重从人才成长过程和认知科学角度研究围棋,获得美国最权威的联邦拨款机构国家科学基金会(NSF)学习与发展科学部的资助。 

你可能感兴趣的:(电脑围棋,优化,生物,咨询,教育,生活,c)