人们会不知觉运用“博弈论(Game Theory)”在实际生活决策中,博弈策略的主要目是选择对自己最有利的结果。人是理性,自私的。在“辱母案“中,从简单的双方债权债务当事人,先后演变为多方利益体博弈。警察、法官、社会公众、国家法律、道德风险都没有能逃脱利益博弈的囚笼。
在山东“辱母案“ 我看到博弈论(Game Theory)的身影,就用博弈论来分析双方当事人的策略、动机和作出的选择。涉及到对道德风险、法律制度、以及社会公众对法律制度的信仰的影响。
01
一方面,在非合作博弈的情况下,国家法律约束力失效,导致双方当事人信息不对称,失去了约束力,合法约束应该从一开始就没有,双方博弈也不可能在力量悬殊的情况下实现均衡。最终,导致双方当事人都选择自己利益最大化,双方死伤、入狱的结果。
第二方面,作为国家执法机器的代表-----警察,作为公正代表的第三方,拥有国家法律赋予自高无上的执法权利,在双方当事人没有合法约束力,失去均衡选择能力时,警察放弃行使法律约束力,加上信息的不对称,博弈三方在自利原则下,选择自己利益最大化,终于走向极端。
第三方面,一审结果出炉,导致社会公众参与到与国家的司法制度的博弈中,这涉及对法律制度、道德风险的信任问题,如果二审结果维持原判,可能导致社会公众对法律制度和道德风险的失衡,这是一个很可怕的状态,我们每个人都不可能独善其身。
02
一般情况下,博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。“辱母案“高利贷的合同约定,在不违背国家合同法的情况下,是有约束力的协议。现在看到的情况,是违背了《合同法》和《金融法律规定》的相关规定。这个合同合法性是有待商榷。
从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
通俗的理解:而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。此时的“辱母案“是发生在动态博弈。高利贷借出方是先行行动者,公开对于欢母亲的折磨、侮辱、殴打........。后面发展到令人发指的程度。于欢母子是后行动者,后行动者是基于先行动者的行为作出最有利于自己的选择。
按照参与人,对其他参与人的了解程度,分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间等信息了解的不够准确、或者不是对所有参与人的特征、策略空间都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。“辱母案“中的双方当事人,可以看到是处于不完全信息博弈。
我们就简单运用作为双方当事人在法律上来讲,都是具有民事行为能力,是理性人(在博弈论下假设),会做出对自己最有利的选择。
1、局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。在“辱母案”中高利贷代表人杜志浩等11人、于欢母子都是第一批局中人。后期加入的警察、法院、社会公众不自觉加入局中人。
一审宣判,于欢,山东聊城人,因犯故意伤害罪,被山东聊城中级人民法院判处无期徒刑。从该案一审判决书中看到,于欢持刀故意伤害四人,致一人送医不治死亡,两人重伤,一人轻伤。
2、策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。
杜志浩等11人的策略:母子遭催债者下体侮辱、打耳光、要账17万。
于欢的策略:忍耐、报警、反抗。
警察的策略:观望。
3、得失:一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。现在,这盘棋下的有点大,参加博弈的局中人增多,包括你我,博弈各方的走向,组成一道多维函数题。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数。
杜志浩等11人的得失:致一人送医不治死亡,两人重伤,一人轻伤。
于欢的得失:中断对母亲的伤害,自己入狱判刑。
警察的得失:失职渎职行为,不作为的社会影响。
4、次序:各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。
杜志浩等11人伤害、侮辱、欺凌......。行动在先,于欢母子等人求助警察无果,选择反抗。
5、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。
均衡?:一人送医不治死亡,两人重伤,一人轻伤。出现刑事案件就是结果,警察出面行使权力。
03
我们再运用博弈论中的逆向归纳法(backward induction),来分析于欢的举动(或者决定),是否对他(从博弈论的角度)讲最有利的策略呢?大家可以换位思考下。
逆向归纳法(backward induction):它的精髓就是“向前展望,向后推理”,即首先仔细思考自己的决策可能引起的所有后续反应,以及后续反应的后续反应,直至博弈结束;然后从最后一步开始,逐步倒推,以此找出自己在每一步的最优选择。
我们用决策树风险于欢的行动,对博弈双方产生的效益。
从决策树看到,无论于欢反抗与否,报警与否,他和母亲得到的收益都是“0”,而对于高利贷者杜志浩等11人,他们在于欢选择“反抗报警”时收益为“1”,在于欢选择“反抗自卫”时收益为“0”。在于欢选择"不反抗"时杜志浩等11人收益为"1"。当于欢选择“反抗报警”时收益为“1”,于欢该如何选择?于欢就是这里的最后一阶段的参与人,我们运用逆向归纳法,来倒退于欢的举动(或者决定),是否是他(从博弈论的角度)最有利的策略呢?大家可以换位思考下。
04
在法律制度发展历程中,无处不在运用博弈论,公正是社会多元利益关系多次复杂博弈的相对均衡,并以法律制度的形式确立下来,法律制度的形成与实施实际上就是对这种博弈均衡的确认与保障,同时也只有法律的制定与实施才能既担任约束的功能,又帮助社会主体的利益博弈实现相对均衡。从而形成公正、公平、合法的法律制度。
古希腊“智者”卡里克利斯提出了差别对待的公正原则:“优者比劣者多得一些是公正的,强者比弱者多得一些也是公正的。”这样的法律制度是向优者倾斜的,何为优者?可能是有钱人、有权人、有恒产者......。这样的失衡制度下,不可能导致均衡,面临巨大的法律道德风险。
从“辱母案”中可看到,法律制度对社会公众的约束力,当双方当事人,其中一方选择法律制度赋予承诺强制约束力时,应该给予肯定,支持,而不是“你们要账可以,但是不能动手打人。”就撒手离开。
在社会人面临利益博弈时,相信都是理性人,自利的人。在利益博弈的选择上,如果失去合法制度的约束,会导致的利益博弈失去均衡。如果一个国家、社会没有一个公正、合法、强有力执行力,公正的法律制度、那法律制度就是一张遮羞布,形同虚设。导致跨越法律制度的行为成本低廉,导致的道德风险波及整个社会,引导着社会公众在利益博弈中的决策走向。
参考文献:
1、百度百科
2、MBA 智库.百科
3、耶鲁大学公开课-博弈论