在车站和旅游点这些人群流动性大的地方,不但商品和服务质量差,而且假货横行,因为在商家和顾客之间“没有下一次”——旅客因为商品质优价廉而再次光临的可能性微乎其微,因而正常情况下的理性选择是:一锤子买卖,不赚白不赚。
在公共汽车上,两个陌生人会为一个座位争吵,可如果他们相互认识,就会相互谦让。在社会联系紧密的人际关系中,人们普遍比较注意礼节和道德,因为他们需要长期交往,并且对未来的交往存在预期。
上面这两个例子说明,对未来的预期是影响我们行为的重要因素。一种是预期收益:我这样做,将来有什么好处;一种是预期风险:我这样做可能将来面临的问题。这都将影响个人的策略。
当下屡见不鲜的一夜情现象。更能说明这种预期对行为的影响。事实上,这个对局与经典的囚徒困境如出一辙:出轨的感情本来就是为了满足欲望而进行的冒险。上一章中两个盗窃犯的相互背叛,其原理也照样适用于“偷情”。素昧平生的一对男女,偶尔在旅游中相遇,接着在宾馆里春梦一场,天一亮就各自扬长而去,谁也不会忠于谁,彼此也不会为对方今后的不忠实而产生任何不快。其根本原因就在于这种一夜情,本身就是“一次性”的博弈。
可是,如果男女双方由此一见钟情,决定发展成为恋人的关系,那么他彼此的忠心就会有一定程度的增加。原因在于他们今后还要常常碰面,还有机会重复博弈。他们会像正常的恋人之间一样,在接下来的重复博弈中,有无数次的机会来对背叛行为做出惩罚。
这就是一夜情与爱情之间的区别。
现代博弈论的发展在上述问题上提供了更深入的解释:每一次人际交往其实都可以简化为两种基本选择:合作还是背叛。在人际交往中普遍存在囚徒困境:双方明知合作带来双赢,但理性的自私和信任的缺乏导致合作难以产生。而且,如果博弈是一次性的,那么这必然加剧双方进行坦白的决心,选择相互背叛。
在这样的博弈中,背叛是个人的理性选择。但却直接导致集体的非理性。似乎没有任何方法能够让我们逃脱两败俱伤的局面。难道人类注定要承受这个无法摆脱的噩梦吗?
答案是否定的。资深的博弈论专家罗伯特-奥曼在1959年指出,人与人的长期交往是避免短期冲突、走向协作的重要机制。拥有以色列和美国双重国籍的奥曼于1955年获美国麻省理工学院数学博士,当时正是博弈论方兴来艾之际,在以后50年的时间里,他一直在寻找避免囚徒困境式的纳什均衡的机制,实际上是从理论上探索协调人们利益冲突,增进社会福利的道路。
在任何博弈中,表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。这个原则的基础是下一步对于当前一步的影响足够大,即未来是重要的。总的来说,如果你认为今后将难以与对方相遇,或者你不太美心自己未来的利益,那么,你现在最好背叛,而不用担心未来的后果。
而现实生活中反复交往的人际关系,则是一种“不定次数的重复博弈”。奥曼通过自己的推导十分严密地证明,在较长的视野内,人与人交往关系的重复所造成的“低头不见抬头见”的关系,可以使自私的主体之间走向合作。
这可以解释许多商业行为。一次性的买卖往往发生在双方以后不再有买卖机会的时候,特点是尽量谋取暴利并且带欺骗性。而靠“熟客”、“回头客”便是通过薄利行为使得双方能继续合作下去。
事实上,重复博弈也更逼真地反映了日常人际关系。在重复博弈中,合作契约的长期性能够纠正人们短期行为的冲动。这在日常生活里是具有普遍性的。
我们已经知道,由于一次性博弈的大量存在,引发了很多不合作的行为。而且,即便是在重复博弈中,合作的一方在遭到对方背叛之后,往往没有机会也没有还手之力去进行报复。比如,资本积累阶段的违约行为,国家之间的核威慑。在这些情况下,要使交易能够进行,并且防止不合作行为,必须设置严格的惩罚背叛行为的机制。
有人曾经在网上提供了这样一个集体活动迟到的问题。
王老师是某班的班主任,他经常组织本班同学参加集体活动,比如郊游。但在组织的过程中。他遇到了一个棘手的问题。在一次集体活动中,王老师通知全班同学早上8:oo到校门口集合。结果有几个同学拖拖拉拉,导致大家8:15才出发,从而白白耽误了一刻钟。在此后的集体活动中,王老师改变了策略,虽然真实的集合时间仍是8:00,但是他通知大家7:45集合,结果最晚的几个同学也在8:00赶到,从而准时出发。王老师对自己的策略根满意。
但是好景不长。时间久了,同学们都发现了王老师通知的集合时间故意提前,甚至可以根据王老师的通知猜测出真实的集合时间。因此,每当王老师通知7:45集合时,大家仍然按照真实的集合时间,也就是8:00来做安排,从而导致几个同学在8:00后才赶来。而那些准时即7:45到达集合地点的同学都开始抱怨,进而也变得不那么守时了。王老师的目标是通知合适的集合时间。从而达到准时出发且避免同学因为等待而有所抱怨。那么应当制定怎样的策略。才能使活动准时开始并使大家都满意呢?
在这个问题中,存在着老师与学生、学生与学生之间的博弈。实际上也是一种多人的囚徒困境。因为每个学生都知道,其他学生的占优策略是选择到达集合地点的时间,既不能太早,以免白白浪费等待的时间;又不能太晚,以免承担耽误大家时间的责任。要破解这个困境,老师有两个策略选择:一是只要过了集合的时间,就不再等下去,让迟到的同学独自承担责任。这种责任和相应的惩罚对同学会造成很大的损失,他们就不会再迟到了。二是如果迟到的学生比较多。那么等某个数量的学生到齐以后马上出发,而让迟到时间过长的那些同学承担责任。
一般说来,博弈中双方合作时得益最大,但若一方不遵守合作约定,必定是另一方合作者吃亏。所以需要引入惩罚机制:谁违约,就要处罚他,使他不敢违约。一位玩家之所以会与另外一位合作,只是因为他知道,如果他今天被骗,明天还能对欺骗实施惩罚。奥曼先生把这一洞察结论称之为“无名氏定理”。
只有对迟到的学生进行惩罚,迟到问题才能解决,一句话,也就是实行一份带剑的契约。从囚徒困境中我们可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下定律:按照你希望别人对你的方式来对别人,但只有他们也按同样方式行事才行。