合作是成功的最优策略

合作是成功的最优策略_第1张图片
一次博弈的囚徒困境

商人做生意目的为赚钱,这当然是天经地义的。俗话说,无奸不商,人们对商人的印象经常是奸诈狡猾,唯利是图,甚至有的商人为了牟利不择手段,干尽伤天害理之事——这是一个经典的电影桥段。

然而事实却经常与电影桥段背道而驰,现实里正直守信的人获得的成功更多也更大,奸商反而被淘汰。36氪上有篇文章提到了这一现象:

著名风险投资人Paul Graham在自己的博客中说,目前硅谷出现了一个明显的趋势,那就是那些最为成功的投资人也是品格最为正直的人。他将此归因于创业圈更加的透明化和不确定性。如果一个投资人对创业者不友好,他的坏名声很快会在创业圈传开,他只会接触到越来越少的项目。……这就使得投资人必须以诚相待,善意正直。

这不是硅谷的独有现象(我朝不算啊)。早前美国第二大连锁药房CVS主动停止销售香烟产品,年损失销售额超过20亿美元。要知道,这20亿美元可不是小数目,况且竞争对手也在卖烟,CVS却选择主动放弃这不赚白不赚的生意。背后逻辑是什么?

人普遍具有趋利本性,商业竞争也是一种博弈,博弈双方都意图使自己的利益最大化,这不但无可厚非,而且还是经济发展最主要的驱动力。然而问题是,究竟是什么原因让友善的人经过长期博弈最终赢了小人呢?我想说的不是一个道德伦理问题,而是一个博弈策略的问题。

犯罪电影里经常有这样的桥段:两个嫌疑犯同时被抓,分开审问,如果招供充当污点证人可获减刑。两个嫌疑犯都有招供的动机,然而都担心招供后可能会被黑帮报复而保持沉默。他们之间的博弈不是一次性的,还涉及到出狱之后可能面临对方报复,这就是著名的“重复囚徒困境”。

20世纪80年代初,博弈论学者阿克塞尔罗德设计进行了著名的“重复囚徒困境”实验。实验中,他邀请了世界各地的博弈论学者用电脑程序的形式提交博弈策略,这些策略两两结对博弈,反复进行150轮,按照最后的总得分为博弈策略排名次。结果是具有“善良性、报复性、宽容性、清晰性”的『一报还一报策略』胜出。而那些“非善良性”策略虽然最初看起来很有希望,但长期下去仍然不具有成长性。

当你需要与对方长期合作时,这就不是一锤子买卖,而是一种重复的博弈,会考虑到对方的信誉和今后合作的可能性,因此这类博弈和一次性博弈有很大不同。博弈双方基于自身利益而选择友善合作,最终达到双方利益都最大化就成为可能,从而化解了一次博弈的囚徒困境。欺骗的动机这时可能被惩罚的威胁所克服,从而导向一个合作的结果。在“抽烟危害健康”深入人心的美国社会,CVS主动放弃烟草销售,虽然面临短期年销售额20亿美元的损失,但也因勇于承担社会责任,赢得消费者青睐,在未来的新业务上可能会带来更大的价值。

即,在长期重复进行的博弈中,即使对利己主义者来说,合作也是理性的,选择友善合作对自己是最优解,对整体也是最优解,从而达到帕累托最优。

生活中这样的例子有很多,比如买东西,去连锁店要比去流动摊点更可靠。因为连锁店靠用户将来的频繁重复购买获得最大利益,这是一种重复博弈,选择友善合作是最优策略。而旅游景点/流动摊贩/火车站附近的商家,往往采取“一次性博弈”,因为顾客来自外地,很少有回头客。坑蒙拐骗,是他们获得最大利润的最优策略。

上面这两个例子可以看出,长期的相互关系是合作产生和稳定的重要因素。当双方仅仅是临时关系时,就像旅游景点的商家和旅游者之间那样,几乎不存在未来的相互关系,这种情况下的合作很难产生。当一个品牌开始走下坡路时,当一个人准备离职去另一个城市时,不合作的机会主义行为最容易发生,品牌与自己的客户,公司与员工之间的关系就会变得脆弱不堪。所以很多公司规定离职需提前一个月申请,还是很有道理的,可以提前监督,预防离职者走之前做出出格的事。

令人感到欣慰的是,现实生活里大多数关系是重复博弈,相互关系是持续而频繁的,也确实到处充满了合作行为。那些友善合作的人,不一定每次都能得到最大利益,但长远来看,他们确实是无数次博弈真正的赢家。

阿克塞尔罗德的实验还有一个让人乐观的结论:

“在一个非零和的世界里,为了你自己做得好,你没有必要非得比对方做得好。特别当你要和许多不同的对手打交道时更是这样。只要你自己能做得更好就能让他们每个人做得和你一样或略好些。没有理由去嫉妒对方的成功。因为在长时间的“重复囚徒困境”中,其他人的成功是你自己成功的前提。”

你可能感兴趣的:(合作是成功的最优策略)