诈骗博弈论
苏洵在其名篇《六国论》中开篇点题,“六国破灭,非兵不利 ,战不善,弊在赂秦”。一冲当年刚读此文时还有些奇怪,既然赂秦而力亏,这么明显的破灭之道难道六国那些天纵之才都没有理性思考,都没有发现吗?但经过一冲仔细分析却发现,正是由于六国都经过理性思考,陷入了博弈论中的囚徒困境博弈模型,才选择了赂秦的策略。
囚徒困境是博弈论中最为人们耳熟能详的博弈模型。模型中囚徒甲乙被警方隔离审讯,被告知如果一人招供而另一人不招供,招供者无罪释放不招者被判十年徒刑;两人都招供各判五年徒刑,而都不招的话各判两年徒刑。此时甲会想,如果乙招了我不招供,我会被判十年,招了最坏坐牢五年;如果乙不招而我招了,我会被释放,而我不招的话乙一旦改主意,我被判十年的风险太大。因此甲的最优策略只能是招供,同理乙的最优策略也只能是招供,甲乙双方皆没有动力改变策略,最终结果是甲乙均招供。上文中的六国博弈与囚徒困境的模型相似。六国势弱,合众弱以攻强秦称为合纵,即六国联合起来抵抗强秦防止秦国对其的吞并。而事强秦以攻众弱称为连横,即秦国用一些好处拉拢一些弱国来进攻另一些弱国。从天下形势来看,六国好像都应选择合纵的策略,但事实并未如此。每个国家都注重本国利益而不是集体利益,都希望对方与强秦对抗而自身休养生息,当个体理性与集体理性冲突时六国均缺乏合作愿望。以魏、楚为例,魏、楚均选择合纵才能与秦匹敌,此时纵无收益也不至于损失,而一国连横一国合纵时,合纵者会损失巨大而连横者得些小利,其博弈矩阵如下:
楚 国
连横
合纵
魏
国
连横
-5,-5
1,-10
合纵
-10,1
0,0
这就形成了一个标准的囚徒困境模型,魏、楚两国会效仿上文甲乙囚徒的理性思考均选择连横策略。最终魏国没有在魏将吴起已占河西的情况下西伐关中,拼着损失兵力也要使秦退守陇西,而是贪图中原的利益迁都大梁;而楚国也没有执行合纵出兵攻秦,而是在张仪入楚许以小利时立即选择连横。
这时我们会发现无论是囚徒困境还是六国博弈,博弈参与者在理性思考后都选择了对其个体来讲的最优策略。按博弈论的说法,这是这个博弈模型唯一的纳什均衡点。除了这个均衡点,甲或乙单方面改变选择都只会得到更差的结果。比如囚徒困境中的两人如果都不招供,任何一人单方面改变选择都可以使对方加刑而自身减刑。因此博弈双方经过理性计算后最终都会选择纳什均衡点的策略。问题是这个纳什均衡点上的策略所带来的收益远不如双方均选择不招供所带来的收益。这说明在一个体系中可能每个个体的决策都是理性的,对于整个体系来说其结果未必是理性的,即个体理性并不能带来最优的收益。此时博弈参与者会郁闷的发现世界上有很多事情仅靠感性选择会出现错误,而理性选择时错误还是难以避免。现实生活中的骗子们正是根据各种博弈规律设计了各种骗局,引人入套。
首先从最古老的中奖诈骗谈起。即使这种骗局如此古老,但直到今日我们还经常可在媒体中看到此种骗局的报导。被骗者一般是通过短信、电话、邮件等方式得知自己中了几十万的大奖,与主办方电话联系后被告知领奖金需先缴纳3万元的个人所得税。待被骗者交完这所谓的所得税后,骗子又会以交纳保证金、手续费、加急费等等名义一次次的让被骗者交钱,而被骗者在反复考虑后往往是又一次次的转款,有些案子的被骗金额甚至比当初骗子许诺的大奖金额还多。类似这样的诈骗套路,在其他的各类场景中经常上演。例如招嫖诈骗中骗子一次次的骗取所谓的定金、车费、饭费、安全保证金;招工诈骗中骗子总是说再交最后一笔体检费或好处费,就可以当上日进万金的公关男或者接到重金求子的好差事;刷单诈骗中骗子总是说再刷一次就把前面的本金和提成全部还给你等等。这些骗局所涉及的博弈模型就是沉没成本谬误模型。
沉没成本是一个经济学上的概念,是指由于过去的决策已经发生了的,而不能由现在或将来的任何决策改变的成本。人们对某事选择策略时不仅看这件事对自己有没有收益,往往还会考虑过去已经在这件事上的投入,如时间、金钱、精力等等,这些已经发生的无法收回的投入或者损失就是沉没成本。作为一个拥有情感的人,你对损失的憎恶会让你迈入沉没成本的陷阱。损失憎恶是人类的一大动机。在你确定了一个损失之后,它就会在你的头脑中萦绕不去;在你再次想到它的时候,你会发现它比之前更加沉重。然而在决定未来时抱住过去不放,你必将面临沉没成本谬误危险。但本文讲的不是感性选择的影响,而是讲即便抛除这种影响而理性思考,你会发现这种谬误还是很难避免。
以上文的中奖诈骗为例,甲方有行骗和不行骗两种情况,而乙方则有相信和不相信两种策略选择。假设甲方第一次索要的收益为5,第二次索要的收益为3,当乙方面临第二次索要时若甲方行骗则损失为8,若甲方不是骗子则两次投入等价交换没有损失,而乙方不再相信甲方时第一次支付的5为沉没成本。此时博弈矩阵如下:
乙 方
相信(p)
不信(1-p)
甲方
行骗
8,-8
5,-5
不骗
0,0
5,-5
这实际上是一个单人博弈的矩阵,或者说是一个决策。参与策略选择的仅仅是乙方,而甲方并不参与选择策略,而是固定拥有了一个虽然不确定但并不变化的策略。此时这个矩阵是没有纯策略纳什均衡点的,乙方选择策略需要使用概率进行分析。博弈论中可以选择出具体行动的纳什均衡叫纯策略纳什均衡博弈,而采取策略空间上的概率分布的纳什均衡叫混合策略博弈。纳什在1950年证明了以其名字命名的纳什定理:在一个有n个博弈方的博弈G={S1,…,Sn:u1,…,un}中,如果n是有限的,且Si 都是有限集(对i=1,…,n),则该博弈至少存在一个纳什均衡,但可能包含混合策略。也就是告诉大家,任何一个博弈中都存在纳什均衡,或者简单的讲就是博弈是一定有解的。
上文的博弈无法得到纯策略纳什均衡点,但根据纳什定理我们一定可以得到混合策略均衡点。假设乙方相信甲方的概率为p,则乙方不相信甲方的概率为1-p,那么当乙方选择相信甲方与不相信甲方的期望值相等时,该博弈达到混合策略均衡。
则 -8p = -5(1-p)-5(1-p)
p = 10/18 = 55.6%
p大于50%,所以此时乙方经过理性思考后,还是倾向于相信甲方,当然若甲方是骗子的话,乙方仍会一次次的被骗。什么时候乙方会不再倾向于相信甲方呢?我们可以假设甲方第一次索要的收益为5,第二次索要的收益增加到5,则博弈矩阵如下:
乙 方
相信(p)
不信(1-p)
甲方
行骗
10,-10
5,-5
不骗
0,0
5,-5
当该博弈达到混合策略均衡时:
-10p = -5(1-p)-5(1-p)
p = 10/20 = 50%
此时乙方将面对一个无法选择的逻辑陷阱,像“布里丹的驴”这个寓言故事中的毛驴一样找不到选择的理由。但当我们进一步加大第二次索要收益的数值,即增加乙方的边际成本时,p就会小于50%,乙方就会倾向于不再相信甲方。反过来说,对于沉没成本谬误的博弈模型,只要策略选择方的边际成本小于沉没成本,策略选择方即使进行理性思考,还是会倾向于相信骗子,导致又一次被骗。所以上文那些骗局中的骗子在行骗时都会仔细斟酌第二次索要收益的金额,避免超过被骗者的沉没成本而惊醒被骗者。当然也有一些被骗者在骗子索要的金额大于沉没成本时仍然选择汇款,那导致其被骗的原因就主要是上文提到的对损失的憎恶之类的感性原因。
另一类仅靠感性选择会出现错误,而理性选择错误还是难以避免的骗局是金融诈骗。与中奖诈骗相比金融诈骗的起源更为古老,而且一脉相传,时至今日更是愈演愈烈。18世纪英国的南海公司对外宣称能够获得巨大利润,给予投资人巨额回报,使社会各界人士踊跃购买其股票,上至国王议员下至贩夫走卒,甚至科学家牛顿都参与其中。短时间内公司股价上涨近10倍,股价与南海公司的实际经营情况完全脱节,最终股价泡沫破灭投资者损失惨重,牛顿亦悲叹“呜呼星辰轨迹易知,而人心难测”。20世纪美国的骗子大王麦道夫用二十年如一日超级稳定的高回报率吸引了大量投资人,更因其纳斯达克主席的身份使得被骗的对象都是银行、保险公司、对冲基金等专业机构,诈骗金额达500亿美元。时至今日的中国随着互联网思维的普及和互联网金融的飞速发展,P2P、网络众筹、ICO、贵金属交易、网络传销等各种合规的、不合规的、擦边球的金融产品以互联网创新的名义泥沙俱下,E租宝、中晋、泛亚、MMM、钱宝等骗局均在短时间内就为害一方,甚至骗遍神州。
对比上述一脉相承的金融诈骗,可以看出相互之间还是有些差异。南海公司只是对外宣传与公司的经营情况不符,使资产陡然上升并让人们产生该资产还会上升的预期,吸引了更多的参与者并将资产价格推向与其实际情况完全脱节的境地。当价格达到临界点时人们的预期会逆转,资产的价格又会暴跌。这实际上只算是一种资产泡沫,当资产陡然上升时所有投资者共同推动整个系统按照正反馈的方式自动运行,最开始策划的骗子也无法控制系统运行方向,直至泡沫破灭资产回归本来价值。而后来的麦道夫和E租金宝们则算是狭义上的庞氏骗局。骗子们一开始就没有任何经营和投资活动,只是利用高回报率吸引后参与的投资者的本金,用其支付先参与者的收益,骗子在崩盘前随时可择机携款潜逃。之所以说这些骗局是一脉相传,是因为不论资产泡沫还是狭义庞氏骗局,都有一个共同的特点,即先入局参与者并不是看好资产本身的价值,而是希望后入局参与者的新入资金推高资产的价格或维持骗局的运转而产生收益。凡是具有此特点的博弈可以将其看作广义庞氏骗局博弈进行研究。
广义庞氏骗局运行至一定阶段后一定会崩盘。对泡沫资产来说,即使每次都能找到愿意用更高价钱接手的下家,泡沫也不会无限增大。因为理论上只有货币发行量可以无限增大时资产才会随之无限增值,泡沫才可继续维持。但是货币的发行总量总是有限的,否则会引起严重的通货膨胀,所以泡沫资产的破裂是必然的。对狭义旁氏骗局来说,由于根本没有实质投资经营活动,投资者的高额投资回报只能由后加入投资者的本金来支付,一旦后参与者的资金不足以支付先参与者的投资回报,或者有一定数量的参与者要求取回本金,骗局自然土崩瓦解。
让广义庞氏骗局博弈中的每个参与者都有信心会有后来者接盘的感性原因是心理学上的羊群效应。人在不确定条件下进行决策时会倾向于模仿他人决策或过度依赖舆论,而不去自己思考,好似一群散乱的羊群中一旦有一只头羊动起来,其他的羊就会一哄而上全然不顾前方到底是羊村还是灰太狼。而像上文提到的中奖诈骗一样,即便抛除这种感性选择的影响而自己理性思考,这种一哄而上的情况还是会发生。
假设资本市场上只有一家上市公司,只有甲、乙、丙三个投资人的投资行为会影响股价,投资规则为多数人买股票则股价上涨,多数人卖股票则股价下跌。甲、乙、丙三人理性思考后再买卖股票,那么当三人都买股票时股价会上涨三人收益都为5;而只有两人买股票时股价还是会上涨,买家收益为5而卖者无收益;只有一人买股票时股价会下跌,则买者无收益而卖者收益为5,此时博弈的矩阵如下:
乙
买
卖
丙
买
卖
甲
买
5,5,5
5,0,5
5,5,0
0,5,5
卖
0,5,5
5,5,0
5,0,5
5,5,5
以上博弈矩阵的纳什均衡解为“买,买,买”和“卖,卖,卖”,将这个结论推广到多人的情况就是大家一哄而上的买股票或者清仓离场。我们又遇到了无论感性选择还是理性思考均会入局的情况。对已经入局的博弈参与者来说,即使想到将来会出现崩盘的情况,但根据上文博弈矩阵的思考会相信一定会有其他的参与者选择与其一样的策略,也就是说会有后来的参与者入局。此时博弈的参与者实际上对骗局是清醒认知的,即泡沫资产的投资者是知道投资的资产与本来价值不符的,而狭义庞氏骗局的被害者在入局时也很可能已经知道设局者没有任何经营投资活动,但他们均认为会有后来的参与者会为此买单,自信自己可以全身而退。而骗子们为了获取源源不断的后续资金维持骗局存续,往往采取传销的方式不断发展下线,让参与者自发的拉来更多的参与者。对此种情况有一句话可以用来形容金融诈骗骗局中的每个人:面对雪崩的时候,没有一片雪花是无辜的。
而雪崩一旦开始就很难停止,即骗局的参与者很难摆脱骗局。此时即便有的参与者是理性的不再推动骗局运行,但他不知道其他参与者是否理性;即便知道其他参与者是理性的,也不知道其他参与者是否知道自己是理性的,这个知道需要无数次循环下去,彼此映照才能达到共同理性。所以即使体系中的每个参与者都是理性的,但其对于博弈的其他参与者有着不同的理性程度的预期,导致后加入的参与者越来越多直至系统崩盘,又一次出现了个体理性并不能带来最优的收益的情况。
从以上分析我们会看到一个群体的数量越大,在没有外部约束的情况下采取一致行动的可能性越小。此规律不但使参与者很难摆脱骗局,甚至为金融诈骗的侦查打击也带来了困扰。金融诈骗尤其是一些宣称高额回报的集资诈骗一般是涉众案件,参与人员众多且分布在各地。在骗局没有崩盘之前出于多种考虑侦查机关介入都会颇为慎重。而程序法出于启动案件方便的本意,设置了较为宽泛的管辖规定,同时规定了“都有管辖权时,谁先受理谁管辖”的原则,于是各地对成为先受理的机关就会更为慎重。假设一起金融诈骗案件横跨五个城市,每个城市侦查机关分别有受案和等他人受案两种策略。如果受案并解决问题所得的收益为7,而等他人受案本方消耗资源更少同样也可解决问题,此时的收益更大为10,双方均不受案则问题没有得到解决,收益为0。取两个城市的博弈矩阵如下:
乙 地
他人受案p
受案1-p
甲
地
他人受案p
0,0
10,7
受案1-p
7,10
7,7
假设每个城市等他人受案的概率为p,对于其中一个城市来说其他四个城市等他人受案的概率为p4,其他四个城市中至少有一个城市受案的概率是1-p4 ,当五个城市处于混合策略均衡状态时,受案与等他人受案的期望值相同。
则 7p + 7(1-p)=10(1-p4)
p = 0.74
也就是说如果该金融诈骗案件横跨五个城市,每个城市坐等其他城市受案的概率高达74%。如果案件横跨九个城市,用同样的计算方法每个城市坐等其他城市受案的概率高达86%。所以现实中经常会出现金融诈骗案件涉及的人员越多,跨地域越大,侦查机关受理启动侦查的进度越慢的情况。博弈规律作用的范围是普适的。
再从骗局的操作手法上看,骗子们的手法也是符合博弈论规律的。如果我们对当前信息诈骗的作案手法进行逐个分析,会发现有相当一部分群发诈骗信息的内容相当粗糙,即不符合社会常识,逻辑上又漏洞百出。比如说当年的民族资产解冻骗局,声称参与者只要交10元钱就能去北京鸟巢参加慈善富民大会,领取5万元慈善金;还有的骗子自称是世界上27个皇族家族成员,服过长生不老药已近300岁,掌握大清皇家大量资产可以帮助你投资理财;还有当年颇为流行的美貌少妇的富豪丈夫不育,重金求子的骗局,行骗的借口都十分荒谬。但这些骗局的收益居然都还不错,民族资产解冻骗局的骗局当天全国有大量的被骗老人进京欲参会,而那个自称大清皇家的骗子一笔就骗了4000万元理财款,重金求子的被骗者更是数不胜数。你也许会想为什么骗子们不能把行骗的故事编的再合理一些呢,岂不是会收益更多?实际上骗子的做法是经过了博弈后选择的均衡点上的策略。
在群发诈骗信息的前提下,骗子在设计骗局时会有设置高明骗局和低劣骗局两种策略选择,每种策略投入的成本不同且带来的收益也不相同。当骗子选择高明骗局策略时他需要付出更多的劳动来精心编排,设计各种细节使骗局看起来真实可靠、没有破绽。可此时此骗局就会吸引太多的人来打听,如果跟来每个来打听的人一对一联系起来,就需要雇用更多的人力、消耗更多的物力(钓鱼网站、非实名银行卡电话卡、虚假身份等等),承担更多的风险成本。但如今人们普遍警惕性很高,能上当的人的比例少之又少,大部分人会在打听过后发觉真相避免被骗,此时骗子就白白投入了,即该策略的成本高而收益却未必高。而当骗子选择低劣骗局策略时,基本只有少数警惕性很低的人才会被吸引,骗子花费的人力、物力成本会较低。而由于此时的联系者均是被低劣骗局筛选出来的警惕性很低的人,大部分人最终会被骗交钱,即该策略的成本低而收益却未必低。所以选择低劣骗局的策略就是该博弈的优势策略均衡,骗子们在群发诈骗信息时自然都会选择荒谬离谱的内容。
从上述内容可以看出,博弈论的规律作用于骗局始终,使被骗者在策略选择时出现个体理性与集体理性矛盾的纳什均衡结果,遇到个体理性并不能带来最优收益并导致被骗的情况。而博弈参与者的应对措施就需要借助于承诺行动产生可置信威胁来改变博弈的均衡点,实现个体理性与最优收益的统一。以上文所说的囚徒困境为例,甲在被抓之前给乙吃了只有甲能解的毒药,并告诉乙若招供将得不到解药,这就是一个可置信威胁。这个威胁降低了乙招供的收益,进而改变了整个博弈的纳什均衡点,最终实现个体理性与最优收益的统一。但应注意只有可置信威胁才能改变博弈的均衡点,不可置信的威胁是不起作用的。
以网上的侵权事件为例,许多权利所有人会在网上注明“本人已委托某维权机构为我进行维权行动 ”,而不是注明“知识产权系本人所有,侵权必究”。因为后者的威胁实际上是不可置信的。当权利所有人面对侵权请维权机构的成本为6,自身的精力成本为4,则其维权决策的收益为-10(维权经常不成功)。而选择不维权决策,其知识产权损失的收益仅为-5,那么他理性思考后就不会选择维权的策略,此时“知识产权系本人所有,侵权必究”的威胁就是不可置信的。但是如果威胁变为“本人已委托某维权机构为我进行维权行动 ”,也就是权利所有者已经预付维权机构费用为6,这个威胁就成为可置信威胁。因为他已经支付了维权机构费用6,再坐任知识产权损失5,不维权的策略的收益就达到-11,小于维权策略的收益-10,此时权利所有者理性思考后就一定会选择维权的策略。此威胁即为可置信威胁,改变了博弈的均衡点,会使侵权者像囚徒乙一样最终选择不侵权的决策。这样的例子在骗局博弈中也有发生。2018年年初,山东省费县公安局接到属地居民曹某报案,其被人以货物丢失索要验证码的方式诈骗资金5万6千元。侦查员接案后以受害人身份与骗子周旋,以家庭贫困无法生活,欲仿效徐玉玉案服毒自杀造成影响,使骗子收到重罪追究为由多次交涉。当骗子收到被害者人通过微信发送的毒药瓶照片的可置信威胁后,于次日10时选择了退回赃款的策略,将诈骗资金全部退回被害人账户。
可惜的是博弈论的规律是平等作用于每个博弈参与者的,而在运用博弈规律这方面侵权者和骗子们要远远比被害人有经验。还是以网络侵权事件为例。2017年网游贪玩蓝月的推广是现象级的,张家辉、陈小春、古天乐等对游戏市场有号召力的明星几乎一夜之间全被签下来,这对游戏公司来说几乎是不可能的。因为代言人谈判是个复杂的商务运作,贪玩蓝月不可能有这样大的团队这么短的事件内和每个明星的经纪人对接。贪玩蓝月的做法是不与明星接触就先把明星的头像PS到广告上进行宣传,此时明星还未发出威胁但其肖像权损失的收益已经为-5。当明星因被侵权找上门后公司会说,如果明星接受肖像代言公司不需要明星做任何事并马上付费为4,不接受代言明星就得付出成本为4打维权官司。此时代言的决策收益为-5+4=-1,虽有不甘但总好过不代言的收益-5-4=-9(维权官司赢了也很难得到赔偿),明星们只好选择代言的决策。同样在骗局博弈中一般都是骗子们先下手发出威胁。不论是孩子被车撞了在医院抢救需要押金,还是账户内资金刚被人盗转需要配合风控人员查验,这样的威胁不仅在感性方面让被害陷入恐慌失去理智,在理性层面也会让被害人不得不选择骗子们为其预设好的陷阱策略。分析一下骗子们的威胁,无论是孩子抢救还是巨款被盗,其损失的成本要远高于听信威胁损失的成本,只要被害人认为收到的信息有可能置信,就一定会选择宁可信其有的策略。
博弈论发明之初是为了解决经济学问题的。但很快人们就发现其是研究人类活动行为的有力工具,可应用于社会各个领域,在政治学、社会学、法学、生物学等多个学科都发挥了重要作用。本文就提到了不少博弈论在诈骗活动中的应用。祝愿大家能够理性的审视理性本身,掌握博弈规律的方法论,在同骗子的博弈中选择正确的策略。