本文摘自《算法交易员:会赚钱的人工智能》
1961 年某个炎热的夜晚,美国拉斯维加斯赌场里有个男人正在玩“21点”,他的身后围着数十名看客。虽然这个男人已经淡定地玩了整整 6 小时,但从他戴着的大黑框眼镜和淋漓的汗水中还是可以一眼看出,他并不是一个专业的赌徒。看客们在赌他还可以坚持几局。大部分人都认为这个人坚持不了多久,马上就要倾家荡产了。因为他怎么看都像是个赌场新人,在对自己特别不利的情况下也不收手,反而继续抓牌,却在旁人看来很有利的情况下犹犹豫豫。邻座一直观察他的人们讥笑着开始了游戏。无数玩家败下阵来离开了座位,他却依然坚守着阵地,一次次眼看着陷入绝境、马上就要倾家荡产,却又一次次绝处逢生。围观的人们一边饶有趣味地议论着这个男人的运气极好,一边关注他的战况。然而,庄家始终觉得这个男人有些不同寻常,因为每当庄家觉得自己马上就要赢的时候,这个男人都能扭转乾坤,好像总有幸运女神眷顾着他似的。玩了 9 小时以后,这个男人终于站起身来,他只输了 8 美元。男人一边小声地自言自语“系统测试结束了”,一边离开了赌场。诸多看客向这个体力与运气都极好的男人报以掌声,只有庄家像丢了魂似地一动不动,呆呆地看着男人远去的背影。这个男人就是“宽客教父”—— 20 世纪中期的顶尖投资者爱德华·索普。从他开始,一场给后代宽客们留下深远影响的算法战争拉开了序幕。
索普于 1932 年出生在一个贫穷的复员军人之家。他的父亲虽在银行从事保安工作,但在当时持续的经济大萧条影响下,家境很是惨淡。在这种环境中长大的索普早早地就接触到了金融方面的知识,并养成了节俭的习惯。他很小的时候就学会了如何赚钱:花 5 美分买来果汁粉并冲泡成 6 杯果汁,每杯按 1 美分的价格卖出去就能盈利。他这么做时才只有 10 岁。由于好胜心很强又喜欢玩游戏,索普还常常和加油站的大叔、超市的收银大妈打赌。还有一次,他和杂货店老板打赌看谁算账更快,他心算,杂货店老板用计算器算。结果索普取胜,赢得了一个冰淇淋蛋卷。
索普对那些能够解释各种日常现象的物理学和化学知识特别感兴趣。他曾在车库里用收集来的化学材料做过爆炸试验,还曾经把各种电子设备连接起来制造秘密通信装置。他学习物理时,用学到的理论知识解释生活中的各种现象并进行实验,很是痴迷。高中时的一天,老师说:“在赌场里是绝对不可能赢到钱的,你们千万不能染上赌博的坏习惯。”一向争强好胜的索普心想,赌场的游戏也不过就是游戏而已,肯定有赢钱的办法。他认为,比如对于“轮盘赌”,可以计算小球的运动从而得出小球落下概率最大的数字,在相应数字上下注即可取胜。但是,当时他们家如此贫困,根本不可能用成本高昂的“轮盘赌”来做实验。最终,索普只得把对赌场的热情抛诸脑后。后来,他在物理学竞赛中获得一等奖,拿到了加利福尼亚大学洛杉矶分校的全额奖学金并进入该校学习。
进入大学后的索普也没有放弃“轮盘赌”实验的想法。他只有奖学金而没有其他收入,生活并不宽裕,于是开始考虑寻找各种可以挣钱的副业。对于争强好胜的索普来说,赌博无疑是最好的选择。他常常和同学们探讨是否可以在博彩、竞马、扑克、围棋等世界各大赌博游戏中挑选一种胜率较大的来赌。同学们大多认为“轮盘赌”是最难赢的游戏,因为轮盘中既有数字 1~36,还有 0、00 这种既不是单数也不是双数,既不属于黑色区域也不属于红色区域的特殊数字。因此,下单数的注时,最后小球落在单数区域的概率不是50%,而是 49%;下双数的注时,最后小球落在双数区域的概率也不是 50%,而是 49%。同理,下黑色区域的注时,最后小球落在该区域的概率依然不是50%,而是 49%。也就是说,由于始终缺少 1%,长此以往,玩家必输无疑。当然,如果轮盘制作上存在缺陷,使得小球更容易落在某一数字的话,玩家也可以利用这一缺陷提高胜率。但是,拉斯维加斯赌场内的轮盘制作极其精巧,落在任何一个数字上的概率都是随机的,几乎不可能预测小球会落到哪个数字。
不过,索普可并不这么想。物理学家不就是计算轮盘之类圆周运动的专家吗?想要计算小球在制作精良的轮盘上的运动轨迹,只需知道它的初始位置和运动速度,利用高中物理知识就可以计算出来。在“轮盘赌”中,庄家转动小球之后的一段时间里,玩家依然可以持续下注。因此,只要知道小球的初始位置和运动速度,就可以计算出玩家应该下注的位置。索普马上就将想法付诸实验。他花 300 美元买了一台廉价轮盘,又借了台高速相机,拍下了小球转动的瞬间。测得小球的初始位置与运动速度后,得出了其下落位置的概率分布图。实验似乎进行得很顺利,他对小球的初始位置和运动速度、轮盘摩擦系数等建模,用公式表示它们之间的关系。身为物理专业的学生,将某一现象用公式表示出来,对他来说是一件再寻常不过的事情了。但是,最终有两个问题击败了他。第一,廉价轮盘做工过于粗糙,精度太低,导致实验结果很不稳定。轮盘的某些部分很粗糙、摩擦力大,某些部分又很光滑;轮盘表面不平整,小球偶尔还会蹦出来。可是购买一台赌场里用的精巧轮盘需要大约 1000 美元,这是索普两个多月的生活费,他买不起。第二,要想在赌场直接计算小球的初始位置、运动速度、下落的位置,需要一台小型计算机和识别装置,但是这样的装备又贵又不实用。索普只能无奈放弃了对“轮盘赌”的研究,决心攻读博士课程。
一心想着尽早毕业赚钱的索普选择了必修课相对较少的数学专业。在攻读博士学位期间,他对胜负和概率的热情丝毫没有减少。1958 年,索普即将博士毕业之际,得到了去美国麻省理工学院担任 CLE 摩尔讲座教授的机会,这对应届博士生来说可是一个至高无上的荣耀。博弈论创始人、电影《美丽心灵》男主角的原型——约翰·纳什也曾是摩尔讲座教授。在索普博士毕业那一年,他偶然得到了一本期刊。这是美国统计学会会刊,上面刊载了美国陆军总部数学家罗杰·鲍德温的论文《“21 点”的最佳策略》,即如何运用统计分析的方法在“21 点”游戏中获胜。这引起了索普的极大兴趣。与结果随机的“轮盘赌”不同,在“21 点”中,玩家可以采取多种策略提高胜率。
“21 点”的游戏规则很简单:玩家想要几张牌就抽几张牌,最后牌面数字总和更接近 21 的一方获胜,但总和超过 21 则为输。总和计算规则为:牌面是数字的按对应的数字相加,J、Q、K 视为数字 10,A 可以视为数字 1 或11。虽然还有一些附加规则,但该游戏的基本规则就是这些。玩家手中的牌面数字之和如果不到 21,可以继续要牌;庄家的牌面数字之和如果不到 16,则必须继续要牌;庄家牌面数字之和若达到 17 点以上,则不能继续要牌。玩家通过比较自己与庄家已持的牌来决定是否继续要牌,输了需上交赌注,赢了则可以获得双倍赌注。
人们之前一直认为,即使玩家把握得当,“21 点”游戏的胜率也仅为 45% 左右。由于胜率小于 50%,所以这个游戏对玩家不利,久赌必输,甚至会倾家荡产。虽然关于“21 点”的游戏策略多种多样,但是扑克牌可以构成无数排列组合,几千万种情况的存在对于人脑来说根本就是天文数字。然而随着计算机的出现,完成概率运算成为可能。美国陆军的数学家们耗时 18 个月,运用计算机计算了“21 点”游戏中可能出现的各种情况的概率,并撰写了论文。比如说,现在我的牌面之和为 16,庄家的牌面之和为 9,如果我继续要牌,则赢的概率为 52.1%;如果停止要牌,则赢的概率为 46.1%。也就是说,继续要牌时赢的概率更大。根据该论文的研究结果,这一游戏的最终获胜概率为 49.4%,是所有赌场游戏中获胜概率最接近 50% 的。尽管还不到 50%,看起来依然对玩家不利,但如果玩家运气好,这其实是最容易赢钱的游戏。
索普读完这篇论文后激动得不能自已。他想,如果这些策略是可行的,那么只需再深入研究,应该就能得出胜率超过 50% 的算法。他想在去美国麻省理工学院任职之前,先对鲍德温的论文进行实验,于是随即整理好行囊奔往拉斯维加斯赌场。索普把鲍德温的论文内容整理成表格贴在手上带进赌场,因为赌场里很多人都会在手心贴上神的启示或者护身符之类的东西,所以庄家对此并不在意。最终,索普在连续奋战了 9 小时之后,只输掉了 100美元赌注中的 8 美元。他用亲身经历证实了鲍德温论文所述策略的有效性。
在亲自实践鲍德温论文策略的同时,索普也发现了问题。鲍德温的策略是以“每次都发 52 张牌”的条件计算概率的,然而在实际的赌局中,由于庄家不会每一轮结束后就立即洗牌,所以随着已发出的牌和剩余牌的变化,概率也会发生变化。比如,这一轮已经发出了 3 个 A,那么下一轮发出 A 的概率就会急剧减少;如果这一轮发出了 4 个 A,那么接下来发出 A 的概率则为 0%。也就是说,你可以通过观察已发出的牌来判断对自己有利的情况并下注。这就是电影《决胜 21 点》中著名的“高低算牌法”。
索普入职麻省理工学院之后,仍然坚持不解地研究“21 点”游戏。他使用麻省理工学院计量中心内的 IBM-704 计算机与 Fortran 编程语言进行计算,并致函鲍德温,询问能否得到后者的计算数据原稿。不久之后,鲍德温就把写满自己和同事们的运算结果的草稿寄给了索普,这些草稿足足装满了一个纸箱。有了这些原稿的帮助,索普正式开始计算“21 点”游戏中各情形的胜率。但是,仅以 52 张牌为前提的情况下就已经有数百万种排列组合,再考虑已经出了几张牌的所有情况的话,排列组合将达到数十亿种,根本无法一一计算其概率。通过仔细观察各种情形下的概率规律,索普得出了这样的结论:数字为 5 的牌是决定游戏胜负的关键。5 越多,对庄家越有利,反之则对玩家越有利。就此,索普研究出了战胜赌场的策略,设计出自己的算法。
索普的第一个算法“数 5”(5-Counting)非常简单。看桌上剩余未发的纸牌中纸牌 5 的数量,如果占比大于 1/13,就下小额赌注;如果小于 1/13,就下大额赌注。如果 5 都已经发完,则玩家的获胜概率高达 53.6%,可以下大赌注。
索普的特别之处就在于,他并不只是通过判断该游戏对玩家有利或不利来下注,而是将每一种情况的胜率都精确地计算出来,确认玩家的胜率能达到何种程度,然后才下注。纸牌 5 的数量占比小于 1/13 时,5 越少对玩家越有利,下注金额就可以越大。他还开发出了在不同情况下仍然可以迅速计算胜率的方法。事实上,在这之前,人们有过许许多多关于“21 点”游戏算法的理论,但是在瞬息万变而且禁止使用机器计算的赌场中,那些理论最终都难以得到实际运用。因此,索普这种可以简便计算胜率的方法无疑具有划时代意义。
利用索普的算法,人们可以迅速计算胜率,根据桌上剩余牌的情况,在某些赌局中,玩家甚至可以比庄家的胜率多出 20%。利用他的算法,玩家在赌局中对庄家可以平均拥有约 1.2% 的优势,即胜率为 51.2%。索普很想立刻将这一理论付诸实践,可他面临着几个难题。首先,索普的经济情况并不好,家庭条件困难,实验室的薪水也不高。即便能筹集到资金,也会由于算法当时还不够完善,无法找出精确的下注方法。假设现在游戏的胜率为 55%,你手里有 100 美元,那么能因为游戏胜率大就把所有的钱都一次性押进去吗?这其中仍然有 45% 的败率,一旦输了就血本无归。那么,将钱平分为10 美元,分 10 次下注呢?如果 10 次都输,结果还是一无所获;就算能赢 9次,由于每次的下注金额都是 10 美元,赌资没有任何变化,也会导致错过能赢更多钱的机会。这种方法的效率十分低下。如果精准地按照胜率下注,最后虽不会破产,但是需要坚持玩很久才行。为了解决这样的资金难题和下注问题,索普决心去拜访麻省理工学院数学系的大师——克劳德·香农 教授。
索普在去拜访香农教授之前的一个月,开始每天对着镜子练习如何简洁陈述自己的想法。曾任职于贝尔实验室的香农教授是一个天才人物,他提出的两种理论被誉为“20 世纪最伟大的进步”:一是提出了“位”“字节”等信息的基础单位,为计算机的问世做出了巨大贡献;二是提出了信息论,将数字概念用数学方式整理出来,让通信变为可能。香农的信息论对我们使用的互联网、MP3、手机的发展以及对人类感知的研究等方面都产生了巨大的影响。香农还是世界上首个制造国际象棋人工智能的人,尽管最终并没有成功。索普拜访香农教授一方面是想听听他的建议,另一方面也是想请他帮助自己将论文发表在美国数学协会期刊上。香农教授当时是麻省理工学院唯一的美国数学协会会员,而向该协会投稿必须有会员的推荐。香农教授的秘书告诉索普,教授太忙了,只能安排 15 分钟的会面。有传闻说,香农教授如果听到自己不感兴趣的话题,会立马起身走人,一分钟都待不住。因此,索普要练习将自己的“21 点”算法尽可能简洁明了地描述给教授听。
然而,索普的担忧完全是多余的。香农教授对赌场策略表现出了极大的兴趣。因为对各种游戏和输赢感兴趣,教授自己当时正好也在研究这些问题。香农教授称赞索普的“21 点”算法是一项伟大的成就,并且向他介绍了自己和同事共同开发的凯利公式——最大回报率与信息的准确性成正比。将这一公式运用到投资或者赌局,可以计算出在胜算较大的游戏中每一轮应投注的赌资金额。
在当时,鞅收敛定理是专业赌徒们最常用的理论。根据这一理论,在第一局投入 1,如果失败了再投入 2,继续失败就投入 4,之后只要赢一次,就可以拿回本金。越输就越增加赌注,以此挽回损失。但是这种方法有个大问题——赌注金额有限制。因为大部分赌场都对赌注的最大金额有明确限制,所以总有一次赌注金额会达到那个极限,让人最终倾家荡产。冒着如此高的风险去挽回很少的一点本金,效率太低了。
如何才能高效下注,这是一个非常难的问题。在《不确定条件下的理性决策》①这一论文中,作者以 61 名接受过数学教育的年轻人为实验对象,给他们每人 25 美元,在投硬币游戏中下注。由于硬币正面朝上的概率为 60%,理论上来说获胜的概率为 60%,所以预期回报为无穷大,玩的次数越多,赢的钱就越多。实验将个人能拿走的最大赌资金额设定为本金的 10 倍,即 250美元。令人惊讶的是,实验对象中有 28% 的人玩到了破产,平均支出的赌资只有 91 美元。虽然这是一个胜负比为 60 比 40 的高胜率游戏,但是如果不懂得如何高效下注,就会像实验参与者那样玩到血本无归。
香农教授就是因为看到了这些问题,于是研究出了高效下注的方法,即只拿出现有资金中一定比例的资金下注。这种方法绝对不会让人破产,它会让你在赢钱的时候加大赌注从而增加回报,在输钱的时候减少赌注从而降低风险。如果上述实验对象运用了凯利公式,在每一轮中只投入现有资金的 20% 作为赌注,那么大概在 13 轮游戏之后就可以拿到最大赌资金额 250 美元。
① Haghani, “Victor and Richard Deway”, Rational Decision-Making under Uncertainty,2016.
根据香农教授的凯利公式,在游戏中胜率越大、赔率越高,应投入的赌注比例也越高,这样才能实现收益最大化。
下注比例 = (赔率×胜率 - 败率) / 赔率
例如,胜率为 60%,赢了赌注变为 2 倍,输了上交赌注,那么下注比例 = (1×60% - 40%) / 1 = 20%。
也就是说,只要投入现有资金的 20% 作为赌注即可。当胜率小于 50% 时,游戏对玩家不利,还不如干脆不下注。在“21 点”游戏中,由于胜率不断发生变化,所以胜率大时增加赌注,胜率小时减少赌注,就能保持长久的胜利。凯利公式后来成为资产管理与投资中计算比例的法则,被沃伦·巴菲特、比尔·格罗斯等著名投资者引用,受到了广泛欢迎。
凯利公式成为完善索普算法的最后一步。即便我们可以在胜率上比庄家更占优势,那也要通过下注来将这一优势转化为实际利益。索普与香农教授想将这一研究结果发表在美国数学协会期刊上,以获得投资然后亲身验证。在与香农教授约好共同准备“21 点”游戏的论文后,索普从座位上站起来准备离开。这时,香农教授叫住了他:
“你还研究过赌场里的其他玩法吗?”
犹豫片刻后,索普小心翼翼地说出了自己在大学时期进行过实验最后却以失败告终的“轮盘赌”的故事。“预测赌场小球运动的机器?”这一想法让香农眼前一亮。要知道,他可是个机器达人。香农教授叫来自己的秘书,让其取消当天所有的会面。在与索普通宵畅聊后,香农教授决定与他组成研究小组。
◊ ◊ ◊
香农教授与索普在共同准备《21 点常胜策略》论文的同时,也在秘密研究“轮盘赌”。在香农教授的帮助下,索普获得了赌场中实际使用的价值 1500美元的轮盘与象牙小球,他利用相机与烟盒大小的便携式计算机计算了小球的运动。经过几个月的实验之后,他们得出了这样的结论:将轮盘分为 8 个大小相同的区域,输入小球初始位置并得到小球第一圈的转动速度后,可以计算出小球最终停留区域的概率为 60%。反正几乎不可能准确预测小球的停留位置,那么仅凭现在的方式也可以将原本为 44.84% 的胜率提高到 60%。
在这一套预测程序完成到一定程度后,他俩开始筹备将其运用于实践。首先将便携式计算机藏于鞋底,用一根细线连接按钮与耳机。在小球转动时,用小按钮输入小球运动的起始区域,在小球转动一圈后再次按动按钮以计算小球的运动速度。之后,计算机分别用“哆唻咪发梭拉西哆”8 个音传递小球掉落在 8 个区域中的哪个区域,实验者用耳机收听。起初,在小球转动一圈时,由于按按钮的时机总是不对,结果总是错误。索普干脆没日没夜地泡在香农教授的实验室,练习了整整一周之后,才终于得到与之前计算数据相近的实验结果。
现在,该去赌场实际操作了。索普穿上厚厚的衣服,用胶将细线粘在身上。为了不被人察觉,索普还将线涂上了与肤色、发色相近的颜色。他还买了双鞋跟很高的皮鞋,这样就算鞋里藏着计算机,看起来也不会太奇怪。就这样,1961 年 6 月的一天,索普夫妇与香农夫妇一同前往拉斯维加斯赌场。
比起“21 点”游戏的实验,索普这次要紧张得多。因为“轮盘赌”的预测系统需要使用机器,一旦作弊行为被人发现,机器就是他们无法抵赖的证据。由于害怕被监听和搜身,他们没有入住酒店,而是在附近的一家汽车旅馆住了下来。香农率先进入赌场,寻找轮盘合适、庄家看起来不太容易起疑的赌桌,找到之后向队友们使使眼色,然后几人汇合。香农在纸上写下数字,伪装成一个似乎在做某种计算的玩家,借此吸引大家的关注,索普则趁机用机器计算然后下注。
机器运转很顺利。索普听到耳机传出的声音后,在相应区域的数字中均匀地下注。系统的表现比预想的效果要好,没多久,他就赢到了 2000 美元。轮盘上的数字不是连续的,而是许多数字间隔而成。举例来说,在 1 号区域里,4 的旁边是 21、21 旁边是 17……也就是说,在旁人看来,索普下注是
没有任何规律的,他只是随便挑了数字下注而已。
如果说系统有什么不足之处的话,那就是线总是断开。为了使人不易察觉,他们把线做得极细,以至于轻微的动作也会拉断线。线一断,他们 4 人就得回房间去修理,这样一来,一天之内他们得进出房间十多次。
虽然系统预测较准确,使他们赢到了钱,但是反复断开的线让索普感到很烦躁。他开始用高于凯利公式计算结果的比例进行下注。多次成功之后,已经将赌注扩大到 2 倍、3 倍的索普更加信心大增,于是他将赌注增加到了最大比例。然而这一系统毕竟只能让人在赌局中提高胜率,做不到 100% 的准确预测。为此,索普在连续失败 3 局之后,将这一天的收入输得所剩无几。
俗话说得好:屋漏偏逢连夜雨。坐在索普旁边的女玩家突然大叫了一声,机器的线又断了,伪装成肤色的电线挂在索普的脸上摇摇欲坠。一行人赶忙收拾好电线飞也似地逃离了赌场,所幸赌场似乎并没有察觉到他们的异常。
香农与索普决定暂且搁置对“轮盘赌”的研究,直到有更先进的通信设备与技术问世。因为以现有的乔装技术和机器,他们很难专注于赌局,而且一旦作弊行为被赌场发现,他们定会死无葬身之地。值得一提的是,索普在这次拉斯维加斯赌场之旅中收获良多。他明白了一个道理:无论赌局对你如何有利,如果不遵循凯利公式胡乱下注,倾家荡产可能就是分分钟的事情。也就是这一经验帮助索普在日后成为了颇具传奇色彩的投资家。带着遗憾也带着释怀,香农与索普就这样回到了麻省理工学院。
索普的论文通过了美国数学协会的审查,得以顺利发表。起初,人们大多抱着将信将疑的态度,所以论文并没有引起多大的反响。但是,随着其算法在现实情况下的有效性渐渐被人们所知,加上美联社的记者对他进行了采访,索普一夜爆红。美国各地的专业赌徒纷纷致电数学系办公室,询问自己是否可以得到论文。整个麻省理工学院几乎被咨询索普算法的信件淹没,快要无法正常工作了。甚至还有人没完没了地直接往索普家打电话或语音留言,他的妻子不得不掐断了电话线。索普宣布,他将于 1961 年 1 月在华盛顿举行的美国数学协会冬季会议上就自己的论文发表首次演讲。原本甚是枯燥无趣的数理会议却挤满了前来旁听的人,有记者、专家学者,甚至还有黑社会人士。演讲一结束,人群蜂拥而至,想要向索普开出各种条件。有人表示要斥巨资买下他的系统,有人表示想花钱请他去做个人培训,拉斯维加斯的一家大型赌场甚至表示愿意为他永久提供免费食宿,以宣传自己的生意。当然,他们之所以愿意这样,是因为和其他专业赌徒一样,认为索普的理论只不过是一种幻想。索普虽然对各种各样的诱惑都没有表现出太大的兴趣,但是他很想亲身实验自己的系统。况且“21 点”又是一个极其烧钱的赌博游戏,对于当时年薪 7000 美元的他来说,仅凭个人财力根本无法进行。索普最终决定与一个商人合作。
这位名叫艾曼纽·曼尼·基米尔的中年商人来自纽约,其名下的“肯尼停车公司”即将上市,他还是丧葬业的巨头。基米尔凭借优秀的商业才能和雄厚的资金实力,从美国新泽西州纽瓦克机场旁的一家小停车场发家,逐渐掌控了整个纽约的停车业,后来又收购了清洁行业、设备业的一些公司,甚至还收购了著名的 DC 漫画和演艺人经纪公司。1969 年,他又收购了华纳兄弟电影公司,将其与时代华纳合并,成立了世界上最大的传媒公司。
实际上,基米尔最早是靠赌博和卖酒掘到第一桶金的。据说,纽瓦克机场旁的那家小停车场就是他用在骰子赌博中赢来的钱买的。而“肯尼停车公司”之所以能够获得成功,也得益于他参与的许多非法的赌场生意。基米尔甚至还在美国实施禁酒令时期与黑社会组织勾结,靠酒类运输挣了大钱。根据 1965 年美国联邦调查局的报告资料,基米尔与一些国际性的黑帮组织头目曾亲密到了“拜把子”的程度。他痴迷于各种赌博,对“21 点”的钻研尤其深。由于对索普的论文感兴趣,他驱车近 5 小时,专程从纽约过来拜访索普。
基米尔答应给索普投资 10 万美元,条件是他要拿走 90% 的收益。而索普认为,拿着超过自己年薪 15 倍数额的钱去赌博,容易失去理智,也太容易引起别人的注意,于是他只要了 1 万美元。当然,基米尔对索普并非全然信任。他虽然对数学理论知之甚少,但是就“21 点”方面的经验,他坚信自己绝不亚于任何人。因此,他提出让索普亲自在赌局中战胜自己,以证明其论文内容的有效性。
基米尔开始发牌,他的手法是那么娴熟。那天,两人玩了整整一个通宵。第二天、第三天,他们又玩了整整两天。之后的每个周末,索普都开车前往基米尔位于纽约的家中,与他玩“21 点”。就这样大约过了一个月,基米尔总算开始相信索普的算法是有效并切实可行的。索普对自己充满信心,他表示,失败的唯一可能就是赌场“出老千”。基米尔笑着说:
“你不用担心,我可最擅长揭穿赌场的这种骗局了。”
◊ ◊ ◊
两人一同前往雷诺。雷诺是美国内华达州一座小型的赌场城市,索普和基米尔决定首先在这里进行测试。毕竟拉斯维加斯人多嘴杂,认识基米尔的人也很多。如果完全遵循计算结果,那么原本应只在胜率大于 50% 的情况下才下注,但是如果一味观察别人的赌局,自己只在必要的时候才下注,这样就太容易引起别人的察觉了。于是索普决定每局都参加,并且只下最小比例的赌注。
索普慢慢地计算着牌数,等待对自己有利的时机。虽然他每局只下最小的赌注,但是那天的运气似乎特别不好,有利的时机一直没有出现。索普一直在输钱,直到输了 100 美元。他大为恼火,要求庄家允许他同时进行两个赌局,但是遭到了拒绝。庄家觉察到他在留心观察牌数,似乎在计算着什么,于是开始迅速发起牌来。索普也不甘示弱,快速地计算着牌数。随着计算出的胜率不断变大,索普渐渐增加了赌注。最终达到对庄家 15% 优势的时候,索普将赌注加到了 20 美元。一局结束,他不仅赢回了所有本金,还小小地赚了一笔,心满意足地离开了座位。
算法的有效性在实际赌局中得到了验证,这让索普和基米尔都感到兴奋。这次该轮到基米尔实验索普的系统了。这家赌场的最小赌资高达 500 美元。基米尔按照与索普练习过的那样,先计算胜率,再根据计算结果决定下注金额,不利时就只下最小赌注。就这样,基米尔在短短 30 分钟后就赢了5000 美元,1 小时后赢得了 1.3 万美元,使得赌场不得不换掉了庄家。
新的庄家是个表情冷漠的 40 多岁的女性,也是赌场培养的专业“老千”。 “老千”会在洗牌的时候偷看牌,如果对牌不满意,会偷偷把这张牌的下面一张牌递出去。基米尔虽在输了几局之后意识到庄家“出了老千”,但碍于面子,他并没有结束赌局。基米尔认为,凭借索普的算法,即使庄家“出了老千”,他也可以赢。直到又输了 2 万美元,他才收手,从椅子上站了起来。怒火中烧的基米尔向赌场抗议庄家“出老千”,但是由于没有证据,并且有其他玩家表示从庄家这里赢了钱,他的抗议被无视了。索普和基米尔为了挽回损失,再次前往前一天赢钱的赌场。赌场里的人认出了他们俩。在赢了 650美元且胜率提高的情况下,他们增加了赌注。然而庄家突然开始洗牌,于是所有计算全都作废,他俩不得不离开了座位。
实战有别于理论,实际操作中往往充满了各种变数。赌场会时刻留意那些赢钱的玩家,他们会在必要时“出老千”或者突然洗牌,用这些手段干预玩家的行为。而索普和基米尔两人又必须尽量不引起别人的关注,要假装成偶然赢了钱的样子,在略有盈利之后就要收手转往下一个赌场。
逐渐适应了实战后的索普开始称霸雷诺。他在市郊的小型赌场两小时内赢了 1.7 万美元,之后在附近的赌场又赢了 6000 美元。他通过给每张牌打分的简单方式来计算牌数,而不是把所有的牌都记住。因此,无论庄家发牌有多快,索普都可以算出胜率。即使牌桌上有多名玩家,他也可以把别人的牌数都计算出来,从而更加轻松地把握时机下注。
但是索普陷入了巨大的焦虑和被害妄想当中。他既要费心注意庄家何时 “出老千”,又要担心被人识破而赶出赌场。随着索普的长相和举止渐渐被传开,他开始被一些赌场拒绝进入。索普甚至还听说有些算牌的人被赌场私下抓走挨了毒打,所以在游戏时更加小心谨慎。除此之外,基米尔还会随时确认索普的赌局进展,甚至会对他进行搜身,以检查他有没有藏匿芯片。基米尔甚至常常无视索普的方案擅自下注,结果不仅输钱,而且还打草惊蛇。有一次,两人在市区的一家赌场赢了 2.2 万美元,尽管索普反复强调自己太累了无法再计算牌数,基米尔还是一意孤行要继续赌,结果输了 1.1 万美元。
从雷诺回来以后,索普确信自己的算法已经得到了验证,赌场的经历也让他有了很多感悟。他再也不需要更多资金了。当初选择与基米尔合作是为了验证算法的有效性,现在既然不需要钱了,两人于是分道扬镳。后来,索普前往美国新墨西哥州立大学任教,年薪涨了 50%。他还出了一本名为《击败庄家》(1962)的著作,讲述了“21 点”策略以及自己击败赌场的经历。该书一经出版,立刻成为赌徒们人手一本的“经典教材”,轰动一时。无数算牌人横空出世,各家赌场甚至为此召开紧急会议商讨对策。尽管赌场给出了“要抓住算牌人并恐吓”“要提高‘老千’的比例”等应对方案,但是从现实角度来说,要将算牌人一网打尽是根本不可能的。
虽然有很多人按照索普的书里描述的那样进行操作,但很少有人系统地实践其理论。人们只关注牌数的计算,却忽视了对下注比例起到关键作用的凯利公式。当人们通过算牌发现胜率对自己有利时,往往难掩冲动而增加赌注,最后反而输了钱。这样的情况时有发生。
索普出版《击败庄家》之后,仍然不时前往拉斯维加斯的赌场。由于实在太出名了,他只得通过换掉眼镜、戴上假发等伪装来隐藏自己的身份。尽管如此,人们还是很快就能认出他来。一旦真实身份暴露,赌场便会将他驱逐出去,并且禁止他再次进入。1966 年,仅拉斯维加斯就去了 10 次的索普意识到自己已经太出名,再也不能玩“21 点”了。据说那一年夏天,他蓄起络腮胡前往赌场,可这一消息很快就在所有赌场之间传遍了,以至于所有留着络腮胡的人都成了赌场的警戒对象。索普去了一家远离拉斯维加斯的赌场,结果就连那里也知道“络腮胡”的事情。
赌场在缜密研究之后,宣布了一条可以杜绝算牌人操作的新规定。他们引入了一种可以一次性洗多套牌的机器,取名教授探测仪。如此一来,不仅洗牌变得更为轻松,人们也很难再计算牌数了,这大大降低了算牌人的胜率。当然,这里的“教授”指的就是索普。
索普回忆起自己最后一次去赌场的情形。那天,他向身旁走过的服务员要了一杯咖啡,喝了一口之后,他忽然感到意识和视野都变得模糊起来。咖啡里被人下了麻醉剂。他摇摇晃晃地从桌前站起,回到房间睡了整整 8 小时才勉强清醒过来。如果把那杯咖啡都喝完的话,还不知道会发生怎样的事情。意识到再继续前往赌场会搭上自己的性命,索普决定转往更安全合法的“赌场”——华尔街股市。
就这样,“宽客的鼻祖”诞生了。
① 如认股权证一样,指从传统的基础金融工具(股票)交易过程中衍生发展的新金融产品。