原文链接:https://blockgeeks.com/guides/cryptocurrency-game-theory/
原文标题:What is Cryptocurrency Game Theory: A Basic introduction
NOTE:英文水平有限,翻译不当的地方还请指正,有能力的请阅读原文
21世界毫无疑问最伟大的发明之一:加密货币。什么是加密货币博弈论呢?
为什么认为区块链技术是一个重大突破?要理解这个问题,我们首先要看一下传统的法币是如何运作和保存的。现实生活中无论你是谁,你的资金都会存放在一个中心化的地方,比如银行,基于这样一个中心化的模型,你可能会面临一系列的风险并且也不得不做出一些妥协。而区块链技术自身是去中心化的、并且可以利用加密、博弈论等技术来解决中心化系统所存在的问题:比如贪污腐败。
什么是market structure:
在理解market structure这个名词之前,我们需要理解一些基本概念,任何市场组织或组成特点我们称之为market structure,我们通过生产者个数、价格控制、准入门槛等一系列的指标来将market structure划分为四种不等的级别:
- Perfect Competition
- Monopoly
- Monopolistic Competition
- Oligopoly
Perfect Competition
Perfect Competition指的是任何人都可以很容易的进入这个市场,商家并没有定价权。比如芒果市场,每个人都可以种植并出售芒果,并且他们并不能按照自己的意愿来改变芒果果的售价,假如他们将芒果提价到10美元的话,买家完全可以在别的地方用5美元的价格买到芒果。
Monopoly
Monopoly和Perfect Competition完全相反,这种市场由寡头垄断,并且准入门槛极高以至于几乎没有别人可以进入。比如戴比尔斯钻石。
Monopolistic Competition
这种市场拥有很多商家,并且门槛很低,他们都出售相似的产品但是产品之间会有微小的差异,比如dominoes披萨和pizza hut披萨,他们中每一个商家都可以根据用户的偏爱来稍微提高点价格,但是如果他们抬的过高,顾客可能就会选择另外的商家。因为准入门槛比较低,如果某些商家的产品价格过高,总会有别的厂家进入并低价占领市场。
Oligopoly
Oligopoly指的是市场被为数不多的一些厂商把持,并且准入门槛较高,比如智能手机市场。目前的智能手机市场由少数几家公司把持:苹果,三星,华为等。跟Monopolistic Competition很类似,他们的产品很类似但是有些许的区别,但是他们并没有很大的差异化空间,如果明天苹果公司决定将每部手机定位为4000美元,那么除了一些土豪或非理智果粉,大部分的买家还是很可能会选择购买一个安卓手机。当然这些公司完全可以聚在一起商量何如组团抬价来割韭菜,这种行为被称作:“collusion”。这种行为在很多国家都是非法的。
考虑一个问题:如果商家不能通过价格来竞争的话,他们如何在和别的商家的竞争中取得优势?通常的做法是采用:non-price competition-非价格竞争,非价格竞争的做法很简单,一般都是通过改变产品外观,或者提供不同的用户体验来提高竞争力,但是最常见的做法是:打广告。
广告往往是宣传商品、推广商品最有效的手段,但是目前的广告实在是太多了,想象一下现在你每天能看到多少条广告,有几条记住的?如果商家处于Oligopoly竞争市场,并且盲目的打广告的话,将会耗费很多财力。
What is the Game theory?
什么是博弈论:
博弈论是一门策略研究学科,This is how many corporations make decisions while keeping in mind the actions that their competitors will take(有点难翻译,公司在做决策的时候请记住,你们的竞争对手也会拥有和你们一样的想法)。博弈论是由John Van Neumann和Osker Morgenstern在1944年提出,并且被认为是oligopoly市场研究中的重大突破。博弈论现在已经被广泛的应用到别的领域和学科。
博弈论模型至少有3个部分:
player:决策人,比如:公司的经理
Strategies:决策人希望对公司采取的决策
Payoff:决策的回报
博弈论中有两种博弈:
零和博弈:一个player所获利的是另一个player所付出的。
非零和博弈:一个player的获利并不来源于另一个player。
让我们来简单看一个例子,假设有两个公司A、B,他们在思考是否要投放广告:
上图我们称之为:payoff matrix,回报矩阵。
- 假如A和B都决定投放广告的话,他们的回报分别是4和3
- 假如A不投放广告,B投放广告的话,他们的回报分别是2和5
- 假如A投放,B不投放的话,回报是5和1
- 如果AB都不投放广告的话,他们的回报是3和2
那么AB应该如何决策才能使他们的收益最大化呢?
首先我们先看一下B:
case1:确认A投放广告
此时B投放的收益为3,不投放的收益为1,那么可以肯定B最好投放广告
case2:确认A不投放广告
此时B投放的收益是5,不投放的收益是2,那么B应该选择投放广告
结论:不管A做出什么决定,B都应该投放广告
我们再看一下A:
同理可以推出:同样的,不管B做什么决策,A也都应该投放广告
上述的例子我们看到不管对于A还是B,最佳的策略都是投放广告,这种决策对于A和B来说称之为:dominant strategy。dominant strategy意思是:不论你的对手采取什么方针,dominant strategy方案都是你最优的选择,同时我们也称之为Nash Equilibrium(纳什均衡)。
What is Nash Equilibrium?什么是纳什均衡?
纳什均衡是解决在知道对手可能做的决策情况下,players如何选择最佳的策略,并且如果他们最终篡改他们的策略的话,他们将不会得到任何好处。纳什均衡是由约翰纳什John F Nash提出,著名奥斯卡电影:美丽心灵,描述的就是这段故事(电影源于生活却高于生活,真实的场景并没有电影描绘的那么烂漫)。这个理论对分布式系统有着巨大的影响,事实上区块链就是一个“cheat-free” 系统(cheat-free字面翻译:无代价的行骗),因为整个协议就满足纳什均衡,我们稍后讨论区块链,现在我们首先了解一下纳什均衡。
The Prisoner’s Dilemma囚徒困境
假设Rob 和 Ben在行窃是被抓,在审讯期间,发现他们在很久之前都曾抢劫过银行,警察在审讯时给他们提了几条原则:
原则1:假如他们两个都不相互指认对方的话,他们都将住4年牢
原则2:假如其中有一个人指认另一个的话,指认并且认罪的人将会被释放,另一个人要住7年牢
原则3:两个人都认罪的话,都住2年牢
现在我们来列出pay off矩阵:
红色是BEN,蓝色是ROB,明显Rob 和Ben都是重犯,他们可能因为罪犯之间的荣耀或信任而不会互相揭发对方,这是一个很罗曼蒂克的想法,行为心理学和纳什均衡告诉我们其实不然:
如果他们都不认罪的话,payoff是(4,4),意味着他们各坐4年牢,这是一个不稳定的状态,因为他们都知道他们有更好的选择:如果他们指认对方的话,他们就有可能不坐牢。也就是说他们最终往往会相互揭发对方。其中有很关键的一点就是:他们都知道双方都知道这个策略规则。
但这同样也引出另一个问题:
上述的最优解是相互揭发,本质上是一个好结果,但是如果最优解的结果是对社会有害的呢?比如Rob和Ben计划抢劫银行,我们看一下他们的payoff矩阵:
在这个场景中,对于Ben和Rob的最优选择是同时去抢银行,这个对他们来说可能是一个好的决定,但是对社会来说并不是一个好的结果。
note:看别的资料,纳什均衡的例子都是:相互不揭发做2年牢,一个人揭发,一个不坐牢一个做10年牢,相互揭发的话都做4年牢。相互不揭发应该是最优解,但往往最终的结果是相互揭发。这里文章作者的例子相互揭发反倒是最优解,不是很理解作者想表达的意思。
这也就是为什么要引入:惩罚机制
What is Punishment?
什么是惩罚机制?
这个世界并不是总是友好和公平,人们在没有监督的情况下往往会腐朽堕落,所以我们需要引入一个监督惩罚机制。
“For every -0.5 of utility taken from the public a punishment factor of -7 will be given.”.
意思是任何对社会有害的行为,假如对社会造成了0.5的损失,那么将会受到-7的惩罚,惩罚可以是钱、时间、或者别的任何东西。
加入惩罚机制的话,上面的payoff矩阵应该是下面这个样子:
这种机制如何应用在社会中呢?想象一下人民警察部队的组建资金是由税收来保证的,每个人都必须强制交税,如果拒绝交税,那么将会受到惩罚。
另外一个有趣的例子是:惩罚那些本不应该被惩罚的人。罪犯一般都会被社会所排斥,假如有人跟罪犯走的很近,那么社会也会认为这个人也不是好人,也会开始排斥跟罪犯亲近的人。
纳什均衡和惩罚机制深深的影响着区块链,确保矿工的诚实度,后面我们会更详细的介绍,但是之前我们还需要再更多了解一下博弈论的模型。
The Schelling (Focal) Point
著名的经济学家Thomas Schelling曾做过一个实验,他问他的学生这样一个问题:明天你要约见一个陌生人,你会选择在何时何地和他见面呢?他发现大部分人都选的是:正午时间,地点在Grand Central Terminus。因为Grand Central Terminus对纽约人来说是一个非常重要的地方。
现在我们来定义一下Schelling point:它是一个解决方案,人们在缺乏交流的情况趋向于选择的方案,因为这个方案对他们来说比较重要、特殊、或者感觉很自然。
假想一个游戏:两个囚徒被关在了不同的房间,并且给他们一串随机数字,然后让他们猜对方会猜哪个数字,如果猜错了,他们将被处死。
数字如下:
- 7816239, 676716313, 100000000 和 871823719.
- 你认为他们会各自选哪个数字?
- 都选100000000
这是为什么呢?因为100000000跟别的数字比是最特殊的,这也就是Schelling point,纵观我们的历史,人们无意识的会聚集在酒吧,教会等场所,也都是因为这些地方是Schelling point。
一个非常经典的Schelling point例子叫:The Chicken Game。两个人骑车分别驶向对方,如果他们撞上了,他们都会死,但是第一个转开方向的人被称为“Chicken”。(老外的梗实在是看不懂,叫鸡?)
有两种场景下会撞车:
case1:两人都直挺挺的开过去
case2:一人向左,一人向右
Thomas Schelling给出了这个问题的解决方案,他说最好的解决办法是不要看着对方(不要和对方有交流),而且专注于自己的方向,因为在美国大家都习惯靠右行驶,这样的话会自动避过对方。
Grim Trigger Equilibrium
为了理解这个概念,我们首先想象一个场景:假如一个国家目前还有国王,并且臣民相信天子的权利是由天授的,是上天派下来的,但是假如这个国王被刺杀了,此时会有信仰崩塌,民众会怀疑国王的正统性(王侯将相宁有种乎?叫我女王大人),这样会造成无尽的暴乱革命,因为总有人想刺杀国王然后自己称王。一个解决方案就是创立一个类似“天授的”法则,也就是所谓的Grim Trigger Equilibrium,每个人都遵守法则,如果出现背离法则的行为则会收到惩罚。
Coordination Problems-协作问题
理解这个问题,首先我们先看一下上面的矩阵,上面有两个纳什均衡点:(A,A)和(B,B),偏离这两个状态都不会得到好处,现在的问题是:你如何说服别人从(A,A)状态转移到(B,B)状态。如果现在只有一小波人参与,那么你可以很轻松的通过打电话或者电子邮件的方式来和他们沟通,促使他们转移状态,但是如果参与的人非常之多呢,这时候怎么办?
这个问题和囚徒问题最基本的区别:囚徒问题是这两个player都不得不选择(B,B)因为这是他们payoff最优的选择,尽管(A,A)是一个道德上的选择。在Coordination Problems中,这个问题并不关心道德或者payoff,关心的是如何激励人们从一个状态转移到另一个状态,也就是人们为什么要改变他们平时的一些习惯?
只有一小部分人转移状态的情况下,Coordination博弈认为是失败的,相反的,如果大部分人都转移成功,那么我们认为这个Coordination博弈是成功的。
假设我们想要改变语言中的一个表达:
- 原始的表达:“给我你的陌陌号?”
- 新的表达:“piapia?”
如果只有你采用下面的方式表达,那肯定是失败的,因为大部分人并不知道你在说什么,你在共识之外,你也不会得到很高的payoff,但是你也没有任何激励去改变自己的状态。
但是假如大部分人切换到了下面这种表达方式,你就必须要同时跟着他们切换过去,否则的话你将很难融入他们,此时会有很大激励来促使你改变。
Bounded Rationality概念
想象一下这样一个场景:Sarah每天都会去一家水果店买一个苹果,每天如此,而且每天她购买的时候,老板都会出去5分钟,并且没有任何监控设备,此时她完全可以偷走一个苹果并且不被任何人发现,但是她从来没有这么做过。
Sarah的行为就叫做“Bounded Rationality”,意思是:当给定几种方案时,人们往往会选择那个简单而又熟悉的方案,这个方案可能并不一定是最优的,也不一定是回报最大的,但是他们就是会一直坚持这个方案。可以解释为Sarah之所以选择道德高尚的行为的原因是因为后者不是她平时做事的习惯。
上面谈的是博弈论中的一些概念,下面我们来看一下它如何指导加密货币运作。
区块链和数字货币博弈论
区块链是由一系列的区块组成的,每个区块都包含了很多独立的交易事务记录。每个区块同时也包含上一个区块的的hash值,这样将所有的区块串联起来形成一个链,区块链这个名词也确实是这个结构很形象的解释。
一些关键点:
- Genesis block-创世块:区块链中的第一个块,“genesis” block
- Proof of work-工作量:创建一个区块所需要的计算量
- Parent block-父区块:顾名思义,图中block50是block51的父区块
每一个区块链中的区块有一个评分函数:
- score(创世块) = 0
- score(普通区块) = score(父区块) + 工作量
一般最新的区块有着最高的score。
比特币的区块链系统中有两种角色:
- users:用户
- miners:矿工
在比特币中,用户users有两种功能:
- 发送比特币
- 接收比特币
用户通过公钥和私钥来发送或者接收比特币,矿工指的作用就是授权交易并开发挖矿,挖矿用来生成区块并且将区块添加至区块链中。
Block Mining - 挖矿
矿工通过一系列负责的计算之后将区块添加至链中,以以太坊为例,矿工添加一个区块可以获得5个eth的奖励,比特币中挖矿的奖励是25个BTC,矿工拥有很大的权利,所以当他们造假或者伪造数据的时候会对系统造成很大的影响。
为了缓解这些问题,区块链采用博弈论来加强系统的健壮性,在理解如何利用博弈论来确保矿工的忠诚度之前,我们需要了解另外一个点对点系统,来看一下它是如何保证它的用户总是忠诚的。
Torrenting是世界上最流行的点对点系统之一(种子,做一个有种的好男人,大家都懂的^ ^)。在使用torrents中,大家都有两种角色:下载者和做种者,每当下载一个文件之后,用户其实应该做种,来为别的用户提供下载服务。但是大部分用户往往拒绝做种,因为他们不会得到任何奖励,并且torrents中也没有对欺诈用户有任何的惩罚措施。
How can miners cheat? – Cryptocurrency Game Theory
矿工如何造假?数字货币博弈论
需要满足这些条件:
- 创建一个非法的交易,然后转给自己额外的代币
- 在不用担心工作量证明的情况下,随机的添加区块
- 在第一个非法区块上面获取更多的BTC
- 在不是最高分的区块上挖矿
下面再看一个例子:
蓝色的区块是主链,假设现在有一个矿工花费了20个BTC换取了500个LTC(莱特币),并且将信息记录在了Block51上面,现在他想再新建一个并行的红色区块51,红色区块中并不包含这笔交易,也就是说:
- 在蓝色区块中,他花费了20个BTC来获取了500个LTC
- 从Block50处创建了一个新的链,这条链里面他并没有执行交易
- 最终他没有损失BTc的情况下获取了500个LTC
上述的行为称之为:“double spending”。明显可以看到,矿工完全可以同时在两条链上挖矿并且获取额外的BTC,同时这样也会摧毁BTC系统。
但是为什么矿工不这么做呢?难道是因为大家都是极具正义感与使命感的优秀公民吗?(既然你诚心诚意的问了,那我就大发慈悲的告诉你,为了防止地球被破坏,为了维护世界的和平,贯彻爱与真实的邪恶,可爱又迷人的反派角色......)。我们不能指望靠人类的道德约束或者良知来指望维护好这套系统(懂的都懂),BTC是如何解决这些问题呢?这就又要提到前面讲的纳什均衡和惩罚机制了。
挖矿和惩罚系统中的:纳什均衡
- 比特币中定义:任何在非法区块上以及之后进行的挖矿都是非法操作,在这条规则的影响下,矿工会忽略非法的区块。
- 同样的逻辑也适用于子区块的评分:从图上可以看出,没有矿工愿意在红色的52区块上进行挖矿,因为蓝色53拥有更高的评分
当然,你也可以让有所的矿工都从红色区块开始挖矿,这样的话就能分叉了,但是这点是很难实现的,因为矿工的数量太多而且分散在不同各地,单个人是没有能力和资源同时串通好所有矿工的。就像之前co-ordination game所表述的一样:如果大部分人不改变自己的状态的话,人们是没有动力去花费自己所有的算力,改变原来的状态,并且可能还会一无所获。
同样的,为什么用户会一直采用主链而不是别的其他链?
刚才我们解释了为什么矿工都会选择蓝色的链,还有一种角色:用户,为什么用户会选择蓝色的链而不是红色链呢?同样的也是博弈论。
- 首先你要知道的是数字货币有价值是因为人们赋予了它价值,那为什么人们愿意把价值给蓝色的链而不是红色的链呢?原因很简单:蓝色的主键是人们的Schelling point,蓝色的主链对他们来说更特殊和自然。
- Bounded Rationality:另外一个原因是用户习惯于使用蓝色主链了,就像刚才提到的Bounded Rationality理论一样,人们往往会选择更简单的方案,切换到一个新的链可能是一个很复杂的操作。
What is the Proof Of Work Takeover Problem?
什么是工作量证明接管问题?(这块没理解,翻译的也不好)
Vitalik Buterin(V神,以太坊创始人)给出了一个例子,假设有人发起了一个虚假的智能合约:
- 任何矿工都可以参与这次活动并且在这个合约上发送大量的存款(造假数据?)
- 矿工必须发送这些共享的区块,这些区块已经被智能合约验证,并且同样验证你是否是拥有满足hash算力的矿工。
- 在60%的矿工参与之前你可以退出
- 60%的矿工参与之后,你将会绑定在这个智能合约上,直到红色链上新增了20个区块
这种做法是非常恶毒的,这种情况发生的话,新的红色的链会越大越长(感觉有点奇怪),因为60%以上的矿工已经参与到新的链导致以前的蓝色链反而是不合法的。
你可能会问:为什么矿工们会这么做?
我们来看一下,他们参与的原因:
- 可能在最后有一定的收益
- 这么做也不会给他们带来任何风险
他们接纳这个智能合约的原因:
- 他们在合约开始时放置了大量的存款
- 同样的,有可能会有巨大的收益
理论上这种攻击可能会发生在任何区块链经济系统中,但是实际上不会发生,为什么呢?博弈论!
Grim Trigger argument to the rescue
回想一下之前提到的Grim trigger ,如果一个国王被杀了,如何才能避免后面的国王不被杀?为了防止这种事情发生,应该在防止最开始那个国王被杀。(我感觉作者想表达的意思就是:制定一个规则来从源头上杜绝此类事情的发生)
同样的,如果区块链被分叉转向了新链,怎样避免这个问题呢?最好的办法就是从一开始就让它根本不会分叉(下面列举了一些解决方案,确实有点不理解,就不翻译了)。
- The argument fails when the miners are not bound to singular currency. If the miners are working on several currencies, then they can simply group to take over a low-value currency.
- The argument holds up if they are bound and loyal to a particular currency. After all, it is in their direct interest to uphold and maintain the value and legitimacy of the currency.
- If the currency requires specialized ASICs, then the grim trigger argument holds up. If a currency can only be mined by specialized software, then miners will make sure that nothing happens to that particular currency and that it doesn’t lose value. Specialized ASICs after all, can only work for a particular currency. Otherwise, it is useless. Plus, they are expensive.
- The argument doesn’t hold up if the currency can be mined using CPUs. CPUs are not expensive after all, and it can be used to mine other currencies.
- However, if the miners who own the CPUs have a stake in the currency, the argument holds up because they don’t want to lose the stake that they have invested in the currency. This is a sort of proof-of-stake.
总结
博弈论使区块链变的如此特殊,而且并没有使用什么新的技术,只是以前理论的组合,博弈论和区块链的组合使得数字货币安全且健壮。即使比特币、以太坊有可能会因为不可预知的原因而失败,但是数字货币不会消亡,因为这是人类史上一场生产关系的重大变革(让我们拭目以待吧^ ^)