所谓高手，就是把自己活成了贝叶斯定理

人生中最重要的问题，在绝大多数情况下，真的就只是概率问题。--- 皮埃尔-西蒙·拉普拉斯（1749-1827）

先讲一个真实的故事。

我的一个夫妻朋友有了二胎，由于太太年龄较大，所以医生警告说，你们的孩子有可能会得唐氏综合症。朋友很紧张，那怎么办？医生说，可以做羊水穿刺，以确诊是不是真的得了。朋友很开心。不过呢，医生又说，羊水穿刺也有可能会失败，那样你们的孩子就没了。这下朋友纠结了，一边是唐氏综合症，一边是孩子没了，这可怎么做决定？

医生后来又说，高龄产妇得唐氏综合症的概率大约是2%，羊水穿刺检测失败的概率大约是1%。这下简单了，坚决不做啊。

所以，我们发现，一旦知道了某件事情发生的准确概率，我们的决定就瞬间简单了起来。但问题是，我们怎么能知道这些概率呢？

很多人觉得所谓的概率，都是计算出来的。一枚硬币，正反面各50%，一个袋子里100个球，30个黑球，70个红球，摸出一个红球的概率是70%。

那假设一个黑盒子，你事先不知道里面多少黑球，多少红球，怎么办呢？其实，现实世界里，我们面临的绝大多数情况都没法计算，都是黑盒子却需要去判断概率的问题。

频率派和贝叶斯派

传统的方法叫频率派。关于频率和概率的区别，很多人不熟悉。简单的说，概率说的是事情未来发生的可能性，而频率说的是对某事情进行观察或者实验，发生的次数和总次数的比值。概率是事情本身的一个固有属性，是一个固定值，而频率是变化的，样本越大，频率越接近概率。根据大数定理，当样本无穷大时，频率等于概率。

你抛硬币10次，不见得会正面反面各5次，但是你抛1万次，那基本是正反各50%。比如那个黑盒子，你不断的从里面随机的拿球出来，统计黑球和红球的比例，次数“足够多”时，你得到的那个频率，就接近真实的概率。

这个方法用了上百年，现在仍然被广泛使用，比如某某疾病的发病率，飞机和火车的出事概率等等，都是利用大样本的统计，逼近真实概率。

但是，我们稍微深入的思考一下，就会发现这个方法的两个局限：第一，你只有积累了一定数量的样本，才能有一个对概率的初步判断，你只扔5次，只取10个球，基于小样本得出的概率很可能错的离谱。第二，如果这个黑盒子够黑，你连里面总共有多少个球都没概念，甚至里面的球的总数量都是变化的，这时你就没法判断什么叫“足够多”。

现实世界里，我们碰到的大量问题，根本找不到这么多现成的数据。还有很多新兴事物，压根没有先例，一种新发现的疾病，一个新的产品，一种新的市场策略，那怎么判断概率呢？瞎蒙吗？

也对，也不对。

这就需要贝叶斯学派了。

贝叶斯学派的观点是，概率是个主观值，完全就是我们自己的判断，我可以先估计一个初始概率，然后每次根据出现的新情况，掌握的新信息，对这个初始概率进行修正，随着信息的增多，我就会慢慢逼近真实的概率。这个方法完美的解决了频率派的两个问题，我不用等样本累积到一定程度，先猜一个就行动起来了，因为我有修正大法，而且我也不关心是不是“足够多”，反正我一直在路上。

贝叶斯学派诞生两百多年来，一直倍受争议，甚至连co-founder拉普拉斯自己都放弃了，因为大家觉得这个摸着石头过河的方法太扯了，太不科学了。直到最近几十年，随着计算机技术的进步才大放异彩，现在的人工智能、图像识别、机器翻译等，背后无不采用了贝叶斯方法。

那我们需要看看，贝叶斯方法究竟是怎么摸着石头过河的。

贝叶斯定理（Bayes' Theorem）

这一部分涉及一些数学公式和计算，但说实话，只需要小学算术水平就可以了。

贝叶斯定理如下：

上述解释你可以忽略，简化的理解为：

后验概率 = 先验概率 x 修正因子

举个例子。

比如你新进入一家公司，你不确定这里MBA学历对员工升迁的作用，而这个对你的个人发展很重要，因为你要决定接下来是不是去读一个MBA学位。由于新来，压根没有样本，这时候你可以采用贝叶斯定理。

P(A) 是你根据过往经验事先估计的，MBA对升迁有多大好处？比如你先预估一个30%。这时候，出现了一个新信息B，小王升迁了，而且小王是MBA。那么，P(B|A) 是说当MBA管用时，小王升迁的概率，比如你现在的判断是80%。小王可能本身就有能力且业绩突出，就算没有MBA也可能会升迁啊，所以P(B|A_) = 50%（发现了吗，这个公式自动的帮助我们避免走极端）。

套入贝叶斯公式，P(A|B) = 30% * 80% / (80% * 30% + 50% * 70%) = 41%。从30%提高到了41%。那么当小王升迁这个新情况出现以后，你对MBA作用的概率判断从30%提高到了41%。

但是，过了段时间，你发现同样是MBA的小李，熬了很多年也没有升迁，最后辞职了。现在你对小李因为MBA有效而升迁的概率判断降为20%了。套入公式，新的P(A|B) = 41% * 20% / (20%*41% + 50%*59%) = 22%。从刚才的41%跌了近一半。

这样几次下来，你就能对这个这家公司对MBA的看法有个相对靠谱的判断了。

或许你会说，搞这么复杂干嘛，有了新情况，我原来的看法会改变，新情况和自己的预期一致就强化原来的看法，否则就弱化，这不就是常识吗，还用得着什么数学定理吗？

很好，的确一针见血。拉普拉斯说过，所谓的概率就是把人们的常识用数学表达出来。也有人说，人脑就是采用贝叶斯方法来工作的。

但是这里还是不同的。我们人类的大脑虽然也会根据新的证据调整我们的判断，但是我们天生有一种“证实倾向”，我们往往会高估证据的作用，但是贝叶斯定理不会，它强迫我们把假设不成立的概率也考虑在内，P(B|A_)和P(A_)，从而纠正了我们的认知偏差。

让我们再来看一个复杂一点的例子，这是一个经典的案例，网上随处都可以找到。

艾滋病毒(HIV)检测技术的准确度相当惊人。如果一个人真是HIV阳性，血液检测的手段有99.9%的把握把他这个阳性给检查出来而不漏网。如果一个人不携带HIV，那么检测手段的精度更高，达到99.99%——也就是说只有0.01%的可能性会冤枉他。已知一般人群中HIV携带者的比例是0.01%。现在假设我们随便在街头找一个人给他做检查，发现检测结果是HIV阳性，那么请问，这个人真的携带HIV的可能性是多大呢？

我们使用贝叶斯定理。A表示“这个人真的携带HIV”，B表示“检测出HIV”，那么根据现有条件，P(A) = 0.01%，P(B|A) = 99.9%，P(B|A-) = 0.01%，带入公式，计算得到P(A|B) = 0.01% * 99.9% * (99.9%*0.01% + 0.01%*99.99%) = 50%！

答案或许和你的直觉不一致，即使在这么惊人的检测准确度之下，哪怕这个人真的被检测到HIV阳性，他真有HIV的可能性也只有50%。

我们看到，如果是一种非常罕见的病毒，人群中只有万分之一的人感染，在这种情况下即使你的检测手段再高，也很有可能会冤枉人。甚至，如误诊率不是0.01%，而是0.1%的话，也就是检测手段再差一档，这个结果就会瞬间从50%降到9%。但是，我们也可以反过来想，这么罕见的疾病，一旦被检测出来了，也有50%的概率真的会得，这个跃迁是从万分之一，一下子到了50%。而如果我们假设这个病毒的感染率不是万分之一，而是千分之一，那么在原来的检测精度下，可能性就从50%升到了90%。

这其实可以解释为什么我们说一叶知秋，为什么说当你家发现了一只蟑螂，那么你家里一定已经有很多蟑螂了。罕见事件，可以对初始概率做出数量级的改变。同时，这也解释了我们有时也不能反应过度，有人叛逃到国外了，我们难道需要彻底关闭海关吗？真的需要在墨西哥修建长城吗？

贝叶斯定理，把我们的思考的方式给撕开了，揉碎了。

贝叶斯定理给我们的启示

塔勒布说过，数学不仅仅是计算，而是一种思考方式。

现实世界中，我们没法时时刻刻拿出电脑来演算一下公式，但是我们仍然可以通过这个定理得到一些宝贵的启示：

1、先行动起来。

大胆假设，小心求证。不断调整，快速迭代。这就是贝叶斯方法。

当信息不完备时，对概率的判断没有把握时，当然可以选择以静制动，但是不行动也是有代价的，你可能会错过时机，你也没有机会进步。这个时候，贝叶斯方法给我们提供了一个很好的思路，先做一个预判，动起来，利用新的信息不断修正原来的预判。

2、听人劝、吃饱饭，但又不能听风就是雨。

当我们没有把握时，我们很容易根据新信息调整看法。更大的挑战是，我们已经形成了一个看法，甚至有了成功经验时，当新情况出现后，我们能不能也去调整自己看法。那个黑盒子，我们摸索了一段时间，估计出了里面红球、黑球的概率，但是我们有没有想过，这个黑盒子里的球的比例会变化呢？

有了新信息，我们要对原来的看法做多大程度的修正呢？

这些，不可能有标准答案，但是明白了这个道理，有助于我们及时又谨慎的做出调整。

3、初始概率很重要。

初始概率越准确，我们就能越容易、越快速的得到真实的概率。疑邻盗斧，以貌取人，会让我们离真相越来越远。而如何获得相对靠谱的初始概率，是个硬功夫，它需要你的经验、人脉、平时的深度思考，有时甚至和底层的价值观、思维方式都有关。

丹尼尔.卡尼曼在他的《思考，快与慢》里，就特地强调了初始概率对贝叶斯方法的重要性。

4、对出现的特殊情况要引起足够的重视。

前面我们已经看到了，万分之一概率的事情，也有可能因为特殊事件，一下子变成了50%。所以，每当出现特殊的、罕见的情况时，我们要保持高度警惕，黑盒子里的球的比例是不是变化了？但同时我们也看到，如果检测精度不够高，即便出现了罕见事件，真实概率也可能不到10%。所以，具体要怎么采取行动，还需要进一步观察。

5、信息的收集，信息的质量，以及对信息的判断，是提高决策水平的最重要环节。

只要有新信息，就可以修正，哪怕初始判断错了，新信息足够多，也能修正过来。但是没有信息，就没有修正。所以，在做决定之前，尽可能多的收集信息是必须的。但是错误的信息、低质量的信息，会让你的修正偏离真相越来越远，你能不能区分信息来源的可靠性、能不能进行交叉验证、逻辑推理，就显得至关重要。

要做到这些，甚至某一些，都并不容易，掌握里面的平衡，就更加困难。

所谓高手，就是把自己活成了贝叶斯定理。

所谓高手，就是把自己活成了贝叶斯定理

频率派和贝叶斯派

贝叶斯定理（Bayes' Theorem）

贝叶斯定理给我们的启示

你可能感兴趣的:(所谓高手，就是把自己活成了贝叶斯定理)