概率模型(三)大数定律:偶然中的必然

查理芒格说:“一个人只要掌握80到90个思维模型,就能够解决90%的问题。”

这是老锦关于思维模型的第8篇文章(No. 3 概率模型)。

在上一篇文章《概率模型(二)福利彩票的那些坑,你也中招了吗?》末尾,我给大家留一个思考题。

小明和小东研究了最近100期的双色球蓝球的走势图,发现号码5出现的了20次,号码1只出现了2次。

小明说:从过去100期的5号球的表现,他判断接下来5号球出现的概率应该比别的号码更大。

小东说:从理论上讲,每个数字出现的概率都是1/16。号码1在过去100期出现的频次更少,因此,接下来号码1出现的概率将更高。

小明和小东说得都挺有道理的,你觉得到底谁说得对呢?


你get到了吗?

正确的答案是:小明和小东都错了。

根据上一篇文章所学的知识,我们知道小明和小东,都犯了同一个错误:把独立随机事件错误地理解成关联事件。

16选1的双色球蓝色球的号码,每一次摇奖都是独立的随机事件。

每一次摇奖结果每个数字出现的概率总是1/16,不因为前面几期(无论是5期还是1万期)的开奖结果而改变。

然而,你可能不知道,这里小东还犯了另一个赌徒缪误:误用大数定律。

什么是误用大数定律?

别急,这就是我们今天要学习的新知识:

大数定律及大数定律误用。


1.大数定律是什么?

大数定律:当随机事件发生的次数足够多时,随机事件发生的频率趋近于预期的概率。


以抛硬币为例。

一枚理想对称的硬币,抛掷的结果,正面朝上,记为1;反面朝上,记为0。我们知道,每一次抛掷,1和0出现的概率均为1/2。

当我们进行n次抛掷实验后,得到1的次数为n(1),比值P(1)=n(1)/n,叫作1出现的频率。

1出现的频率并不一定等于概率(1/2)。但是,当n逐渐增大时,频率就会逐渐趋近于1/2。

也就是说,

随着实验次数增大,频率趋近于概率,这就是大数定律。


2.大数定律误用

那么,大数定律误用是什么呢?

我们就以思考题中的小东为案例进行分析吧!

案例:

小明和小东研究了最近100期的双色球蓝球的走势图,发现号码5出现的了20次,号码1只出现了2次。

小东说:从理论上讲,每个数字出现的概率都是1/16。号码1在过去100期出现的频次更少,因此,接下来号码1出现的概率将更高。


根据大数定律,随着实验次数增大,号码1出现的频率会最终趋近于它的预期概率1/16。

小东说的不就是这么回事吗?

错!

小东这里犯的错误是:

a.把短期频率当成长期概率;

频率V.S.概率

频率不一定等于概率。

频率取决于多次实验后的结果;而概率是一个极限值。

案例中,小东错把最近100-200期号码的短期频率当成了长期的概率。

b.把无限的情况当成有限的情况来分析。

大样本区间V.S.小样本区间

大数定律能够适用的是大样本区间。

问题在于,多少次实验才算“足够多”。

答案是:实验的次数是理论上的无穷大,实际中难以定论。

对于双色球蓝色球而言,100期乃至10000期的走势图都只是小样本区间。

小样本区间的频率分布不能等同于大样本区间的概率分布。



事实上,任何一段有限次的试验得到的频率对于足够多次试验的频率几乎没有什么影响。



图片发自App




大数定律说的是总频率趋近于概率值,如上图所示,小样本区间实验的结果并不影响最后趋近的概率。


3.总结

a.大数定律:当随机事件发生的次数足够多时,发生的频率趋近于预期的概率。

b.频率不一定等于概率。

当实验次数足够多时,事件发生的频率终究会趋向于它的概率。

c.大数定律能够适用的是大样本区间。

实验的次数是理论上的无穷大,实际中难以定论。

d. 看一百期的彩票走势图,其实是对小样本区间历史数据的归纳,不适用大数定律,不足以对未来作出正确的判断。


4.思考题

你知道墨菲定律吗?

墨菲定律:凡事有可能会出错,就一定会出错。

换言之,如果暂时没有出错,也只是时间的问题。

这个跟大数定律有没有关系呢?

快来用今天学到的知识来分析一下吧!

你可能感兴趣的:(概率模型(三)大数定律:偶然中的必然)