度量概率的三大流派:定义法、频率法、迭代法
三大流派随着概率学的法阵,逐步出现,先是定义法,再是频率法和迭代法。
定义法:直接认为某件事不同结果的可能性等同,没有任何一个结果比其他结果更有可能发生。
比如抛硬币,直接定义概率对半开。骰子定义为六分之一。这个流派最早出现,也最原始。理论根基驻扎在宏观世界的对称性的大前提。太过简单粗暴,虽有合理之处,但太过简化,比如工厂的良品率就不能定义为一半一半,得某种病的概率也不能定义。
频率法:只要数据量大,一个随机事件发生频率就会无限接近它的发生概率。
通过足够多的数据实验,通过数据让概率浮出水面。缺点在于没法尝试的事情就不能使用频率法。如上火星的概率。其次,很多事情的发展,概率是会变化的,竞技比赛中,局势的变化导致的胜率变化。
迭代法:先利用手头少量数据做推测,甚至主观猜测一件事情的概率,然后收集新数据,不断调整对这个概率的估算
迭代法的常用方法就是“贝叶斯”。虽然有些事情没有数据,但可以给一个假设,也就是先验条件,在通过收集新数据,不断修正调整之前的预测
频率就是对发生概率的计算
在有做够多的数据的情况下,随机事件发生的频率会无限接近它的真实概率
概率法理解这个世界的逻辑:一个随机事件的发生,是存在一个真实的、客观的概率的。
雅各布·伯努利证明大数定律:只要试验的数据足够多,随机事件发生的频率就会无限接近它的概率。
精度误差:试验的数据在真实概率上下浮动的范围,抛硬币47%~53%之间的精度误差是3%
置信度:做一百组实验,如果有95组样本算出来的频率,正好在精读范围内,就称为95%置信度
这两个概念的发明,保证实用性,不用无限取样。现实世界无法达到数学上的理想效果,只能在保证精读和减少工作量之间做取舍
局部频率不是整体概率,不管局部如何随机,整体上平均的可能性还是极大
柯尔莫哥洛夫证明“强大数定律”
只有数据无限的情况下,随机发生的频率才等于其概率,但现实中没有无限,只有局部频率
当数据很少时,一个事件发生的频率与它的真实概率相差很大
整体不需要对通过补偿对局部产生作用,他只是稀释
抛一次硬币得正面,再抛20次,正反各10次。概率是51.2%对48.8。再抛2000次,正反各1000次,概率是50.02%对49.98。不需补偿,只需稀释,就能做到偏向真实概率。
整体通过均值回归对局部起作用。
均值回归:如果一个数据和他的正常状态偏差很大,那么它向正常状态回归的概率就会变大。
期望是对长期价值的数字化衡量
数学期望计算方式很简单,对随机事件不同结果的概率加权求平均
题目:股票50元一股,40%涨到60,30%不变,30%跌倒38,期望值怎么算
(60-50)*40%+(50-50)*30%+(38-50)*30%=0.4,期望值为正数,值得买
数学期望是对事件长期价值的数学化衡量
数学期望必须把结果数值化,只有这样才能计算
个体的数学期望值并不一样,一个有1个亿的人,不在乎一万块对其期望值低,,只有一万的人,对这一万块的期望值很高,这些都是现实生活中需要主题考量的。
方差描述数学期望的波动程度
同样是赚钱的生意,波动性低就稳赚不赔,波动性高,容易赔钱,是否被波动性高崩是个问题,长期做这个生意有难度。对资金量的要求太高
数学期望相同,不代表两件事的价值等同,随机结果的波动程度,对我们决策一定会产生影响
方差是随机结果围绕数学期望的波动范围
数学期望描述的是长期价值,所以无法反应这种波动性,但方差可以
方差计算:结果的值与数学期望之差的平方的均值
题目:方案一:投10万,稳赚5万,方案二,投10万,50%赚20万,50%亏10万。
方案一:100%*(50000-50000)^2=0
方案二:50%*(200000-50000)^2+50%*(-50000-100000)^2=2.25*10^10
标准差是方差的平方根,也可以描述波动性
方差的本质是对风险的度量
可以通过增加本金的方式对抗波动风险,不能下牌桌,游戏能继续下去,才有搏数学期望的可能。
扩大方差,可以提高刺激性,如彩票。反而有了些许魅力,让数学傻瓜能为之买单。
概率分布与随机变量
随机变量:把随机事件可能的结果抽象成一个数字,每个数字对应一个概率。这随机变化的数字,就是随机变量
把随机变量所有的结果和它对应的概率全部统计出来后,就有了概率分布
概率分布的作用:通过整体上描述一个随机事件所有可能的结果和对应的概率分布情况,我们就能像上帝俯瞰世界一样,从整体上把握这件事情的轮廓,也就为进一步探索提供了可能。
概率分布有规律可循,如身高和智商,整体分布情况相似。地震分布展现的规律虽然不同,但依然有规律
常见的概率分布模型:正态分布、泊松分布、幂律分布
一般情况下,对一个无法解释的现象,专家会先假设他服从某个概率分布模型,然后再去验证假设。
正态分布描述金融资产风险不可靠,肥尾的柯西分布更有效
概率分布向工具箱,概率分布模型就好比是工具箱的工具,不要选错。
正态分布的三个数学特性:均值就是期望值、极端值很少、标准差决定胖瘦
正态分布图曲线中间最高点的横坐标,不仅代表随机变量的平均值,而且还是它的数学期望值。
在正态分布中,平均值就代表随机事件的价值。
正态分布大多数都集中在平均值附近,极端值很少,也就是说出现的概率低,且対均值的影响很小。
有些时候能看见正态分布图胖瘦不同,那是因为使用了不同的标准差,标准差越大,数据的波动也越剧烈,钟形曲线也就矮胖。反之高瘦
中心极限定理的核心数学性质:大量独立的随机变量相加,无论各个随机变量的分布是怎样,他们相加的结果必定趋向于正态分布,正态分布是必然产生的。
中心极限定理是因,正态分布是果,因为中心极限定理的存在,所以正态分布必然正确。
正态分布建立了一套稳定的秩序,就像参照系,对所有的事物施加影响。
比如一个事件不服从正态分布,那么它一定不满足中心极限定理,通过这就能知道,要么他的影响因素不够多,或影响因子相互独立,或影响因素的影响力太大。
正态分布具有主宰性:
正态分布具有普遍性,有很多事情由多个因素共同作用的,恰恰满足了正态分布的核心数学性质。
所有分布最终都会变成正态分布,就算其他类型分布自己叠加自己,最终也会成为正态分布,所有分布,不是正态分布,就是在变成正态分布的路上。
正态分布是世界的宿命,信息论领域发现“熵最大原理”。正态分布恰恰是所有发布中,信息熵最大的一种分布,如果熵不断增加是孤立系统的演化方向,那么正态分布及时必然结果