《林超》概率统计学模型

贝叶斯:

贝叶斯公式:后验概率P(A丨B)= 【似然度P(B丨A)* 基础概率P(A) 】/新证据P(B) 。核心思维在于根据已经发生的事情不断更新概率模型,修正认知。

公式简化下:最终概率=初始概率*调整系数

1、初始概率就是我们最初在信息不完全的情况下做出的一个估计概率。有主观因素,是根据以往常识计算。我们不需要知道每个事情的基础概率具体是多少,只需要有个量级的判断力就行,就跟咨询拍数一样。现实生活中很多事情是基础概率决定成败,而不是努力程度 ,所以选择大于努力。

2、调整系数就是指后面我们收集信息后对初始概率的调整。

3、后验概率:“后验”顾名思义“经验之后”,也就是调整后的概率,后验概率比较接近真实概率,是我们做决策时的主要依据。

贝叶斯事实:指那些会对事物的发展或性质产生重大影响的事实,它们能帮助我们更新原有的认知。记录事实而非观点。事实是世界上最强大的东西,你只要每天把自己的脑子泡在事实里面,你很容易就会变成一个有智慧的人。如果一条信息对你来说很重要,不妨先后退一步,审视一下:文章里面有哪些事实?有无来源?是否可靠?是否有立场?慢慢锻炼这种能力,直到把它变成一种本能,一种内化的习惯。许多人对信息的接收,其实本质上不过是在「找认同」罢了。

贝叶斯思维:“大胆假设,小心求证,不断调整,快速迭代”的思维模式。它强调先行动起来,用动态调整的方法,让我们能够跟上现实的变化速度,并做出准确的预测。

贝叶斯大脑:将贝叶斯思维和贝叶斯事实结合,我们将获得贝叶斯大脑。贝叶斯大脑:看穿表达,看到事实,理性决策。大脑根据输入信息和模型,对于世界作出概率推断,并计算可能性最大的情况。因此,大脑不是在被动等待外界输入信息,而是在主动地构建关于这个世界的假设,并用假设来解释世界。因此,有些专家认为,人类的思考是一种“受控的幻想”。

多数人没有贝叶斯大脑的,遇事不过是条件反射。因为人们不是在选择事实,而是在选择对事实的描述,人的记忆也是人为主观加工而成的。

均值与异常值 

异常值:与平均值偏差大于两倍标准差的数据。

处理方式包括:舍弃、一视同仁、单独研究。

要结合贝叶斯公式,对黑天鹅事件关注。

大数定律

大数定律:如果统计数据足够大,那么事物出现的概率就无限接近他的期望值。不确定性中寻找确定下。

在小数据阶段,大道理可能毫无参考价值,多去尝试总结经验这也是反思和复盘的重要性,不断获取新的信息更新先验概论,让结果更准确。

概率分布

常用概率分布包括:【幂律分布】【正态分布】【泊松分布】。

幂律power law表示的是两个量之间的函数关系,其中一个量的相对变化会导致另一个量的相应幂次比例的变化,且与初值无关:表现为一个量是另一个量的幂次方。例如,正方形面积与边长的关系,如果长度扩大到两倍,那么面积扩大到四倍。

幂函数:y=x^a(a为有理数)

指数函数:y=a^x(a为常数且以a>0,a≠1)

幂律分布:是一种概率分布,假设变量x服从参数为α的幂律分布,则其概率密度函数可以表示为:概率密度函数为f(x)=cx^-a-1(x→∞)

幂律分布也有很多其他的形式,例如“长尾”分布也是幂律分布的一种。

在幂律分布中,事件发生的概率与事件大小的某个负指数成比例。也就是事件越大,发生的可能性越小。

只要有自组织存在的地方,就有幂律分布出现。

常见的幂律分布有齐普夫定律、二八法则、长尾效应、马太效应、强者通吃等。齐普夫定律:事件的等级排列序号乘以它的大小等于常数,也就是事件等级×事件大小=常数。

商业模型有幂律分布和正态分布,其本质在于边际时间是否为零。边际时间为零就能实现幂律分布,你可以不花成本,通过产品来创造更多财富。相反边际时间不能减少明显的服务,只能创造正态分布,让大家归于平庸,不过这却能保证我们的基本盘,也是大多数人的最终选择。

正态分布

        ●  标准差:标准差能反映一个数据集的离散程度。

        ●  方差:方差=标准差的平方。代表结果的离散度,也代表一个人发挥的稳定性

        ●  方差+偏差启发:避免做一个愚蠢而坚定的人--->迈向坚定并聪明的人。年轻时通常眼界局限,对世界的理解有偏颇,易陷入坚定愚蠢状态--->需要开放心态变成不坚定愚蠢的人,做加法,拥抱更多新证据,接纳很多异常值--->发现更加聪明的与世界相处的方法,调整自己进入不坚定的聪明状态--->做减法,逐渐集中在最能发挥自己能力的区间产生价值

泊松分布

二项分布,成功次数X的概率分布

因为二项分布的X的期望值为 μ =np,μ代表n次试验中成功次数k的期望值,本例中就是每天来包子铺顾客人数的期望值。只要多统计几天的顾客人数做算术平均,即得。

令p =μ/n,n→∞,经数学变化后,上式变成下式:

适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数,电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数、激光的光子数分布等等。

你可能感兴趣的:(《林超》概率统计学模型)