007第二十五篇:统计学(2)—数据分散变异、预测神器贝叶斯定理

本周继续《深入浅出统计学》P85-216

分散性:

均值(μ)、中位数、众数都不足以度量数据之间存在的差异。于是出现了“距”的概念:

全距(极差)=P上-P下;

四分位距=P上四分位-P下四分位;

第n数的百分位距Pk=k(n/100)

接着出现“箱形图”直观表现:全距、四分位距、中位数相对位置。(图略)。

变异性

方差:σ*σ=[∑(x-μ)*(x-μ)]/n

标准差:σ

标准分:Z=(x-μ)/σ

基本概率:P(A)=n(A)/n(S)(数数的我也略)

大名鼎鼎的贝叶斯公式

我是这样理解的:条件B成立的情况下事件A的概率→推导出→条件A成立时事件B发生的概率。最简单的预测神器啊,这两年不知道听了多少次但是头脑一片空白,早就记不起来原来工程数学讲过的。

基本公式:P(A∩B)=P(B)P(A│B)

P(B)=P(A∩B)+P(A`∩B)

贝叶斯公式:P(A│B)=P(A)P(B│A)/[ P(A)P(B│A)+P(A`)P(B│A`)]

在实际当中非常有用。比如,互联网中过滤垃圾电子邮件,医学实验中药效、患病概率。

其他:独立事件、互斥事件、相关事件概念区别、概率树应用

期望:E(X)=∑xP(X=x)。

概率分布方差:Var(X)=E【(x-μ)(x-μ)】

=∑【(x-μ)(x-μ)】P(X=x)

你可能感兴趣的:(007第二十五篇:统计学(2)—数据分散变异、预测神器贝叶斯定理)