概率分布与数据建模

概率分布与数据建模_第1张图片

一、概率的基本概念

概率的规则与公式

事件:来自某个样本空间中一个或多个结果的集合。

条件概率:已知事件B为真实或者事件B发生的条件下,事件A发生的概率。

二、随机变量和概率分布

离散的随机变量:可以计数的可能的结果的数字

连续的随机变量:连续的随机变量拥有的结果,处在实数的一个或多个连续区间之中。

三、离散的概率分布概率

质量函数f(x)

累积分布函数F(x)

离散随机变量的期望值E(x)

在决策中使用期望值离散随机变量的方差Var(X)

伯努利分布:一种离散分布,有两种可能的结果。1表示成功,出现的概率为p,其中0

期望:E(X)=p。

方差:var(X)=p(1-p)。

二项式分布(Binomial Distribution):,即重复n次的伯努利试验(Bernoulli Experiment),用ξ表示随机试验的结果。记做:ξ~B(n,p)

期望:Eξ=np

方差:Dξ=npq    其中q=1-p

泊松分布:参数λ是单位时间(或单位面积)内随机事件的平均发生率。 泊松分布适合于描述单位时间内随机事件发生的次数。

期望:λ

方差:λ

四、连续概率分布

概率密度函数的性质:

1、f(x)>=0.

2、概率之和为1

3、p(X=x)=0

4、只能在区间上定义连续随机变量的概率。

5、p(a<=X<=b)就是a和b与密度函数之间的面积。

均匀分布:

(1) 如果,则称X服从离散的均匀分布。


概率分布与数据建模_第2张图片


(2) 设连续型随机变量X的概率密度函数为则称随机变量X服从[a,b]上的均匀分布,记为X~U(a,b)。


期望:    即数学期望位于区间(a,b)的中间。

方差:

密度函数:

累积分布函数:

概率分布与数据建模_第3张图片

正态分布

正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A.棣莫弗在求二项分布的渐近公式中得到。

正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。

若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。

其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。

当μ = 0,σ = 1时的正态分布是标准正态分布。

函数NORM.INV

标准正态分布

期望值μ=0,即曲线图象对称轴为Y轴,标准差σ=1条件下的正态分布,记为N(0,1)。

指数分布:即每单位时间内发生某事件的次数。指数分布的区间是[0,∞)。 如果一个随机变量X呈指数分布,则可以写作:X~ E(λ)。

期望值:1/λ

方差:(1/λ)^2

连续分布:对数正态分布、贝塔分布

五、从概率分布中随机抽样

从离散概率分布中抽样:

从常见的概率分布中抽样

Risk Solver Platform分布函


概率分布与数据建模_第4张图片

六、数据建模和分布拟合

拟合优度

用Risk Solver Platform进行分布

拟合

你可能感兴趣的:(概率分布与数据建模)