【概率论基础】概率论的一些基础概念以及公式

概率论基础

  1. 不确定性的来源

    • 被建模系统内在的随机性:如量子力学的粒子动力学描述。
    • 不完全观测:不嫩观测到所有驱动系统行为的变量。
    • 不完全建模:进行假设简化时必须舍弃某些观测信息,舍弃的信息导致魔性的预测出现不确定性。
  2. 随机变量:X, Y。随机变量的取值:x,y,试验可能的结果

    概率密度函数 probability density function, PDF:描述连续性随机变量

    概率质量函数 probability mass function, PMF:描述离散型随机变量

    联合概率分布 joint probability distribution:多个变量的概率分布

    边缘概率分布 marginal probability distribution:已知一组变量的联合概率分布,求其中一个子集的概率分布。

  3. 条件概率 Conditional probability:某个事件在给定其他事件发生时出现的概率。 P ( y ∣ x ) = P ( x , y ) P ( x ) , P ( X < x ∣ Y = y ) = ∫ − ∞ x f ( x , y ) f ( y ) d x P(y|x)=\frac{P(x,y)}{P(x)}, P(XP(yx)=P(x)P(x,y),P(X<xY=y)=xf(y)f(x,y)dx

    条件概率的链式法则 P ( a , b , c ) = P ( a ∣ b , c ) P ( b ∣ c ) P ( c ) P(a,b,c)=P(a|b,c)P(b|c)P(c) P(a,b,c)=P(ab,c)P(bc)P(c)

    先验概率 prior probability P ( X ) P(X) P(X)事先根据已有的经验只是推断的概率。如硬币正反出现的概率为50%。

    后验概率 posterior probability P ( y ∣ x ) P(y|x) P(yx)在相关证据或给定条件下的概率。仨小偷,某个小偷去偷,村子失窃的概率。

    似然估计 Likelihood Estimate P ( x ∣ y ) P(x|y) P(xy)已知结果推测固有性质的可能性。村子失窃,是某个小偷的概率。

    全概率公式 Total Probability Theorem P ( y ) = ∑ x P ( y ∣ x ) P ( x ) P(y)=\sum_x P(y|x)P(x) P(y)=xP(yx)P(x) y:失窃 x:小偷,计算村子失窃的概率。由因导果。

    贝叶斯规则 Bayes’ rule P ( x ∣ y ) = P ( x ) P ( y ∣ x ) P ( y ) P(x|y)=\frac{P(x)P(y|x)}{P(y)} P(xy)=P(y)P(x)P(yx),村子失窃,计算是某个小偷的概率。即似然估计。执果索因。

    独立性和条件独立性 independent p ( x , y ) = p ( x ) p ( y ) p(x,y)=p(x)p(y) p(x,y)=p(x)p(y) p ( x , y ∣ z ) = p ( x ∣ z ) p ( y ∣ z ) p(x,y|z)=p(x|z)p(y|z) p(x,yz)=p(xz)p(yz)

    条件贝叶斯公式:三次变量 P ( x ∣ y , z ) = P ( y ∣ x , z ) P ( x ∣ z ) P ( y ∣ z ) = η P ( y ∣ x , z ) P ( x ∣ z ) P(x|y,z)=\frac{P(y|x,z)P(x|z)}{P(y|z)}=\eta P(y|x,z)P(x|z) P(xy,z)=P(yz)P(yx,z)P(xz)=ηP(yx,z)P(xz),推广并根据马尔科夫条件,x已知时 z t z_t zt z 1 : t z_{1:t} z1:t无关, P ( x ∣ z 1 : t ) = P ( z t ∣ x , z 1 : t − 1 ) P ( x ∣ z 1 : t − 1 ) P ( z n ∣ z 1 : t − 1 ) = P ( z n ∣ x ) P ( x ∣ z 1 : t − 1 ) P ( z n ∣ z 1 : t − 1 ) = η t P ( z t ∣ x ) P ( x ∣ z 1 : t − 1 ) P(x|z_{1:t})=\frac{P(z_t|x,z_{1:t-1})P(x|z_{1:t-1})}{P(z_n|z_{1:t-1})}=\frac{P(z_n|x)P(x|z_{1:t-1})}{P(z_n|z_{1:t-1})}=\eta_tP(z_t|x)P(x|z_{1:t-1}) P(xz1:t)=P(znz1:t1)P(ztx,z1:t1)P(xz1:t1)=P(znz1:t1)P(znx)P(xz1:t1)=ηtP(ztx)P(xz1:t1)

    条件联合概率公式 P ( x , y ∣ z ) = p ( x ∣ y , z ) p ( y ∣ z ) P(x,y|z)=p(x|y,z)p(y|z) P(x,yz)=p(xy,z)p(yz)

  4. 期望 expectation:离散期望值 E = ∑ x P ( x ) f ( x ) E =\sum_x P(x)f(x) E=xP(x)f(x),连续期望值 E = ∫ p ( x ) f ( x ) d x E=\int p(x)f(x)dx E=p(x)f(x)dx

    方差 Variance V a r ( f ( x ) ) = E [ ( f ( x ) − E ( f ( x ) ) 2 ] Var(f(x))=E[(f(x)-E(f(x))^2] Var(f(x))=E[(f(x)E(f(x))2]

    协方差 covariance:两个变量线性相关性的强度 C o v ( f ( x ) , g ( y ) ) = E [ ( f ( x ) − E [ f ( x ) ] ) ( g ( y ) − E [ g ( y ) ] ) ] Cov(f(x),g(y))=E[(f(x)-E[f(x)])(g(y)-E[g(y)])] Cov(f(x),g(y))=E[(f(x)E[f(x)])(g(y)E[g(y)])],绝对值大意味着变量值变化很大并且他们同时距离各自的均值很远。

    协方差矩阵 convariance matrix:是一个nxn矩阵, C o s ( x ) i , j = C o v ( x i , x j ) Cos(x)_{i,j}=Cov(x_i,x_j) Cos(x)i,j=Cov(xi,xj),其对角元是方差 C o v ( x i , x i ) = V a r ( x i ) Cov(x_i,x_i)=Var(x_i) Cov(xi,xi)=Var(xi)

  5. 高斯分布 Gaussian distribution/正态分布 normal distribution N ( x ; μ , σ 2 ) = 1 2 π σ 2 e x p ( − 1 2 σ 2 ( x − μ ) 2 ) N(x;\mu,\sigma^2)=\sqrt{\frac{1}{2\pi\sigma^2}}exp(-\frac{1}{2\sigma^2}(x-\mu)^2) N(x;μ,σ2)=2πσ21 exp(2σ21(xμ)2)

    多维正态分布 multivariate normal distribution N ( x ; μ , ∑ ) = 1 ( 2 π ) n d e t ( ∑ ) e x p ( − 1 2 ( x − μ ) T ∑   − 1 ( x − μ ) ) N(x;\mu,\sum)=\sqrt{\frac{1}{(2\pi)^ndet(\sum)}}exp(-\frac{1}{2}(x-\mu)^T\sum \ ^{-1}(x-\mu)) N(x;μ,)=(2π)ndet()1 exp(21(xμ)T 1(xμ))

你可能感兴趣的:(概率论)