统计学常见概率分布

1.离散型随机变量

E ( X ) = ∑ i = 1 n x i p i E(X)=\sum_{i=1}^{n}x_ip_i E(X)=i=1nxipi
D ( X ) = σ 2 = E ( X 2 ) − [ E ( X ) ] 2 D(X)=\sigma^2=E(X^2)-[E(X)]^2 D(X)=σ2=E(X2)[E(X)]2

1.1 二项分布

  • n n n个相同试验;
  • 每次试验只有2个可能的结果;
  • 出现“成功”的概率 p p p对每一次试验是相同的;
  • 试验相互独立;
  • 试验“成功”或“失败”可以计数;
    E ( X ) = n p E(X)=np E(X)=np
    D ( X ) = n p q D(X)=npq D(X)=npq
  • n = 1 n=1 n=1时, P { X = x } = p x q 1 − x P\{X=x\}=p^xq^{1-x} P{X=x}=pxq1x x = 0 , 1 x=0,1 x=0,1,即 0 − 1 0-1 01分布。

1.2 泊松分布

描述在一指定时间范围内或在指定的面积或体积内某一时间出现的次数的分布。
P ( X ) = λ x e − λ x ! , x = 0 , 1 , 2 , . . . P(X)=\frac{\lambda^xe^{-\lambda}}{x!},x=0,1,2,... P(X)=x!λxeλx=0,1,2,...
λ \lambda λ为给定时间间隔内时间的平均数。
E ( X ) = D ( X ) = λ E(X)=D(X)=\lambda E(X)=D(X)=λ


2. 连续型随机变量

P ( a < X < b ) = ∫ a b f ( x ) d x P(aP(a<X<b)=abf(x)dx
满足 f ( x ) > 0 f(x)>0 f(x)>0 ∫ − ∞ ∞ f ( x ) = 1 \int_{-\infty}^{\infty}f(x)=1 f(x)=1
E ( X ) = ∫ − ∞ ∞ x f ( x ) d x = μ E(X)=\int_{-\infty}^{\infty}xf(x)dx=\mu E(X)=xf(x)dx=μ
D ( X ) = ∫ − ∞ ∞ [ x − E ( X ) ] 2 f ( x ) d x = σ 2 D(X)=\int_{-\infty}^{\infty}[x-E(X)]^2f(x)dx=\sigma^2 D(X)=[xE(X)]2f(x)dx=σ2

2.1 正态分布

f ( x ) = 1 σ 2 π e − 1 2 σ 2 ( x − μ ) 2 , − ∞ < x < ∞ f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2\sigma^2}(x-\mu)^2},-\inftyf(x)=σ2π 1e2σ21(xμ)2,<x<
记作 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) XN(μ,σ2)
转化成标准正态分布 Z = X − μ σ ∼ N ( 0 , 1 ) Z=\frac{X-\mu}{\sigma}\sim N(0,1) Z=σXμN(0,1)

2.2 χ 2 \chi^2 χ2分布

  • 设随机变量 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn相互独立,且 X i ( i = 1 , 2 , . . . , n ) X_i(i=1,2,...,n) Xi(i=1,2,...,n)服从标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1),则它们的平方和 ∑ i = 1 n X i 2 \sum_{i=1}^{n}X_i^2 i=1nXi2服从自由度为 n n n χ 2 \chi^2 χ2分布。
  • 自由度 n n n——独立变量的个数。
  • E ( χ 2 ) = n E(\chi^2)=n E(χ2)=n D ( χ 2 ) = 2 n D(\chi^2)=2n D(χ2)=2n
  • 分布可加性 χ 1 2 + χ 2 2 = χ 2 ( n 1 + n 2 ) \chi_1^2+\chi_2^2=\chi^2(n_1+n_2) χ12+χ22=χ2(n1+n2)
    统计学常见概率分布_第1张图片

2.3 t t t分布

  • 设随机变量 X ∼ N ( 0 , 1 ) X\sim N(0,1) XN(0,1) Y ∼ χ 2 ( n ) Y\sim \chi^2(n) Yχ2(n),且 X X X Y Y Y独立,则
    t = X Y / n t=\frac{X}{\sqrt {Y/n}} t=Y/n X
    记为 t ( n ) t(n) t(n) n n n为自由度。
  • n ≥ 2 n\ge 2 n2时, t t t分布的数学期望 E ( t ) = 0 E(t)=0 E(t)=0
  • n ≥ 3 n\ge 3 n3时, D ( t ) = n n − 2 D(t)=\frac{n}{n-2} D(t)=n2n
  • n = 1 n=1 n=1时,为柯西分布;
  • n ≥ 30 n\ge 30 n30时,无限接近 N ( 0 , 1 ) N(0,1) N(0,1)
    统计学常见概率分布_第2张图片

2.4 F F F分布

  • 设随机变量 Y Y Y Z Z Z相互独立,且 Y Y Y Z Z Z分别服从自由度为 m m m n n n χ 2 \chi^2 χ2分布。
    X = Y / m Z / n = m Y m Z X=\frac{Y/m}{Z/n}=\frac{mY}{mZ} X=Z/nY/m=mZmY
    X X X服从第一自由度为 m m m,第二自由度为 n n n F F F分布,记为 F ( m , n ) F(m,n) F(m,n)
    E ( X ) = n n − 2 , n > 2 E(X)=\frac{n}{n-2},n>2 E(X)=n2nn>2
    D ( X ) = 2 n 2 ( m + n − 2 ) m ( n − 2 ) ( n − 4 ) , n > 4 D(X)=\frac{2n^2(m+n-2)}{m(n-2)(n-4)},n>4 D(X)=m(n2)(n4)2n2(m+n2)n>4
    统计学常见概率分布_第3张图片

你可能感兴趣的:(统计学,概率论,数据挖掘,算法)