概率论与数理统计 Chapter3. 随机变量的数字特征

  • 概率论与数理统计 Chapter3. 随机变量的数字特征
    • 1. 重要定义 & 定理
      • 1. 数学期望(均值)
        • 1. 定义
        • 2. 性质
      • 2. 中位数
      • 3. 方差 & 标准差
        • 1. 定义
        • 2. 性质
      • 4. 协方差 & 相关系数
        • 1. 协方差
        • 2. 相关系数
      • 5. 大数定理
        • 1. 大数定理
        • 2. 马尔可夫不等式
        • 3. 切比雪夫不等式
      • 6. 中心极限定理
        • 1. 林德伯格-莱维定理
        • 2. 棣莫弗-拉普拉斯定理
    • 2. 几种典型分布
      • 1. 二项分布
        • 1. 均值
        • 2. 方差
      • 2. 泊松分布
        • 1. 均值
        • 2. 方差
      • 3. 均匀分布
        • 1. 均值
        • 2. 方差
        • 3. 中位数
      • 4. 指数分布
        • 1. 均值
        • 2. 方差
      • 5, 正态分布
        • 1. 均值
        • 2. 方差
        • 3. 中位数
      • 6. 自由度为n的卡方分布 χ n 2 \chi_n^2 χn2
        • 1. 均值
        • 2. 方差
      • 7. 自由度为n的学生分布 t n ( x ) t_n(x) tn(x)
        • 1. 均值
        • 2. 方差
      • 8. 自由度为m,n的F分布 f m n ( x ) f_{mn}(x) fmn(x)
        • 1. 均值
        • 2. 方差

1. 重要定义 & 定理

1. 数学期望(均值)

1. 定义

  1. 离散变量的数学期望

    • 设随机变量X的取值范围为 a 1 , . . . , a n a_1, ..., a_n a1,...,an,其对应的概率分布为 P ( X = a i ) = p i P(X = a_i) = p_i P(X=ai)=pi,则X的数学期望 E ( X ) E(X) E(X)(或记为 E X EX EX)定义为:

      E ( X ) = ∑ i = 1 n a i p i E(X) = \sum_{i=1}^n a_i p_i E(X)=i=1naipi

  2. 无限级数的数学期望

    • 设随机变量X的取值范围为 a 1 , a 2 , . . . a_1, a_2, ... a1,a2,...,其对应的概率分布为 P ( X = a i ) = p i P(X = a_i) = p_i P(X=ai)=pi,且满足 ∑ i = 1 ∞ ∣ a i ∣ p i < ∞ \sum_{i=1}^{\infty} |a_i|p_i < \infty i=1aipi<,则变量X存在数学期望,且其数学期望表达式与上述离散分布相同,即:

      E ( X ) = ∑ i = 1 ∞ a i p i E(X) = \sum_{i=1}^{\infty} a_i p_i E(X)=i=1aipi

  3. 连续变量的数学期望

    • 设X有概率密度函数 f ( x ) f(x) f(x),如果 ∫ − ∞ ∞ ∣ x ∣ f ( x ) d x < ∞ \int_{-\infty}^{\infty} |x|f(x)dx < \infty xf(x)dx<,则X存在数学期望,其数学期望表达式为:

      E ( X ) = ∫ − ∞ ∞ x f ( x ) d x E(X) = \int_{-\infty}^{\infty} xf(x)dx E(X)=xf(x)dx

2. 性质

  1. 若干个随机变量之和的期望等于他们各自的期望之和,即:

    E ( X 1 + . . . + X n ) = E ( X 1 ) + . . . + E ( X n ) E(X_1 + ... + X_n) = E(X_1) + ... + E(X_n) E(X1+...+Xn)=E(X1)+...+E(Xn)

  2. 若干个独立随机变量之积的期望等于他们各自的期望之积,即:

    E ( X 1 X 2 . . . X n ) = E ( X 1 ) E ( X 2 ) . . . E ( X n ) E(X_1X_2...X_n) = E(X_1)E(X_2)...E(X_n) E(X1X2...Xn)=E(X1)E(X2)...E(Xn)

  3. 随机变量函数的期望可以表示为:

    1. 离散型

      E ( g ( X ) ) = ∑ i g ( a i ) p i E(g(X)) = \sum_i g(a_i)p_i E(g(X))=ig(ai)pi

    2. 连续型

      E ( g ( X ) ) = ∫ − ∞ ∞ g ( x ) f ( x ) d x E(g(X)) = \int_{-\infty}^{\infty} g(x) f(x) dx E(g(X))=g(x)f(x)dx

  4. 如果 c c c为一个常数,则:

    E ( c ⋅ X ) = c ⋅ E ( X ) E(c\cdot X) = c \cdot E(X) E(cX)=cE(X)

2. 中位数

  • 设连续型随机变量X的分布函数为 F ( x ) F(x) F(x),则满足条件 P ( X ≤ m ) = F ( m ) = 1 / 2 P(X \leq m) = F(m) = 1/2 P(Xm)=F(m)=1/2的数m成为X或者分布F的中位数。

3. 方差 & 标准差

1. 定义

  • X X X为随机变量,分布为 F F F,则定义
    V a r ( X ) = E ( X − E X ) 2 = E ( X 2 ) − E X 2 Var(X) = E(X - EX)^2 = E(X^2) - EX^2 Var(X)=E(XEX)2=E(X2)EX2
    称为 X X X(或者分布F)的方差,其平方根 V a r ( X ) \sqrt{Var(X)} Var(X) 称为 X X X(或者分布 F F F)的标准差。

推广:的定义

  • X X X为随机变量, c c c为常数, k k k为正整数,则定义 E [ ( X − c ) k ] E[(X-c)^k] E[(Xc)k]称为 X X X关于 c c c点的 k k k阶矩。
    • c = 0 c=0 c=0,则称 a k = E ( X k ) a_k = E(X^k) ak=E(Xk) X X X k k k阶原点矩,特别的,一阶原点矩就是期望;
    • c = E X c=EX c=EX,这时 μ k = E [ ( X − E X ) k ] \mu_k=E[(X-EX)^k] μk=E[(XEX)k]称为 X X X k k k阶重心矩,特别的,一阶中心矩为常数0,二阶中心矩即为方差;

2. 性质

  1. 常数的方差为0;
  2. 若C为常数,则 V a r ( X + C ) Var(X+C) Var(X+C) = Var(X);
  3. 若C为常数,则 V a r ( C X ) = C 2 ⋅ V a r ( X ) Var(CX) = C^2 \cdot Var(X) Var(CX)=C2Var(X);
  4. 独立随机变量之和的方差等于各变量方差之和:
    V a r ( X 1 + . . . + X n ) = V a r ( X 1 ) + . . . + V a r ( X n ) Var(X_1 + ... + X_n) = Var(X_1) + ... + Var(X_n) Var(X1+...+Xn)=Var(X1)+...+Var(Xn)

4. 协方差 & 相关系数

1. 协方差

考察两个一维随机变量 X , Y X, Y X,Y,假设:

E X = m 1 , E Y = m 2 , V a r ( X ) = σ 1 2 , V a r ( Y ) = σ 2 2 EX = m_1, EY = m_2, Var(X) = \sigma_1^2, Var(Y) = \sigma_2^2 EX=m1,EY=m2,Var(X)=σ12,Var(Y)=σ22

则我们有定义:

  • E [ ( X − m 1 ) ( Y − m 2 ) ] E[(X-m_1)(Y-m_2)] E[(Xm1)(Ym2)]为X和Y的协方差,记作 C o v ( X , Y ) Cov(X, Y) Cov(X,Y)

我们有性质:

  1. 若X和Y独立,则 C o v ( X , Y ) = 0 Cov(X,Y)=0 Cov(X,Y)=0;
  2. C o v ( X , Y ) 2 ≤ σ 1 2 σ 2 2 Cov(X, Y)^2 \leq \sigma_1^2 \sigma_2^2 Cov(X,Y)2σ12σ22,等号当且仅当X和Y满足严格的线性关系(即 Y = a X + b Y = aX+b Y=aX+b)时成立;

2. 相关系数

在上述协方差的基础上,我们可以定义相关系数如下:

  • 定义相关系数 C o r r ( X , Y ) = C o v ( X , Y ) / ( σ 1 σ 2 ) Corr(X, Y) = Cov(X, Y) / (\sigma_1 \sigma_2) Corr(X,Y)=Cov(X,Y)/(σ1σ2).

同样的,有性质:

  1. X , Y X, Y X,Y独立,则 C o r r ( X , Y ) = 0 Corr(X,Y) = 0 Corr(X,Y)=0
  2. ∣ C o r r ( X , Y ) ∣ ≤ 1 |Corr(X, Y)| \leq 1 Corr(X,Y)1,且等号当且仅当X和Y存在严格线性关系时取到。

5. 大数定理

1. 大数定理

  • X 1 , X 2 , . . . , X n , . . . X_1, X_2, ..., X_n, ... X1,X2,...,Xn,...是独立同分布的随机变量,记它们的公共均值为 a a a,方差为 σ 2 \sigma^2 σ2,则对任意给定的 ϵ > 0 \epsilon > 0 ϵ>0,有:
    l i m n → ∞ P ( ∣ X n ˉ − a ∣ ≥ ϵ ) = 0 {lim}_{n \to \infty} P(|\bar{X_n} - a| \geq \epsilon) = 0 limnP(Xnˉaϵ)=0

用直白的语言来说:

  • 就是当重复实验足够多时,频率总能够无限趋近于概率

2. 马尔可夫不等式

  • 若Y为只取非负值的随机变量,则对于任意常数 ϵ > 0 \epsilon > 0 ϵ>0,有:
    P ( Y ≥ ϵ ) ≤ E ( Y ) / ϵ P(Y \geq \epsilon) \leq E(Y) / \epsilon P(Yϵ)E(Y)/ϵ

3. 切比雪夫不等式

  • V a r ( X ) Var(X) Var(X)存在,则:
    P ( ∣ Y − E Y ∣ ≥ ϵ ) ≤ V a r ( Y ) / ϵ 2 P(|Y-EY| \geq \epsilon) \leq Var(Y) / \epsilon^2 P(YEYϵ)Var(Y)/ϵ2

6. 中心极限定理

中心极限定理是一系列定理的集合,整体来说就是一系列独立同分布的变量之和满足正态分布

1. 林德伯格-莱维定理

  • X 1 , X 2 , . . . , X n , . . . X_1, X_2, ..., X_n, ... X1,X2,...,Xn,...为独立同分布的随机变量, E ( X i ) = a , V a r ( X i ) = σ 2 E(X_i) = a, Var(X_i) = \sigma^2 E(Xi)=a,Var(Xi)=σ2,则对任意实数 x x x有:
    l i m n → ∞ P ( 1 n σ ( X 1 + . . . + X n − n a ) ≤ x ) = Φ ( x ) lim_{n\to \infty} P(\frac{1}{\sqrt{n}\sigma}(X_1 + ... + X_n - na) \leq x) = \Phi(x) limnP(n σ1(X1+...+Xnna)x)=Φ(x)
    其中 Φ ( x ) \Phi(x) Φ(x)是标准正态分布 N ( 0 , 1 ) N(0, 1) N(0,1)的分布函数,即 Φ ( x ) = 1 2 π ∫ − ∞ x e − t 2 / 2 d t \Phi(x) = \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{x}e^{-t^2/2}dt Φ(x)=2π 1xet2/2dt

2. 棣莫弗-拉普拉斯定理

  • X 1 , X 2 , . . . , X n , . . . X_1, X_2, ..., X_n, ... X1,X2,...,Xn,...独立同分布, X i X_i Xi为二次分布,即 P ( X i = 1 ) = p , P ( X i = 0 ) = 1 − p P(X_i=1) = p, P(X_i=0)=1-p P(Xi=1)=p,P(Xi=0)=1p,则对于任意实数 x x x,有:
    l i m n → ∞ P ( 1 n p ( 1 − p ) ( X 1 + . . . + X n − n p ) ≤ x ) = Φ ( x ) lim_{n\to \infty} P(\frac{1}{\sqrt{np(1-p)}} (X_1 + ... + X_n - np) \leq x) = \Phi(x) limnP(np(1p) 1(X1+...+Xnnp)x)=Φ(x)

本质上来说这个算是上方林德伯格-莱维定理的一个实例。

2. 几种典型分布

1. 二项分布

P ( x = i ; n , p ) = C n i ⋅ p i ⋅ ( 1 − p ) n − i P(x=i; n,p) = C_{n}^{i} \cdot p^i \cdot (1-p)^{n-i} P(x=i;n,p)=Cnipi(1p)ni

1. 均值

E ( X ) = n p E(X) = np E(X)=np

类似的,对于负二项分布 P ( x = k ; r , p ) = C k + r − 1 r − 1 ⋅ p r ⋅ ( 1 − p ) k P(x=k; r,p) = C_{k+r-1}^{r-1} \cdot p^r \cdot (1-p)^{k} P(x=k;r,p)=Ck+r1r1pr(1p)k,同样可以计算其均值为:

E ( X ) = r 1 − p p E(X) = r\frac{1-p}{p} E(X)=rp1p

2. 方差

V a r ( x ) = n p ( 1 − p ) Var(x) = np(1-p) Var(x)=np(1p)

2. 泊松分布

P ( x = i ) = e − λ ⋅ λ i / i ! P(x=i) = e^{-\lambda} \cdot \lambda^i / i! P(x=i)=eλλi/i!

1. 均值

E ( X ) = λ E(X) = \lambda E(X)=λ

2. 方差

V a r ( X ) = λ Var(X) = \lambda Var(X)=λ

3. 均匀分布

f ( x ) = 1 / ( b − a ) f(x) = 1/(b-a) f(x)=1/(ba)

1. 均值

E ( X ) = a + b 2 E(X) = \frac{a+b}{2} E(X)=2a+b

2. 方差

V a r ( X ) = ( b − a ) 2 / 12 Var(X) = (b-a)^2/12 Var(X)=(ba)2/12

3. 中位数

m = a + b 2 m = \frac{a+b}{2} m=2a+b

4. 指数分布

f ( x ) = λ ⋅ e − λ x f(x) = \lambda \cdot e^{-\lambda x} f(x)=λeλx

1. 均值

E ( X ) = 1 / λ E(X) = 1/\lambda E(X)=1/λ

2. 方差

V a r ( X ) = 1 / λ 2 Var(X) = 1/\lambda^2 Var(X)=1/λ2

5, 正态分布

f ( x ) = 1 2 π ⋅ σ ⋅ e x p ( − ( x − μ ) 2 2 σ 2 ) f(x) = \frac{1}{\sqrt{2\pi} \cdot \sigma} \cdot exp(-\frac{(x-\mu)^2}{2\sigma^2}) f(x)=2π σ1exp(2σ2(xμ)2)

1. 均值

E ( X ) = μ E(X) = \mu E(X)=μ

2. 方差

V a r ( X ) = σ 2 Var(X) = \sigma^2 Var(X)=σ2

3. 中位数

m = μ m=\mu m=μ

6. 自由度为n的卡方分布 χ n 2 \chi_n^2 χn2

k n ( x ) = 1 Γ ( n / 2 ) 2 n / 2 e − x / 2 x ( n − 2 ) / 2 k_n(x) = \frac{1}{\Gamma(n/2) 2^{n/2}}e^{-x/2}x^{(n-2)/2} kn(x)=Γ(n/2)2n/21ex/2x(n2)/2

1. 均值

E ( X ) = n E(X) = n E(X)=n

2. 方差

V a r ( X ) = 2 n Var(X) = 2n Var(X)=2n

7. 自由度为n的学生分布 t n ( x ) t_n(x) tn(x)

t n ( x ) = Γ ( ( n + 1 ) / 2 ) n π Γ ( n / 2 ) ( 1 + x 2 n ) − n + 1 2 t_n(x) = \frac{\Gamma((n+1)/2)}{\sqrt{n\pi} \Gamma(n/2)} (1+ \frac{x^2}{n})^{-\frac{n+1}{2}} tn(x)=nπ Γ(n/2)Γ((n+1)/2)(1+nx2)2n+1

1. 均值

E ( X ) = 0 E(X) = 0 E(X)=0

2. 方差

V a r ( X ) = n n − 2 Var(X) = \frac{n}{n-2} Var(X)=n2n

8. 自由度为m,n的F分布 f m n ( x ) f_{mn}(x) fmn(x)

f m n ( x ) = m m / 2 n n / 2 Γ ( ( m + n ) / 2 ) Γ ( m / 2 ) Γ ( n / 2 ) x m / 2 − 1 ( m x + n ) − ( m + n ) / 2 f_{mn}(x) = m^{m/2} n^{n/2} \frac{\Gamma((m+n)/2)}{\Gamma(m/2)\Gamma(n/2)} x^{m/2-1}(mx+n)^{-(m+n)/2} fmn(x)=mm/2nn/2Γ(m/2)Γ(n/2)Γ((m+n)/2)xm/21(mx+n)(m+n)/2

1. 均值

E ( X ) = n n − 2 E(X) = \frac{n}{n-2} E(X)=n2n

2. 方差

V a r ( X ) = 2 n 2 ( n + m − 2 ) m ( n − 2 ) 2 ( n − 4 ) Var(X) = \frac{2n^2(n+m-2)}{m(n-2)^2(n-4)} Var(X)=m(n2)2(n4)2n2(n+m2)

你可能感兴趣的:(基础数学,概率论,机器学习,人工智能,数理统计,统计分布)