概率论 —— 随机变量的数字特征

文章目录

  • 一、一维随机变量的数字特征
    • 1. 数学期望
      • (1)概念定义
      • (2)说明
      • (3)性质
    • 2. 方差、标准差
      • (1)概念
      • (2)性质
    • 3. 切比雪夫不等式
  • 二、二维随机变量的数字特征
    • 1. 数学期望
    • 2. 协方差与相关系数
      • (1)概念
      • (2) 性质
      • (3)深入理解协方差
  • 三、独立性与相关性的判定

一、一维随机变量的数字特征

1. 数学期望

(1)概念定义

  • 如果 X X X离散型随机变量,其分布列为 p i = P { X = x i } ( i = 1 , 2 , . . . ) p_i = P\{X=x_i\}(i=1,2,...) pi=P{X=xi}(i=1,2,...) Y Y Y X X X 的函数, Y = g ( X ) Y = g(X) Y=g(X)

    • 若级数 ∑ i = 1 ∞ x i p i \sum\limits_{i=1}^\infin x_ip_i i=1xipi绝对收敛,则称随机变量 X X X 的数学期望存在,并将级数和 ∑ i = 1 ∞ x i p i \sum\limits_{i=1}^\infin x_ip_i i=1xipi 称为随机变量的数学期望,记为 E ( X ) 或 E X E(X) 或 EX E(X)EX,即 E ( X ) = ∑ i = 1 ∞ x i p i E(X) = \sum\limits_{i=1}^\infin x_ip_i E(X)=i=1xipi 否则称 X X X 的数学期望不存在;
    • 若级数 ∑ i = 1 ∞ g ( x i ) p i \sum\limits_{i=1}^\infin g(x_i)p_i i=1g(xi)pi 绝对收敛,则称 Y = g ( x ) Y = g(x) Y=g(x) 的数学期望 E [ g ( X ) ] E[g(X)] E[g(X)] 存在,且 E [ g ( X ) ] = ∑ i = 1 ∞ g ( x i ) p i E[g(X)] = \sum\limits_{i=1}^\infin g(x_i)p_i E[g(X)]=i=1g(xi)pi,否则称 g ( X ) g(X) g(X) 的数学期望不存在
  • 如果 X X X连续型随机变量,其概率密度为 f ( x ) f(x) f(x) Y Y Y X X X 的函数, Y = g ( X ) Y = g(X) Y=g(X)

    • 若积分 ∫ − ∞ + ∞ x f ( x ) d x \int_{-\infin}^{+\infin} xf(x)dx +xf(x)dx 绝对收敛,则称 X X X 的数学期望存在,且 E X = ∫ − ∞ + ∞ x f ( x ) d x EX=\int_{-\infin}^{+\infin} xf(x)dx EX=+xf(x)dx,否则称 X X X 的数学期望不存在。

    • 若积分 ∫ − ∞ + ∞ g ( x ) f ( x ) d x \int_{-\infin}^{+\infin} g(x)f(x)dx +g(x)f(x)dx 绝对收敛,则称 g ( X ) g(X) g(X) 的数学期望存在,且 E [ g ( X ) ] = ∫ − ∞ + ∞ g ( x ) f ( x ) d x E[g(X)]=\int_{-\infin}^{+\infin} g(x)f(x)dx E[g(X)]=+g(x)f(x)dx,否则称 g ( X ) g(X) g(X) 的数学期望不存在。

(2)说明

  • 数学期望又称为概率平均值,常常简称 期望均值数学期望是描述随机变量平均取值状况特征的指标,它刻画随机变量的一切可能值的集中位置
  • 在数学期望的定义中要求级数(或积分)绝对收敛,否则称期望不存在。这是因为 X X X 的期望存在要求与 X X X 的取值顺序无关,即要求任意改变 x i x_i xi 的次序不应改变 E X EX EX 的存在性,这在数学上就要求级数(或积分)绝对收敛,况且绝对收敛又有很多性质也便于数学上的处理。

(3)性质

  1. 对任意常数 a a a 和随机变量 X i ( i = 1 , 2 , . . . , n ) X_i(i=1,2,...,n) Xi(i=1,2,...,n) E ( ∑ i = 1 n a i X i ) = ∑ i = 1 n a i E X i E(\sum \limits_{i=1}^na_iX_i) = \sum \limits_{i=1}^na_i EX_i E(i=1naiXi)=i=1naiEXi

    1. E c = c Ec = c Ec=c
    2. E ( a X + c ) = a E X + c E(aX+c) = aEX+c E(aX+c)=aEX+c
    3. E ( X ± Y ) = E X ± E Y E(X\pm Y) = EX \pm EY E(X±Y)=EX±EY
  2. X X X Y Y Y 相互独立,则

    1. E ( X Y ) = E X ⋅ E Y E(XY) = EX ·EY E(XY)=EXEY
    2. E [ g 1 ( X ) ⋅ g 2 ( Y ) ] = E [ g 1 ( X ) ] ⋅ E [ g 2 ( Y ) ] E[g_1(X) · g_2(Y)] = E[g_1(X)] · E[g_2(Y)] E[g1(X)g2(Y)]=E[g1(X)]E[g2(Y)]
  3. 一般地,设 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn 相互独立,则

    1. E ( ∏ i = 1 n X i ) = ∏ i = 1 n E X i E(\prod\limits_{i=1}^nX_i) = \prod\limits_{i=1}^n EX_i E(i=1nXi)=i=1nEXi
    2. E [ ∏ i = 1 n g i ( X i ) ] = ∏ i = 1 n E [ g i ( X i ) ] E[\prod\limits_{i=1}^n g_i(X_i)] = \prod\limits_{i=1}^n E[g_i(X_i)] E[i=1ngi(Xi)]=i=1nE[gi(Xi)]

2. 方差、标准差

(1)概念

  1. 方差:设 X X X 是随机变量,如果 E [ ( X − E X ) 2 ] E[(X-EX)^2] E[(XEX)2] 存在,则称 E [ ( X − E X ) 2 ] E[(X-EX)^2] E[(XEX)2] X X X 的方差,记为 D X DX DX Var ( X ) \text{Var}(X) Var(X),即

    D X = E [ ( X − E X ) 2 ] = E ( X 2 ) − ( E X ) 2 DX = E[(X-EX)^2] = E(X^2)-(EX)^2 DX=E[(XEX)2]=E(X2)(EX)2

  2. 标准差:称 D X \sqrt{DX} DX X X X 的标准差或均方差,记为 σ ( X ) \sigma(X) σ(X)

  3. 标准化随机变量:称随机变量 X ∗ = X − E X D X X^* = \frac{X-EX}{\sqrt{DX}} X=DX XEX X X X 的标准化随机变量,有 E X ∗ = 0 , D X ∗ = 1 EX^* = 0,DX^*=1 EX=0,DX=1

(2)性质

  1. D X ≥ 0 , E ( X 2 ) = D X + ( E X ) 2 ≥ ( E X ) 2 DX \geq 0,E(X^2) = DX+(EX)^2 \geq (EX)^2 DX0,E(X2)=DX+(EX)2(EX)2
  2. D c = 0 Dc=0 Dc=0 (c为常数)
  3. D ( a X + b ) = a 2 D X D(aX+b) = a^2DX D(aX+b)=a2DX
  4. D ( X ± Y ) = D X + D Y + 2 C o v ( X , Y ) D(X \pm Y) = DX+DY+2Cov(X,Y) D(X±Y)=DX+DY+2Cov(X,Y)
  5. X X X Y Y Y 相互独立,则
    D ( a X + b Y ) = a 2 D X + b 2 D Y D(aX+bY) = a^2DX + b^2DY D(aX+bY)=a2DX+b2DY
    一般地,如果 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn 相互独立, g i ( x ) g_i(x) gi(x) x x x 的连续函数,则
    D ( ∑ i = 1 n a i X i ) = ∑ i = 1 n a i 2 D X i ​ D [ ∑ i = 1 n g i ( X i ) ] = ∑ i = 1 n D [ g i ( X i ) ] D(\sum\limits_{i=1}^n a_iX_i) = \sum\limits_{i=1}^n a_i^2DX_i \\ ​ D[\sum\limits_{i=1}^n g_i(X_i)] = \sum\limits_{i=1}^n D[g_i(X_i)] D(i=1naiXi)=i=1nai2DXiD[i=1ngi(Xi)]=i=1nD[gi(Xi)]

3. 切比雪夫不等式

  • 如果随机变量 X X X 的方差 D X DX DX 存在,则对任意 ϵ > 0 \epsilon>0 ϵ>0,有

    P { ∣ X − E X ∣ ≥ ϵ } ≤ D X ϵ 2 P\{|X-EX|\geq\epsilon\} \leq \frac{DX}{\epsilon^2} P{XEXϵ}ϵ2DX

  • 由切比雪夫不等式知,当 D X DX DX 愈小时,概率 P { ∣ X − E X ∣ < ϵ } P\{|X-EX|<\epsilon\} P{XEX<ϵ} 越大,这表明方差是刻画随机变量与其期望值偏离程度的量,是描述随机变量 X X X “分散程度” 特征的指标

  • 常用分布的期望和方差
    概率论 —— 随机变量的数字特征_第1张图片

二、二维随机变量的数字特征

1. 数学期望

  • X , Y X,Y X,Y 为随机变量, g ( X , Y ) g(X,Y) g(X,Y) X , Y X,Y X,Y 的函数
  • 如果 ( X , Y ) (X,Y) (X,Y)离散型随机变量,其联合分布为
    p i j = P { X = x i , Y = y i } ( i , j = 1 , 2 , . . . ) p_{ij} = P\{X = x_i,Y=y_i\}(i,j=1,2,...) pij=P{X=xi,Y=yi}(i,j=1,2,...)
    ​ 若级数 ∑ i ∑ j g ( x i , y i ) p i j \sum\limits_{i}\sum\limits_{j}g(x_i,y_i)p_{ij} ijg(xi,yi)pij 绝对收敛,则定义
    E [ g ( X , Y ) ] = ∑ i ∑ j g ( x i , y i ) p i j E[g(X,Y)] = \sum\limits_{i}\sum\limits_{j}g(x_i,y_i)p_{ij} E[g(X,Y)]=ijg(xi,yi)pij
  • 如果 ( X , Y ) (X,Y) (X,Y)连续型随机变量,其概率密度为 f ( x , y ) f(x,y) f(x,y),若积分 ∫ − ∞ + ∞ ∫ − ∞ + ∞ g ( x , y ) f ( x , y ) d x d y \int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin} g(x,y)f(x,y)dxdy ++g(x,y)f(x,y)dxdy 绝对收敛,则定义
    E [ g ( X , Y ) ] = ∫ − ∞ + ∞ ∫ − ∞ + ∞ g ( x , y ) f ( x , y ) d x d y E[g(X,Y)] = \int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin} g(x,y)f(x,y)dxdy E[g(X,Y)]=++g(x,y)f(x,y)dxdy

2. 协方差与相关系数

(1)概念

  • 如果随机变量 X X X Y Y Y 的方差存在且 D x > 0 , D Y > 0 Dx > 0,DY>0 Dx>0,DY>0,则称 E [ ( X − E X ) ( Y − E Y ) ] E[(X-EX)(Y-EY)] E[(XEX)(YEY)] 为随机变量 X X X Y Y Y协方差,记为 C o v ( X , Y ) Cov(X,Y) Cov(X,Y),即
    C o v ( X , Y ) = E [ ( X − E X ) ( Y − E Y ) ] = E ( X Y ) − E X ⋅ E Y Cov(X,Y) = E[(X-EX)(Y-EY)]=E(XY)-EX · EY Cov(X,Y)=E[(XEX)(YEY)]=E(XY)EXEY
    其中

    E ( X Y ) = { ∑ i ∑ j x i y j P ( X = x i , Y = y j ) ( 离 散 型 ) , ∫ − ∞ + ∞ ∫ − ∞ + ∞ x y f ( x , y ) d x d y ( 连 续 型 ) E(XY)=\left\{\begin{aligned} &\sum\limits_{i}\sum\limits_{j} x_iy_jP(X=x_i,Y=y_j) (离散型), \\ &\int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin}xyf(x,y)dxdy (连续型) \end{aligned} \right. E(XY)=ijxiyjP(X=xi,Y=yj)(),++xyf(x,y)dxdy()

    ρ X Y = C o v ( X , Y ) D X D Y \rho_{XY} = \frac{Cov(X,Y)}{\sqrt{DX}\sqrt{DY}} ρXY=DX DY Cov(X,Y) 为随机变量 X X X Y Y Y相关系数,若为0则称 X X X Y Y Y 不相关;否则称相关

  • 说明

    • 协方差 C o v ( X , Y ) Cov(X,Y) Cov(X,Y) 描述随机变量 X X X Y Y Y 间关联程度,比如研究父亲身高 X X X 与孩子身高之间的偏 Y Y Y 的偏差程度,便可用 C o v ( X , Y Cov(X,Y Cov(X,Y) 来刻画
    • 相关系数 ρ X Y \rho_{XY} ρXY 描述随机变量 X X X Y Y Y 之间的线性相依性, ∣ ρ X Y ∣ |\rho_{XY}| ρXY 的大小是刻画 X X X Y Y Y 之间的线性相关程度的一种度量 ρ X Y = 0 \rho_{XY}=0 ρXY=0 表示 X X X Y Y Y 之间不存在线性关系,故称 X X X Y Y Y 不线性相关,但这并不意味着 X X X Y Y Y 之间不存在相依关系,它们之间还可存在某种非线性关系。

(2) 性质

  • 协方差相关性质
    概率论 —— 随机变量的数字特征_第2张图片

(3)深入理解协方差

  • 参考:协方差的深入理解

三、独立性与相关性的判定

概率论 —— 随机变量的数字特征_第3张图片

你可能感兴趣的:(#,概率论与数理统计,概率论,期望,方差,协方差)