概率论知识点总结(上)

参考资料

  • 概率论 · 复习概要
  • 何书元《概率论与数理统计》

1. 随机事件与概率

1.1 古典概型

古典概型中常用计数一有重复的排列数

  • n n n 个不同元素中有放回地每次随机抽取一个, 共抽取 m m m 次, 有序 地记录结果, 共有 n m n^{m} nm 种等可能的不同结果。
  • 例: 掷骰子 3 次, 记录每次结果, 结果一共有 6 × 6 × 6 = 6 3 6 \times 6 \times 6=6^{3} 6×6×6=63 种。
  • 例: 从 52 张扑克牌中随机有放回地抽取并记录 3 次, 结果共有 5 2 3 52^{3} 523 种。

古典概型中常用计数一排列数

  • n n n 个不同元素中无放回地每次随机抽取一个, 共抽取 m m m ( m ≤ n ) (m \leq n) (mn), 有序地记录结果, 共有
    A n m = n ( n − 1 ) … ( n − m + 1 ) = n ! ( n − m ) ! A_{n}^{m}=n(n-1) \ldots(n-m+1)=\frac{n !}{(n-m) !} Anm=n(n1)(nm+1)=(nm)!n!
    种等可能的不同结果。
  • A n m A_{n}^{m} Anm 在有的教材中记为 P n m P_{n}^{m} Pnm
  • 例: 从 52 张扑克牌中随机无放回地抽取 3 张, 记录每次结果, 结果有 52 × 51 × 50 = A 52 3 52 \times 51 \times 50=A_{52}^{3} 52×51×50=A523 种。

古典概型中常用计数一组合数

  • n n n 个不同元素中无放回地每次抽取一个, 共抽取 m m m ( m ≤ n ) (m \leq n) (mn), 不计次序地记录结果 (只要元素相同, 不管次序是否相同都算是相同结 果), 共有
    C n m = n ( n − 1 ) … ( n − m + 1 ) m ! = n ! m ! ( n − m ) ! C_{n}^{m}=\frac{n(n-1) \ldots(n-m+1)}{m !}=\frac{n !}{m !(n-m) !} Cnm=m!n(n1)(nm+1)=m!(nm)!n!
    种等可能的不同结果。
  • 例: 从一副扑克牌的 4 张 A 中随机无放回抽取 2 张组成一手牌, 不计 次序。有 C 4 2 = 4 × 3 / 2 = 6 C_{4}^{2}=4 \times 3 / 2=6 C42=4×3/2=6 种结果。

古典概型中常用计数一分组方式数

  • n n n 个不同元素分成有序号的 k k k 组, 要求第 i i i 组恰好有 n i n_{i} ni 个元素 ( i = 1 , 2 , … , k ) (i=1,2, \ldots, k) (i=1,2,,k), 分组结果中同组的元素不考虑次序。则这样分组的 所有不同分法个数为
    ( n n 1 , n 2 , … , n k ) = n ! n 1 ! n 2 ! … n k ! . \left(\begin{array}{c} n \\ n_{1}, n_{2}, \ldots, n_{k} \end{array}\right)=\frac{n !}{n_{1} ! n_{2} ! \ldots n_{k} !} . (nn1,n2,,nk)=n1!n2!nk!n!.
  • 当随机分组时, 这些分法是等可能的。
  • 随机分组的方法是 n n n 个元素随机排列 ( n n n ! 种排法), 然后前 n 1 n_{1} n1 个不计 次序地归入 i = 1 i=1 i=1 组, 后续 n 2 n_{2} n2 个不计次序地归入 i = 2 i=2 i=2 组, 以此类推。
  • 例 10 个学生分成 A , B , C \mathrm{A}, \mathrm{B}, \mathrm{C} A,B,C 三个组, 分别有 3、3、4人, 组内不计次 序。
    分组方式个数为
    10 ! 3 ! 3 ! 4 ! ≜ ( 10 3 , 3 , 4 ) \frac{10 !}{3 ! 3 ! 4 !} \triangleq\left(\begin{array}{c} 10 \\ 3,3,4 \end{array}\right) 3!3!4!10!(103,3,4)

古典概型中常用计数一可重复分组数

  • n n n 个不同的球中有放回地每次抽取一个, 共抽取 m m m 次, 结果不计 次序。共有 C n + m − 1 m C_{n+m-1}^{m} Cn+m1m 种不同的组合。
  • 用 0 和 1 组成的序列表示一个结果。
  • n − 1 n-1 n1 个 1 分隔出 n n n 个组, 1 表示组边界。这 n n n 个组是结果排序后 球号 1 , 2 , … , n 1,2, \ldots, n 1,2,,n 的组。
  • 每组内有若干个 0 表示该组个数, 如果出现 11 则该组没有球, 把 m m m 个 0 分配到各个组中。
  • 这样, 用长度为 n + m − 1 n+m-1 n+m1 的 0-1 向量表示一个结果, 结果个数为 C n + m − 1 n − 1 C_{n+m-1}^{n-1} Cn+m1n1 (从 n + m − 1 n+m-1 n+m1 个二进制位中选择 1 的位置, 即边界的位置)。
  • 可重复分组数在随机分组时一般不是等可能的。
  • 例如, 从红、白两个球中有放回地抽取 2 次, 计数这 2 次红球、白球 个数。共有 (红 0 , 白 2 ) , ( ),( ),( 红 1 , 白 1 ) , ( ),( ),( 红 2 , 白 0 ) ) ) 三种结果, 即 C 2 + 2 − 1 2 = 3 C_{2+2-1}^{2}=3 C2+212=3 种结果。随机抽取时 (红 1 , 白 1) 概率为 1 2 \frac{1}{2} 21, (红 0 , 白 2) 和 (红 2 , 白 0 ) 0) 0) 的概率都是 1 4 \frac{1}{4} 41

例题

概率论知识点总结(上)_第1张图片

1.2 加法公式与乘法公式

和事件的概率 P ( A ∪ B ) P(A \cup B) P(AB) 在不同场合下的求法:

  • 一般形式:
    P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A B ) P ( A ∪ B ∪ C ) = P ( A ) + P ( B ) + P ( C ) − P ( A B ) − P ( A C ) − P ( B C ) + P ( A B C ) . \begin{aligned} P(A \cup B) &=P(A)+P(B)-P(A B) \\ P(A \cup B \cup C) &=P(A)+P(B)+P(C)-P(A B)-P(A C)-P(B C)+P(A B C) . \end{aligned} P(AB)P(ABC)=P(A)+P(B)P(AB)=P(A)+P(B)+P(C)P(AB)P(AC)P(BC)+P(ABC).

  • A , B A, B A,B 互不相容: P ( A ∪ B ) = P ( A ) + P ( B ) P(A \cup B)=P(A)+P(B) P(AB)=P(A)+P(B).

  • A , B A, B A,B 相互独立:
    P ( A ∪ B ) = 1 − P ( A ∪ B ‾ ) = 1 − P ( A ˉ B ˉ ) = 1 − P ( A ˉ ) P ( B ˉ ) \begin{aligned} P(A \cup B) &=1-P(\overline{A \cup B})=1-P(\bar{A} \bar{B}) \\ &=1-P(\bar{A}) P(\bar{B}) \end{aligned} P(AB)=1P(AB)=1P(AˉBˉ)=1P(Aˉ)P(Bˉ)

积事件的概率 P ( A B ) P(A B) P(AB) 的求法:

  • 一般形式:
    P ( A B ) = P ( A ) P ( B ∣ A ) = P ( B ) P ( A ∣ B ) . P(A B)=P(A) P(B \mid A)=P(B) P(A \mid B) . P(AB)=P(A)P(BA)=P(B)P(AB).
  • A , B A, B A,B 相互独立:
    P ( A B ) = P ( A ) P ( B ) . P(A B)=P(A) P(B) . P(AB)=P(A)P(B).
    乘法公式来自于条件概率公式:
    P ( B ∣ A ) = P ( A B ) P ( A ) P(B \mid A)=\frac{P(A B)}{P(A)} P(BA)=P(A)P(AB)

1.3 全概率公式和 Bayes 公式

全概率公式
P ( A ) = P ( A B 1 ) + P ( A B 2 ) + ⋯ + P ( A B n ) = P ( B 1 ) P ( A ∣ B 1 ) + P ( B 2 ) P ( A ∣ B 2 ) + ⋯ + P ( B n ) P ( A ∣ B n ) . \begin{aligned} P(A) &=P\left(A B_{1}\right)+P\left(A B_{2}\right)+\cdots+P\left(A B_{n}\right) \\ &=P\left(B_{1}\right) P\left(A \mid B_{1}\right)+P\left(B_{2}\right) P\left(A \mid B_{2}\right)+\cdots+P\left(B_{n}\right) P\left(A \mid B_{n}\right) . \end{aligned} P(A)=P(AB1)+P(AB2)++P(ABn)=P(B1)P(AB1)+P(B2)P(AB2)++P(Bn)P(ABn).
Bayes 公式
P ( B i ∣ A ) = P ( B i ) P ( A ∣ B i ) ∑ j = 1 n P ( B j ) P ( A ∣ B j ) , i = 1 , 2 , ⋯   , n . P\left(B_{i} \mid A\right)=\frac{P\left(B_{i}\right) P\left(A \mid B_{i}\right)}{\sum_{j=1}^{n} P\left(B_{j}\right) P\left(A \mid B_{j}\right)}, \quad i=1,2, \cdots, n . P(BiA)=j=1nP(Bj)P(ABj)P(Bi)P(ABi),i=1,2,,n.
Bayes 公式本质上是条件概率公式:
P ( B i ∣ A ) = P ( A B i ) P ( A ) , P\left(B_{i} \mid A\right)=\frac{P\left(A B_{i}\right)}{P(A)}, P(BiA)=P(A)P(ABi),
只是其分子、分母进一步分别使用了乘法公式和全概率公式.

  • 全概率公式表达了 “综合考虑引起结果 A A A 的各种原因 B i B_{i} Bi, 计算导致结果 A A A 出现的可能性的大小”; 如果一个事件的发生有多个 “诱因”, 就要用到全概率公式.
  • Bayes 公式则反映了 “当结果 A A A 出现时, 它是由原因 B i B_{i} Bi 引起的可能性的大小”. Bayes 公式常用来 追究责任, 或者 “执果索因”. 也就是计算各个 “诱因” 对事件发生的 “贡献”.

例题

发报台分别以概率0.6和0.4发出信号“1”和“0”。由于通讯系统受到干扰,当发出信号“1”时,收报台未必收到信号“1”,而是分别以概率0.8和0.2收到信号“1”和“0”;同时,当发出信号“0”时,收报台分别以概率0.9和0.1收到信号“0”和“1”。求(1)收报台收到信号“1”的概率;(2)当收报台收到信号“1”时,发报台确是发出信号“1”的概率。

正确答案:

设A1=“发出信号1”,A0=“发出信号0”,A=“收到信号1”

(1)由全概率公式,有P(A)=P(A|A1)P(A1)+P(A|A0)P(A0)=0.8x0.6+0.1x0.4=0.52

(2)由贝叶斯公式,有P(A1|A)=P(A|A1)P(A1)/P(A)=0.8x0.6/0.52=12/13

2. 随机变量及其概率分布

2.0 密度函数与分布函数

概率密度函数定义

  • X X X 是随机变量, 如果存在非负函数 f ( x ) f(x) f(x) 使得对任何满 足 − ∞ ≤ a < b ≤ ∞ -\infty \leq aa<b a , b a, b a,b, 有
    P ( a < X ≤ b ) = ∫ a b f ( x ) d x , P(aP(a<Xb)=abf(x)dx,
    就称 X X X 是连续型随机变量, 称 f ( x ) f(x) f(x) X X X 的概率密度函数, 简称为概 率密度 (probability density) 或密度.

分布密度性质

  • f ( x ) f(x) f(x) X X X 的概率密度, 则 f ( x ) f(x) f(x) 有如下的基本性质.
    (a) ∫ − ∞ ∞ f ( x ) d x = 1 \int_{-\infty}^{\infty} f(x) d x=1 f(x)dx=1,
    (b) P ( X = a ) = 0 P(X=a)=0 P(X=a)=0. 于是 P ( a < X ≤ b ) = P ( a ≤ X ≤ b ) P(aP(a<Xb)=P(aXb),

  • 证明: (a) 由
    ∫ − ∞ ∞ f ( x ) d x = P ( − ∞ < X ≤ ∞ ) = 1 \int_{-\infty}^{\infty} f(x) d x=P(-\inftyf(x)dx=P(<X)=1
    可得。

  • (b)
    Pr ⁡ ( X = a ) ≤ Pr ⁡ ( X ∈ ( a − ε , a ] ) = ∫ a − ε a f ( x ) d x → 0 , ε → 0. \operatorname{Pr}(X=a) \leq \operatorname{Pr}(X \in(a-\varepsilon, a])=\int_{a-\varepsilon}^{a} f(x) d x \rightarrow 0, \quad \varepsilon \rightarrow 0 . Pr(X=a)Pr(X(aε,a])=aεaf(x)dx0,ε0.

概率分布函数定义

  • 对随机变量 X X X, 称 x x x 的函数
    F ( x ) = P ( X ≤ x ) , − ∞ ≤ x ≤ ∞ , F(x)=P(X \leq x), \quad-\infty \leq x \leq \infty, F(x)=P(Xx),x,
    X X X 的概率分布函数, 简称为分布函数 (distribution function), 也称 为累积 (cumulative) 分布函数。
  • 例: Φ ( x ) = ∫ − ∞ x φ ( t ) d t \Phi(x)=\int_{-\infty}^{x} \varphi(t) d t Φ(x)=xφ(t)dt 是标准正态分布的分布函数.

离散型随机变量的分布函数

  • 从定义看出, 如果 X X X 是离散型随机变量, 有概率分布
    p k = P ( X = x k ) , k = 1 , 2 , ⋯   , p_{k}=P\left(X=x_{k}\right), k=1,2, \cdots, pk=P(X=xk),k=1,2,,
    X X X 的分布函数
    F ( x ) = P ( X ≤ x ) = P ( ⋃ j : x j ≤ x { X = x j } ) = ∑ j : x j ≤ x p j F(x)=P(X \leq x)=P\left(\bigcup_{j: x_{j} \leq x}\left\{X=x_{j}\right\}\right)=\sum_{j: x_{j} \leq x} p_{j} F(x)=P(Xx)=P j:xjx{X=xj} =j:xjxpj
  • 是单调不减的阶梯函数.

连续型随机变量的分布函数

  • 如果 X X X 是连续型随机变量, 有概率密度 f ( x ) f(x) f(x), 则
    F ( x ) = ∫ − ∞ x f ( t ) d t F(x)=\int_{-\infty}^{x} f(t) d t F(x)=xf(t)dt
    是连续函数, 并且在 f ( x ) f(x) f(x) 的连续点 x x x f ( x ) = F ′ ( x ) f(x)=F^{\prime}(x) f(x)=F(x). 我们称 F ( x ) F(x) F(x) f ( x ) f(x) f(x) 的分布函数.

分布函数性质

  • 分布函数 F ( x ) F(x) F(x) 的常用性质:
    (1) F F F 单调不减右连续,
    (2) F ( ∞ ) = 1 , F ( − ∞ ) = 0 F(\infty)=1, F(-\infty)=0 F()=1,F()=0.

证明

  • (1) 对 x < y xx<y, 单调不减性由
    { x < X ≤ y } = { X ≤ y } − { X ≤ x } \{x{x<Xy}={Xy}{Xx}
    P ( x < X ≤ y ) = P ( X ≤ y ) − P ( X ≤ x ) = F ( y ) − F ( x ) ≥ 0 P(xP(x<Xy)=P(Xy)P(Xx)=F(y)F(x)0 得到.
  • 由于 n n n 越大, 集合 { X ≤ x + 1 / n } \{X \leq x+1 / n\} {Xx+1/n} 越小, 所以用 F F F 的单调性和概率 P P P 的连续性得到
    lim ⁡ δ ↓ 0 F ( x + δ ) = lim ⁡ n → ∞ F ( x + 1 / n ) = lim ⁡ n → ∞ P ( X ≤ x + 1 / n ) = P ( ∩ n = 1 ∞ { X ≤ x + 1 / n } ) = P ( X ≤ x ) = F ( x ) . \begin{aligned} \lim _{\delta \downarrow 0} F(x+\delta) &=\lim _{n \rightarrow \infty} F(x+1 / n) \\ &=\lim _{n \rightarrow \infty} P(X \leq x+1 / n) \\ &=P\left(\cap_{n=1}^{\infty}\{X \leq x+1 / n\}\right) \\ &=P(X \leq x)=F(x) . \end{aligned} δ0limF(x+δ)=nlimF(x+1/n)=nlimP(Xx+1/n)=P(n=1{Xx+1/n})=P(Xx)=F(x).
  • (2) 由 F ( ∞ ) = P ( X ≤ ∞ ) = P ( Ω ) = 1 F(\infty)=P(X \leq \infty)=P(\Omega)=1 F()=P(X)=P(Ω)=1 F ( − ∞ ) = P ( X ≤ − ∞ ) = F(-\infty)=P(X \leq-\infty)= F()=P(X)= P ( ∅ ) = 0 P(\emptyset)=0 P()=0 得到 (2).

2.1 已知密度函数 f ( x ) f(x) f(x), 求分布函数 F ( x ) F(x) F(x)

密度函数 f ( x ) f(x) f(x) 一般是分段函数. 由 f ( x ) f(x) f(x) F ( x ) F(x) F(x), 本质上是分段函数求积分的问题!

典型例题:
设随机变量 X X X 具有概率密度
f ( x ) = { k x , 0 ⩽ x < 3 , 2 − x 2 , 3 ⩽ x ⩽ 4 , 0 ,  其它.  f(x)= \begin{cases}k x, & 0 \leqslant x<3, \\ 2-\frac{x}{2}, & 3 \leqslant x \leqslant 4, \\ 0, & \text { 其它. }\end{cases} f(x)= kx,22x,0,0x<3,3x4, 其它
(1) 确定常数 k k k; (2) 求 X X X 的分布函数 F ( x ) F(x) F(x); (3) 求 P { 1 < X ⩽ 3.5 } P\{1P{1<X3.5}.

(1) 由 ∫ − ∞ + ∞ f ( x ) d x = 1 \int_{-\infty}^{+\infty} f(x) \mathrm{d} x=1 +f(x)dx=1, 得
∫ 0 3 k x   d x + ∫ 3 4 ( 2 − x 2 ) d x = 1 , \int_{0}^{3} k x \mathrm{~d} x+\int_{3}^{4}\left(2-\frac{x}{2}\right) \mathrm{d} x=1, 03kx dx+34(22x)dx=1,
解得 k = 1 6 k=\frac{1}{6} k=61.

(2) 对 F ( x ) = ∫ − ∞ x f ( t ) d t F(x)=\int_{-\infty}^{x} f(t) \mathrm{d} t F(x)=xf(t)dt,

  • x < 0 x<0 x<0 时, F ( x ) = ∫ − ∞ x f ( t ) d t = ∫ − ∞ x 0   d t = 0 F(x)=\int_{-\infty}^{x} f(t) \mathrm{d} t=\int_{-\infty}^{x} 0 \mathrm{~d} t=0 F(x)=xf(t)dt=x0 dt=0.
  • 0 ⩽ x < 3 0 \leqslant x<3 0x<3 时, F ( x ) = ∫ − ∞ 0 0   d t + ∫ 0 x t 6   d t = x 2 12 F(x)=\int_{-\infty}^{0} 0 \mathrm{~d} t+\int_{0}^{x} \frac{t}{6} \mathrm{~d} t=\frac{x^{2}}{12} F(x)=00 dt+0x6t dt=12x2.
  • 3 ⩽ x < 4 3 \leqslant x<4 3x<4 时,
    F ( x ) = ∫ − ∞ 0 0   d t + ∫ 0 3 t 6   d t + ∫ 3 x ( 2 − t 2 ) d t = − 3 + 2 x − x 2 4 \begin{aligned} F(x) &=\int_{-\infty}^{0} 0 \mathrm{~d} t+\int_{0}^{3} \frac{t}{6} \mathrm{~d} t+\int_{3}^{x}\left(2-\frac{t}{2}\right) \mathrm{d} t \\ &=-3+2 x-\frac{x^{2}}{4} \end{aligned} F(x)=00 dt+036t dt+3x(22t)dt=3+2x4x2
  • x ⩾ 4 x \geqslant 4 x4 时, F ( x ) = 1 F(x)=1 F(x)=1.

    F ( x ) = { 0 , x < 0 x 2 12 , 0 ⩽ x < 3 − 3 + 2 x − x 2 4 , 3 ⩽ x < 4 , 1 , x ⩾ 4 F(x)= \begin{cases}0, & x<0 \\ \frac{x^{2}}{12}, & 0 \leqslant x<3 \\ -3+2 x-\frac{x^{2}}{4}, & 3 \leqslant x<4, \\ 1, & x \geqslant 4\end{cases} F(x)= 0,12x2,3+2x4x2,1,x<00x<33x<4,x4
    做完一定要验算: F ′ ( x ) = f ( x ) F^{\prime}(x)=f(x) F(x)=f(x).

(3) P { 1 < x ⩽ 3.5 } = F ( 3.5 ) − F ( 1 ) = 41 / 48 P\{1P{1<x3.5}=F(3.5)F(1)=41/48.

2.2 随机变量的函数

已知连续型随机变量 X X X 的概率密度 f X ( x ) f_{X}(x) fX(x), 求随机变量 Y = g ( X ) Y=g(X) Y=g(X) 的概率密度 f Y ( y ) f_{Y}(y) fY(y), 两种方法:

  • 分布函数微分法
    已知随机变量 X X X 具有概率密度
    f X ( x ) = { f ( x ) , a < x < b , 0 ,  其他.  f_{X}(x)= \begin{cases}f(x), & afX(x)={f(x),0,a<x<b, 其他
    对随机变量 Y = g ( X ) Y=g(X) Y=g(X), 要求 f Y ( y ) f_{Y}(y) fY(y). 则对函数关系 y = g ( x ) y=g(x) y=g(x), 给出反函数 x = h ( y ) x=h(y) x=h(y), 有
    f Y ( y ) = { f ( h ( y ) ) ⋅ ∣ h ′ ( y ) ∣ , a < h ( y ) < b , 0 ,  其他.  f_{Y}(y)= \begin{cases}f(h(y)) \cdot\left|h^{\prime}(y)\right|, & afY(y)={f(h(y))h(y),0,a<h(y)<b, 其他
    其中函数 y = g ( x ) y=g(x) y=g(x) 处处可导且单调.
  • 积分转化法.

典型例题:
设随机变量 X X X 具有概率密度
f X ( x ) = { x 8 , 0 < x < 4 , 0 ,  其他.  f_{X}(x)= \begin{cases}\frac{x}{8}, & 0fX(x)={8x,0,0<x<4, 其他
Y = 2 X + 8 Y=2 X+8 Y=2X+8 的概率密度 f Y ( y ) f_{Y}(y) fY(y).

解 先求 Y Y Y 的分布函数. (请自已注明下述各个步骤的理由.)
F Y ( y ) = P { Y ⩽ y } = P { 2 X + 8 ⩽ y } = P { X ⩽ y − 8 2 } = ∫ − ∞ y − 8 2 f X ( x ) d x \begin{aligned} F_{Y}(y) &=P\{Y \leqslant y\} \\ &=P\{2 X+8 \leqslant y\} \\ &=P\left\{X \leqslant \frac{y-8}{2}\right\} \\ &=\int_{-\infty}^{\frac{y-8}{2}} f_{X}(x) \mathrm{d} x \end{aligned} FY(y)=P{Yy}=P{2X+8y}=P{X2y8}=2y8fX(x)dx
注意到积分上限函数求导法则 ( ∫ − ∞ φ ( x ) f ( x ) d x ) ′ = f ( φ ( x ) ) φ ′ ( x ) \left(\int_{-\infty}^{\varphi(x)} f(x) \mathrm{d} x\right)^{\prime}=f(\varphi(x)) \varphi^{\prime}(x) (φ(x)f(x)dx)=f(φ(x))φ(x), 上式两端关于 y y y 求导, 得
f Y ( y ) = f X ( y − 8 2 ) ⋅ ( y − 8 2 ) y ′ = 1 2 f X ( y − 8 2 ) = { 1 2 ⋅ y − 8 2 , 0 < y − 8 2 < 4 , 0 ,  其他.  = { y − 8 32 , 8 < y < 16 , 0 ,  其他.  \begin{aligned} f_{Y}(y) &=f_{X}\left(\frac{y-8}{2}\right) \cdot\left(\frac{y-8}{2}\right)_{y}^{\prime} \\ &=\frac{1}{2} f_{X}\left(\frac{y-8}{2}\right) \\ &= \begin{cases}\frac{1}{2} \cdot \frac{y-8}{2}, & 0<\frac{y-8}{2}<4, \\ 0, & \text { 其他. }\end{cases} \\ &= \begin{cases}\frac{y-8}{32}, & 8fY(y)=fX(2y8)(2y8)y=21fX(2y8)={212y8,0,0<2y8<4, 其他={32y8,0,8<y<16, 其他
上述方法体现为下面的一般结论. 称为单调函数公式法:

2.3 正态分布

  • 正态分布的标准化: 若 X ∼ N ( μ , σ 2 ) X \sim N\left(\mu, \sigma^{2}\right) XN(μ,σ2), 则 X − μ σ ∼ N ( 0 , 1 ) \frac{X-\mu}{\sigma} \sim N(0,1) σXμN(0,1).
    对一般的随机变量也可以 “标准化”, 即使它不一定服从正态分布. 事实上, X X X 标准化变量为
    X ∗ = X − E ( X ) D ( X ) , X^{*}=\frac{X-E(X)}{\sqrt{D(X)}}, X=D(X) XE(X),

    E ( X ∗ ) = 0 , D ( X ∗ ) = 1. E\left(X^{*}\right)=0, \quad D\left(X^{*}\right)=1 . E(X)=0,D(X)=1.
  • 正态分布的再生性: 设 X , Y X, Y X,Y 相互独立, X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) X \sim N\left(\mu_{1}, \sigma_{1}^{2}\right), Y \sim N\left(\mu_{2}, \sigma_{2}^{2}\right) XN(μ1,σ12),YN(μ2,σ22), 则
    X + Y ∼ N ( μ 1 + μ 2 , σ 1 2 + σ 2 2 ) a X ± b Y ∼ N ( a μ 1 ± b μ 2 , a 2 σ 1 2 + b 2 σ 2 2 ) . \begin{gathered} X+Y \sim N\left(\mu_{1}+\mu_{2}, \sigma_{1}^{2}+\sigma_{2}^{2}\right) \\ a X \pm b Y \sim N\left(a \mu_{1} \pm b \mu_{2}, a^{2} \sigma_{1}^{2}+b^{2} \sigma_{2}^{2}\right) . \end{gathered} X+YN(μ1+μ2,σ12+σ22)aX±bYN(aμ1±bμ2,a2σ12+b2σ22).
  • Φ ( − x ) = 1 − Φ ( x ) \Phi(-x)=1-\Phi(x) Φ(x)=1Φ(x).
  • z 1 − α = − z α z_{1-\alpha}=-z_{\alpha} z1α=zα.

2.4 常用的概率分布表

概率论知识点总结(上)_第2张图片

3. 多维随机变量及其概率分布

3.1 边缘分布与边缘密度

边缘分布

  • F ( x , y ) F(x, y) F(x,y) ( X , Y ) (X, Y) (X,Y) 的联合分布, 则 X , Y X, Y X,Y 分别有概率分布
    F X ( x ) = P ( X ≤ x , Y ≤ ∞ ) = F ( x , ∞ ) , F Y ( y ) = P ( X ≤ ∞ , Y ≤ y ) = F ( ∞ , y ) . \begin{aligned} &F_{X}(x)=P(X \leq x, Y \leq \infty)=F(x, \infty), \\ &F_{Y}(y)=P(X \leq \infty, Y \leq y)=F(\infty, y) . \end{aligned} FX(x)=P(Xx,Y)=F(x,),FY(y)=P(X,Yy)=F(,y).
    我们称 X X X 的分布函数 F X ( x ) , Y F_{X}(x), Y FX(x),Y 的分布函数 F Y ( x ) F_{Y}(x) FY(x) ( X , Y ) (X, Y) (X,Y) 的边缘 分布函数 (marginal distribution function).

边缘密度

  • f ( x , y ) f(x, y) f(x,y) 是随机向量 ( X , Y ) (X, Y) (X,Y) 的概率密度, 则 X X X Y Y Y 也都是连续型 随机变量, 我们称 X , Y X, Y X,Y 各自的概率密度为 f ( x , y ) f(x, y) f(x,y) ( X , Y ) (X, Y) (X,Y) 的边缘 密度 (marginal density).
  • 对任何 a < b aa<b, 有
    P ( a < X ≤ b ) = P ( a < X ≤ b , Y < ∞ ) = ∫ a b ( ∫ − ∞ ∞ f ( x , y ) d y ) d x \begin{aligned} P(aP(a<Xb)=P(a<Xb,Y<)=ab(f(x,y)dy)dx
    由概率密度的定义知道 X X X 有边缘密度
    f X ( x ) = ∫ − ∞ ∞ f ( x , y ) d y . f_{X}(x)=\int_{-\infty}^{\infty} f(x, y) d y . fX(x)=f(x,y)dy.
  • 完全对称地得到 Y Y Y 的边缘函数
    f Y ( y ) = ∫ − ∞ ∞ f ( x , y ) d x f_{Y}(y)=\int_{-\infty}^{\infty} f(x, y) d x fY(y)=f(x,y)dx

联合分布与联合密度

  • ( X , Y ) (X, Y) (X,Y) 有连续的分布函数 F ( x , y ) F(x, y) F(x,y), 定义
    f ( x , y ) = { ∂ 2 F ( x , y ) ∂ x ∂ y ,  当该混合偏导数存在,  0 ,  其他.  f(x, y)= \begin{cases}\frac{\partial^{2} F(x, y)}{\partial x \partial y}, & \text { 当该混合偏导数存在, } \\ 0, & \text { 其他. }\end{cases} f(x,y)={xy2F(x,y),0, 当该混合偏导数存在 其他
    如果
    ∬ R 2 f ( x , y ) d x d y = 1 , \iint_{R^{2}} f(x, y) d x d y=1, R2f(x,y)dxdy=1,
    f ( x , y ) f(x, y) f(x,y) ( X , Y ) (X, Y) (X,Y) 的联合密度.

独立性的判断, 即看下列式子是否成立:
联合 = 边缘 × 边缘 . 联合 = 边缘 \times 边缘. 联合=边缘×边缘.

联合概率计算的例子

  • 两人某天在 1 点至 2 点间独立地随机到达某地会面, 先到者等 候 20 分钟后离去. 求这两人能相遇的概率.
  • 解 认为每个人在 0 至 60 分钟内等可能到达, 用 X , Y X, Y X,Y 分别表示他们 的到达时间. 则 X ∼ U ( 0 , 60 ) , Y ∼ U ( 0 , 60 ) , X , Y X \sim \mathrm{U}(0,60), Y \sim \mathrm{U}(0,60), X, Y XU(0,60),YU(0,60),X,Y 独立. 利用
    f X ( x ) = f Y ( x ) = { 1 60 , x ∈ ( 0 , 60 ) , 0 , x ∉ ( 0 , 60 ) , f_{X}(x)=f_{Y}(x)= \begin{cases}\frac{1}{60}, & x \in(0,60), \\ 0, & x \notin(0,60),\end{cases} fX(x)=fY(x)={601,0,x(0,60),x/(0,60),
    得到 ( X , Y ) (X, Y) (X,Y) 的联合密度
    f ( x , y ) = f X ( x ) f Y ( y ) = { 1 / 6 0 2 , ( x , y ) ∈ D , 0 , ( x , y ) ∉ D . f(x, y)=f_{X}(x) f_{Y}(y)= \begin{cases}1 / 60^{2}, & (x, y) \in D, \\ 0, & (x, y) \notin D .\end{cases} f(x,y)=fX(x)fY(y)={1/602,0,(x,y)D,(x,y)/D.
    其中 D = { ( x , y ) ∣ 0 ≤ x , y ≤ 60 } D=\{(x, y) \mid 0 \leq x, y \leq 60\} D={(x,y)0x,y60}.
    A = { ( x , y ) ∣ ∣ x − y ∣ ≤ 20 , ( x , y ) ∈ D } . A=\{(x, y)|| x-y \mid \leq 20,(x, y) \in D\} . A={(x,y)∣∣xy∣≤20,(x,y)D}.
    要计算的概率是
    P ( ∣ X − Y ∣ ≤ 20 ) = ∬ A f ( x , y ) d x d y = 6 0 2 − 4 0 2 6 0 2 = 5 9 . \begin{aligned} P(|X-Y| \leq 20) &=\iint_{A} f(x, y) d x d y \\ &=\frac{60^{2}-40^{2}}{60^{2}}=\frac{5}{9} . \end{aligned} P(XY20)=Af(x,y)dxdy=602602402=95.
    概率论知识点总结(上)_第3张图片

3.2 随机变量函数的分布

例题

设二维随机变量 ( X , Y ) (X, Y) (X,Y) 的概率密度为
f ( x , y ) = { 1 , 0 < x < 1 , 0 < y < 2 x , 0 ,  其他.  f(x, y)= \begin{cases}1, & 0f(x,y)={1,0,0<x<1,0<y<2x, 其他
求:
(I) ( X , Y ) (X, Y) (X,Y) 的边缘概率密度 f X ( x ) , f Y ( y ) f_{X}(x), f_{Y}(y) fX(x),fY(y);
(II) Z = 2 X − Y Z=2 X-Y Z=2XY 的概率密度 f Z ( z ) f_{Z}(z) fZ(z).


(I) 注意到 f ( x , y ) f(x, y) f(x,y) X X X-型区域 { 0 < y < 2 x , 0 < x < 1 \left\{\begin{array}{l}0{0<y<2x,0<x<1 上有非零表达式, 该区域可以转化为 Y Y Y-型区 域 { y 2 < x < 1 , 0 < y < 2 .  \left\{\begin{array}{l}\frac{y}{2}{2y<x<1,0<y<2
f X ( x ) = ∫ − ∞ + ∞ f ( x , y ) d y = { ∫ 0 2 x   d y , 0 < x < 1 , 0 ,  其他.  = { 2 x , 0 < x < 1 , 0 ,  其他.  f Y ( y ) = ∫ − ∞ + ∞ f ( x , y ) d x = { ∫ y 2 1   d x , 0 < y < 2 , 0 ,  其他.  = { 1 − y 2 , 0 < y < 2 , 0 ,  其他.  \begin{aligned} &f_{X}(x)=\int_{-\infty}^{+\infty} f(x, y) \mathrm{d} y=\left\{\begin{array}{ll} \int_{0}^{2 x} \mathrm{~d} y, & 0fX(x)=+f(x,y)dy={02x dy,0,0<x<1, 其他={2x,0,0<x<1, 其他fY(y)=+f(x,y)dx={2y1 dx,0,0<y<2, 其他={12y,0,0<y<2, 其他
(II) 用积分转化法. 此时 g ( x , y ) = 2 x − y g(x, y)=2 x-y g(x,y)=2xy. 对任何有界连续函数 h ( z ) h(z) h(z),
∫ − ∞ + ∞ ∫ − ∞ + ∞ h [ g ( x , y ) ] f ( x , y ) d x   d y = ∫ 0 1 ( ∫ 0 2 x h ( 2 x − y ) ⋅ 1   d y ) d x = ∫ 0 1 ( ∫ 2 x 0 h ( z ) ( − 1 ) d z ) d x (  换元  z = 2 x − y ) = ∫ 0 1 ( ∫ 0 2 x h ( z ) d z ) d x = ∫ 0 2 ( h ( z ) ∫ z 2 1   d x ) d z  (交换积分次序)  = ∫ 0 2 h ( z ) ( 1 − z 2 ) d z , \begin{aligned} \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} h[g(x, y)] f(x, y) \mathrm{d} x \mathrm{~d} y &=\int_{0}^{1}\left(\int_{0}^{2 x} h(2 x-y) \cdot 1 \mathrm{~d} y\right) \mathrm{d} x \\ &=\int_{0}^{1}\left(\int_{2 x}^{0} h(z)(-1) \mathrm{d} z\right) \mathrm{d} x \quad(\text { 换元 } z=2 x-y) \\ &=\int_{0}^{1}\left(\int_{0}^{2 x} h(z) \mathrm{d} z\right) \mathrm{d} x \\ &=\int_{0}^{2}\left(h(z) \int_{\frac{z}{2}}^{1} \mathrm{~d} x\right) \mathrm{d} z \quad \text { (交换积分次序) }\\ &=\int_{0}^{2} h(z)\left(1-\frac{z}{2}\right) \mathrm{d} z, \end{aligned} ++h[g(x,y)]f(x,y)dx dy=01(02xh(2xy)1 dy)dx=01(2x0h(z)(1)dz)dx( 换元 z=2xy)=01(02xh(z)dz)dx=02(h(z)2z1 dx)dz (交换积分次序=02h(z)(12z)dz,
Z Z Z 的概率密度为
f Z ( z ) = { 1 − z 2 , 0 < z < 2 , 0 ,  其他.  f_{Z}(z)= \begin{cases}1-\frac{z}{2}, & 0fZ(z)={12z,0,0<z<2, 其他

3.3 条件分布和条件密度

条件分布

  • X = ( X 1 , X 2 , ⋯   , X n ) , Y = ( Y 1 , Y 2 , ⋯   , Y m ) \boldsymbol{X}=\left(X_{1}, X_{2}, \cdots, X_{n}\right), \boldsymbol{Y}=\left(Y_{1}, Y_{2}, \cdots, Y_{m}\right) X=(X1,X2,,Xn),Y=(Y1,Y2,,Ym) 是随机向量, 本节讨 论已知 X = ( x 1 , x 2 , ⋯   , x m ) \boldsymbol{X}=\left(x_{1}, x_{2}, \cdots, x_{m}\right) X=(x1,x2,,xm) 的条件下, Y \boldsymbol{Y} Y 的概率分布.
  • 为了叙述的简单, 我们只对 n = m = 1 n=m=1 n=m=1 的情况详细讨论.
    离散型随机变量的条件分布
  • ( X , Y ) (X, Y) (X,Y) 是离散型随机向量, 有概率分布
    p i j = P ( X = x i , Y = y j ) > 0 , i , j = 1 , 2 , ⋯   , p_{i j}=P\left(X=x_{i}, Y=y_{j}\right)>0, \quad i, j=1,2, \cdots, pij=P(X=xi,Y=yj)>0,i,j=1,2,,
  • X , Y X, Y X,Y 分别有边缘分布
    p i = P ( X = x i ) , q j = P ( Y = y j ) , i , j = 1 , 2 , ⋯   . p_{i}=P\left(X=x_{i}\right), q_{j}=P\left(Y=y_{j}\right), i, j=1,2, \cdots . pi=P(X=xi),qj=P(Y=yj),i,j=1,2,.
  • 对每个固定的 i i i, 由条件概率公式得到条件概率
    P ( Y = y j ∣ X = x i ) = P ( X = x i , Y = y j ) P ( X = x i ) = p i j p i , j = 1 , 2 , … P\left(Y=y_{j} \mid X=x_{i}\right)=\frac{P\left(X=x_{i}, Y=y_{j}\right)}{P\left(X=x_{i}\right)}=\frac{p_{i j}}{p_{i}}, j=1,2, \ldots P(Y=yjX=xi)=P(X=xi)P(X=xi,Y=yj)=pipij,j=1,2,
    为条件 X = x i X=x_{i} X=xi 下, Y Y Y 的条件概率分布, 简称为条件 分布 (conditional distribution).

条件密度

  • 设随机向量 ( X , Y ) (X, Y) (X,Y) 有联合密度 f ( x , y ) , X f(x, y), X f(x,y),X 有边缘密度 f X ( x ) f_{X}(x) fX(x), 若在 x x x (确定的 x ) \left.x\right) x) f X ( x ) > 0 f_{X}(x)>0 fX(x)>0, 就称
    P ( Y ≤ y ∣ X = x ) = ∫ − ∞ y f ( x , t ) f X ( x ) d t , y ∈ R P(Y \leq y \mid X=x)=\int_{-\infty}^{y} \frac{f(x, t)}{f_{X}(x)} d t, y \in \mathbb{R} P(YyX=x)=yfX(x)f(x,t)dt,yR
    为条件 X = x X=x X=x 下, Y Y Y 的条件分布函数 (conditional distribution function), 简称为条件分布, 记做 F Y ∣ X ( y ∣ x ) F_{Y \mid X}(y \mid x) FYX(yx).

  • f Y ∣ X ( y ∣ x ) = f ( x , y ) f X ( x ) , y ∈ R , f_{Y \mid X}(y \mid x)=\frac{f(x, y)}{f_{X}(x)}, y \in \mathbb{R}, fYX(yx)=fX(x)f(x,y),yR,
    为条件 X = x X=x X=x 下, Y Y Y 的条件概率密度, 简称为条件密度 (conditional density).

4. 随机变量的数字特征

4.1 数学期望

数学期望定义一离散型

  • 定义 1.1 1.1 1.1 X X X 有概率分布
    p j = P ( X = x j ) , j = 0 , 1 , ⋯   , p_{j}=P\left(X=x_{j}\right), j=0,1, \cdots, pj=P(X=xj),j=0,1,,
    只要级数 ∑ j = 0 ∞ ∣ x j ∣ p j \sum_{j=0}^{\infty}\left|x_{j}\right| p_{j} j=0xjpj 收敛, 就称
    E ( X ) = ∑ j = 0 ∞ x j p j \mathrm{E}(X)=\sum_{j=0}^{\infty} x_{j} p_{j} E(X)=j=0xjpj
    X X X 或分布 { p j } \left\{p_{j}\right\} {pj} 的数学期望 (expected value) 或均值 (mean).
  • 要求 ∑ j = 0 ∞ ∣ x j ∣ p j \sum_{j=0}^{\infty}\left|x_{j}\right| p_{j} j=0xjpj 收敛的原因是要使上式中的级数有确 切的意义.
  • 当所有的 x j x_{j} xj 非负时, 如果 上式中的级数是无穷, 由上式定义的 E ( X ) \mathrm{E}(X) E(X) 也有明确的意义, 它表明 X X X 的平均取值是无穷. 这时也称 X X X 的 数学期望是无穷.
  • 不难看出, 只取有限个值的随机变量的数学期望总是存在的.

数学期望定义一连续型

  • X X X 是有概率密度 f ( x ) f(x) f(x) 的随机变量, 如果下式成立,
    ∫ − ∞ ∞ ∣ x ∣ f ( x ) d x < ∞ , \int_{-\infty}^{\infty}|x| f(x) d x<\infty, xf(x)dx<,
    就称
    ∫ − ∞ ∞ x f ( x ) d x \int_{-\infty}^{\infty} x f(x) d x xf(x)dx
    X X X f ( x ) f(x) f(x) 的数学期望或均值.

  • 由于随机变量的数学期望由随机变量的概率分布唯一决定, 所以也可 以对概率分布定义数学期望.

  • 概率分布的数学期望就是以它为概率分布的随机变量的数学期望. 有 相同分布的随机变量必有相同的数学期望.

期望的计算

计算公式
E ( X ) = ∫ − ∞ + ∞ x f ( x ) d x , E ( g ( X ) ) = ∫ − ∞ + ∞ g ( x ) f ( x ) d x . E ( g ( X ) ) = ∑ k = 1 ∞ g ( x k ) p k \begin{aligned} E(X) &=\int_{-\infty}^{+\infty} x f(x) \mathrm{d} x, \\\\ E(g(X)) &=\int_{-\infty}^{+\infty} g(x) f(x) \mathrm{d} x .\\\\ E(g(X))&=\sum_{k=1}^{\infty} g\left(x_{k}\right) p_{k} \end{aligned} E(X)E(g(X))E(g(X))=+xf(x)dx,=+g(x)f(x)dx.=k=1g(xk)pk

数学期望的几个重要性质

  1. C C C 是常数, 则有 E ( C ) = C E(C)=C E(C)=C
  2. X \mathrm{X} X 是随机变量, C \mathrm{C} C 是常数, 则有 E ( C X ) = C E ( X ) E(C X)=C E(X) E(CX)=CE(X)
  3. X , Y \mathrm{X}, \mathrm{Y} X,Y 是两个随机变量, 则有 E ( X + Y ) = E ( X ) + E ( Y ) E(X+Y)=E(X)+E(Y) E(X+Y)=E(X)+E(Y);
  4. X , Y X,Y X,Y 是相互独立的随机变量,则有 E ( X Y ) = E ( X ) E ( Y ) E(XY ) = E(X )E(Y) E(XY)=E(X)E(Y)

4.2 方差的性质与计算

方差的计算:

D ( X ) = E [ ( X − E ( X ) ) 2 ] = E ( X 2 ) − ( E ( X ) ) 2 . \begin{aligned} D(X) &=E\left[(X-E(X))^{2}\right] \\ &=E\left(X^{2}\right)-(E(X))^{2} . \end{aligned} D(X)=E[(XE(X))2]=E(X2)(E(X))2.

E ( X ) = μ E(X)=\mu E(X)=μ, 由方差定义式 D ( X ) = E [ ( X − μ ) 2 ] D(X)=E\left[(X-\mu)^{2}\right] D(X)=E[(Xμ)2], 可见方差其实是一个期望, 是随机变量函 数 ( X − μ ) 2 (X-\mu)^{2} (Xμ)2 的期望. 由随机变量函数期望的求法, 故有
D ( X ) = ∫ − ∞ + ∞ ( x − μ ) 2 f ( x ) d x . D(X)=\int_{-\infty}^{+\infty}(x-\mu)^{2} f(x) \mathrm{d} x . D(X)=+(xμ)2f(x)dx.
方差的性质:

  • D ( C ) = 0 D(C)=0 D(C)=0,
  • D ( X + C ) = D ( X ) D(X+C)=D(X) D(X+C)=D(X).
  • D ( a X ) = a 2 D ( X ) , D ( − X ) = D ( X ) D(a X)=a^{2} D(X), D(-X)=D(X) D(aX)=a2D(X),D(X)=D(X).
  • D ( X + Y ) = D ( X ) + D ( Y ) + 2 Cov ⁡ ( X , Y ) D(X+Y)=D(X)+D(Y)+2 \operatorname{Cov}(X, Y) D(X+Y)=D(X)+D(Y)+2Cov(X,Y).
    X X X Y Y Y 不相关 ⇔ D ( X + Y ) = D ( X ) + D ( Y ) \Leftrightarrow D(X+Y)=D(X)+D(Y) D(X+Y)=D(X)+D(Y).
    X X X Y Y Y 相互独立 ⟹ D ( X + Y ) = D ( X ) + D ( Y ) \Longrightarrow D(X+Y)=D(X)+D(Y) D(X+Y)=D(X)+D(Y).
  • D ( a X ± b Y ) = a 2 D ( X ) + b 2 D ( Y ) D(a X \pm b Y)=a^{2} D(X)+b^{2} D(Y) D(aX±bY)=a2D(X)+b2D(Y), 其中 X X X Y Y Y 相互独立.

例题

设随机变量 X , Y X, Y X,Y 相互独立, 且都服从均值为 0 , 方差为 1 2 \frac{1}{2} 21 的正态分布. 求随机变量 ∣ X − Y ∣ |X-Y| XY 的方 差,
解 令 Z = X − Y Z=X-Y Z=XY. 由题设知, Z ∼ N ( 0 , 1 ) Z \sim N(0,1) ZN(0,1). 对
D ( ∣ X − Y ∣ ) = D ( ∣ Z ∣ ) = E ( ∣ Z ∣ 2 ) − [ E ( ∣ Z ∣ ) ] 2 = E ( Z 2 ) − [ E ( ∣ Z ∣ ) ] 2 \begin{aligned} D(|X-Y|) &=D(|Z|)=E\left(|Z|^{2}\right)-[E(|Z|)]^{2} \\ &=E\left(Z^{2}\right)-[E(|Z|)]^{2} \end{aligned} D(XY)=D(Z)=E(Z2)[E(Z)]2=E(Z2)[E(Z)]2
E ( Z 2 ) = D ( Z ) + [ E ( Z ) ] 2 = 1 + 0 = 1 E\left(Z^{2}\right)=D(Z)+[E(Z)]^{2}=1+0=1 E(Z2)=D(Z)+[E(Z)]2=1+0=1, 且
E ( ∣ Z ∣ ) = 1 2 π ∫ − ∞ + ∞ ∣ z ∣ e − z 2 / 2   d z = 2 2 π ∫ 0 + ∞ ∣ z ∣ e − z 2 / 2   d z = 2 2 π ∫ 0 + ∞ z e − z 2 / 2   d z = − 2 2 π ∫ 0 + ∞ d ( e − z 2 / 2 ) = 2 2 π e − z 2 / 2 ∣ 0 + ∞ = 2 π \begin{aligned} E(|Z|) &=\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^{+\infty}|z| \mathrm{e}^{-z^{2} / 2} \mathrm{~d} z=\frac{2}{\sqrt{2 \pi}} \int_{0}^{+\infty}|z| \mathrm{e}^{-z^{2} / 2} \mathrm{~d} z=\frac{2}{\sqrt{2 \pi}} \int_{0}^{+\infty} z \mathrm{e}^{-z^{2} / 2} \mathrm{~d} z \\ &=-\frac{2}{\sqrt{2 \pi}} \int_{0}^{+\infty} \mathrm{d}\left(\mathrm{e}^{-z^{2} / 2}\right)=\left.\frac{2}{\sqrt{2 \pi}} \mathrm{e}^{-z^{2} / 2}\right|_{0} ^{+\infty} \\ &=\sqrt{\frac{2}{\pi}} \end{aligned} E(Z)=2π 1+zez2/2 dz=2π 20+zez2/2 dz=2π 20+zez2/2 dz=2π 20+d(ez2/2)=2π 2ez2/2 0+=π2
D ( ∣ X − Y ∣ ) = E ( Z 2 ) − [ E ( ∣ Z ∣ ) ] 2 = 1 − 2 π D(|X-Y|)=E\left(Z^{2}\right)-[E(|Z|)]^{2}=1-\frac{2}{\pi} D(XY)=E(Z2)[E(Z)]2=1π2.

4.3 协方差与相关系数

协方差的计算:
Cov ⁡ ( X , Y ) = E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] = E ( X Y ) − E ( X ) E ( Y ) . \begin{aligned} \operatorname{Cov}(X, Y) &=E[(X-E(X))(Y-E(Y))] \\ &=E(X Y)-E(X) E(Y) . \end{aligned} Cov(X,Y)=E[(XE(X))(YE(Y))]=E(XY)E(X)E(Y).

相关系数的计算:
ρ X Y = Cov ⁡ ( X , Y ) D ( X ) D ( Y ) = E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] D ( X ) D ( Y ) . \begin{aligned} \rho_{X Y} &=\frac{\operatorname{Cov}(X, Y)}{\sqrt{D(X)} \sqrt{D(Y)}} \\ &=\frac{E[(X-E(X))(Y-E(Y))]}{\sqrt{D(X)} \sqrt{D(Y)}} . \end{aligned} ρXY=D(X) D(Y) Cov(X,Y)=D(X) D(Y) E[(XE(X))(YE(Y))].
随机变量的相关系数 = = = 随机变量 “标准化” 后的协方差. 事实上, X , Y X, Y X,Y 标准化为
X ∗ = X − E ( X ) D ( X ) , Y ∗ = Y − E ( Y ) D ( Y ) , X^{*}=\frac{X-E(X)}{\sqrt{D(X)}}, \quad Y^{*}=\frac{Y-E(Y)}{\sqrt{D(Y)}}, X=D(X) XE(X),Y=D(Y) YE(Y),

ρ X Y = Cov ⁡ ( X , Y ) D ( X ) D ( Y ) = Cov ⁡ ( X ∗ , Y ∗ ) . \rho_{X Y}=\frac{\operatorname{Cov}(X, Y)}{\sqrt{D(X)} \sqrt{D(Y)}}=\operatorname{Cov}\left(X^{*}, Y^{*}\right) . ρXY=D(X) D(Y) Cov(X,Y)=Cov(X,Y).
相关系数的性质

  • ∣ ρ ∣ ⩽ 1 |\rho| \leqslant 1 ρ1. 其中
    • ∣ ρ ∣ = 1 ⟺ X |\rho|=1 \Longleftrightarrow X ρ=1X Y Y Y 之间存在线性关系,即存在常数 a, b 使 P { Y = a + b X } = 1 P\{Y = a + bX\}=1 P{Y=a+bX}=1;
    • ρ = 0 ⟺ X \rho=0 \Longleftrightarrow X ρ=0X Y Y Y 之间不存在线性关系, 或称 X X X Y Y Y 不相关.
      强调: 不相关是 “不线性相关”的简称!
  • 以下命题是等价的:
    • X X X Y Y Y 不相关.
    • ρ X Y = 0 \rho_{X Y}=0 ρXY=0.
    • Cov ⁡ ( X , Y ) = 0 \operatorname{Cov}(X, Y)=0 Cov(X,Y)=0.
    • E ( X Y ) = E ( X ) E ( Y ) E(X Y)=E(X) E(Y) E(XY)=E(X)E(Y).
    • D ( X + Y ) = D ( X ) + D ( Y ) D(X+Y)=D(X)+D(Y) D(X+Y)=D(X)+D(Y).
  • X X X Y Y Y 独立 ⟹ X \Longrightarrow X X Y Y Y 不相关. 反之不一定成立.

4.4 切比雪夫不等式

P { ∣ X − E ( X ) ∣ ⩾ ε } ⩽ D ( X ) ε 2 , P\{|X-E(X)| \geqslant \varepsilon\} \leqslant \frac{D(X)}{\varepsilon^{2}}, P{XE(X)ε}ε2D(X),
或等价地
P { ∣ X − E ( X ) ∣ < ε } ⩾ 1 − D ( X ) ε 2 . P\{|X-E(X)|<\varepsilon\} \geqslant 1-\frac{D(X)}{\varepsilon^{2}} . P{XE(X)<ε}1ε2D(X).

5. 概率极限定理

中心极限定理即言: 大量独立同分布的随机变量之和, 近似服从正态分布

中心极限定理:

(1) 设随机变量 X 1 , X 2 , ⋯   , X n X_{1}, X_{2}, \cdots, X_{n} X1,X2,,Xn 独立同分布, E ( X k ) = μ , D ( X k ) = σ 2 , k = 1 , 2 ⋯   , n E\left(X_{k}\right)=\mu, D\left(X_{k}\right)=\sigma^{2}, k=1,2 \cdots, n E(Xk)=μ,D(Xk)=σ2,k=1,2,n. 从而,
E ( ∑ k = 1 n X k ) = n μ , D ( ∑ k = 1 n X k ) = n σ 2 . E\left(\sum_{k=1}^{n} X_{k}\right)=n \mu, \quad D\left(\sum_{k=1}^{n} X_{k}\right)=n \sigma^{2} . E(k=1nXk)=nμ,D(k=1nXk)=nσ2.
则近似地有
∑ k = 1 n X k ∼ N ( n μ , n σ 2 ) , \sum_{k=1}^{n} X_{k} \sim N\left(n \mu, n \sigma^{2}\right), k=1nXkN(nμ,nσ2),
上式一般用于求解和的概率问题.

进一步 “标准化” 得
∑ k = 1 n X k − n μ n σ ∼ N ( 0 , 1 ) . \frac{\sum_{k=1}^{n} X_{k}-n \mu}{\sqrt{n} \sigma} \sim N(0,1) . n σk=1nXknμN(0,1).
等价地,
1 n ∑ k = 1 n X k − μ σ / n ∼ N ( 0 , 1 ) . \frac{\frac{1}{n} \sum_{k=1}^{n} X_{k}-\mu}{\sigma / \sqrt{n}} \sim N(0,1) . σ/n n1k=1nXkμN(0,1).
X ˉ = 1 n ∑ k = 1 n X k \bar{X}=\frac{1}{n} \sum_{k=1}^{n} X_{k} Xˉ=n1k=1nXk, 则
X ˉ − μ σ / n ∼ N ( 0 , 1 ) . \frac{\bar{X}-\mu}{\sigma / \sqrt{n}} \sim N(0,1) . σ/n XˉμN(0,1).
等价地,
X ˉ ∼ N ( μ , σ 2 n ) . \bar{X} \sim N\left(\mu, \frac{\sigma^{2}}{n}\right) . XˉN(μ,nσ2).
也可以直接由 E ( X k ) = μ , D ( X k ) = σ 2 E\left(X_{k}\right)=\mu, D\left(X_{k}\right)=\sigma^{2} E(Xk)=μ,D(Xk)=σ2, 得 E ( X ˉ ) = μ , D ( X ˉ ) = σ 2 n E(\bar{X})=\mu, D(\bar{X})=\frac{\sigma^{2}}{n} E(Xˉ)=μ,D(Xˉ)=nσ2.
上式一般用于求解平均值的概率问题.

(2) 设 n A n_{A} nA n n n 重伯努利试验中事件 A A A 出现的次数, 且 A A A 在每次实验中发生的概率为 p p p. 则 n A n_{A} nA 服从 二项分布 B ( n , p ) B(n, p) B(n,p), 从而
E ( n A ) = n p , D ( n A ) = n p ( 1 − p ) . E\left(n_{A}\right)=n p, \quad D\left(n_{A}\right)=n p(1-p) . E(nA)=np,D(nA)=np(1p).
n n n 很大时, n A n_{A} nA 的 “标准化” 变量 n A − E ( n A ) D ( n A ) \frac{n_{A}-E\left(n_{A}\right)}{\left.\sqrt{D\left(n_{A}\right.}\right)} D(nA )nAE(nA) 近似服从正态分布, 即
n A − n p n p ( 1 − p ) ∼ N ( 0 , 1 ) . \frac{n_{A}-n p}{\sqrt{n p(1-p)}} \sim N(0,1) . np(1p) nAnpN(0,1).

例题

一生产线生产的产品成箱包装, 每箱的重量是随机的. 假设每箱平均重 50 千克, 标准差为 5 千克. 若用最大载重量为 5 吨的汽车承运, 试利用中心极限定理说明每辆车最多可以装多少箱, 才能保障不超 载的概率大于 0.977 0.977 0.977.

解 :

设所求箱数为 n n n, 每箱的重量记为 X 1 , X 2 , ⋯   , X n X_{1}, X_{2}, \cdots, X_{n} X1,X2,,Xn. 由题设可把 X 1 , X 2 , ⋯   , X n X_{1}, X_{2}, \cdots, X_{n} X1,X2,,Xn 视为独立同分布 随机变量. 又
E ( X i ) = 50 , D ( X i ) = 5 2 , ( i = 1 , 2 , ⋯   , n ) E\left(X_{i}\right)=50, \quad D\left(X_{i}\right)=5^{2}, \quad(i=1,2, \cdots, n) E(Xi)=50,D(Xi)=52,(i=1,2,,n)
根据中心极限定理, 有 ∑ i = 1 n X i \sum_{i=1}^{n} X_{i} i=1nXi 近似服从正态分布 ( n ⋅ 50 , n ⋅ 5 2 ) \left(n \cdot 50, n \cdot 5^{2}\right) (n50,n52).
问题即求 n n n 使
P { ∑ i = 1 n X i ⩽ 5000 } > 0.977. P\left\{\sum_{i=1}^{n} X_{i} \leqslant 5000\right\}>0.977 . P{i=1nXi5000}>0.977.
其中
P { ∑ i = 1 n X i ⩽ 5000 } = P { ∑ i = 1 n X i − 50 n 5 n ⩽ 5000 − 50 n 5 n } ≈ Φ ( 1000 − 10 n n ) \begin{aligned} P\left\{\sum_{i=1}^{n} X_{i} \leqslant 5000\right\} &=P\left\{\frac{\sum_{i=1}^{n} X_{i}-50 n}{5 \sqrt{n}} \leqslant \frac{5000-50 n}{5 \sqrt{n}}\right\} \\ & \approx \Phi\left(\frac{1000-10 n}{\sqrt{n}}\right) \end{aligned} P{i=1nXi5000}=P{5n i=1nXi50n5n 500050n}Φ(n 100010n)

Φ ( 1000 − 10 n n ) > 0.977 = Φ ( 2 ) , \Phi\left(\frac{1000-10 n}{\sqrt{n}}\right)>0.977=\Phi(2), Φ(n 100010n)>0.977=Φ(2),

1000 − 10 n n > 2 , \frac{1000-10 n}{\sqrt{n}}>2, n 100010n>2,
从而 n < 98.0199 n<98.0199 n<98.0199, 即最多可以装 98 箱.

你可能感兴趣的:(数学,概率论)