概率论与数理统计——常用结论

1 随机事件和概率

A ⊆ B A\subseteq B AB,则:

P ( A ) ≤ P ( B ) P ( A B ) ≤ min ⁡ ( P ( A ) , P ( B ) ) \begin{aligned}&P(A) \leq P(B)\\ &P(AB)\leq \min(P(A),P(B))\\\end{aligned} P(A)P(B)P(AB)min(P(A),P(B))

本章出题一般是考察时间的构造、化自然语言为数学语言之后,用本章公式求解

有时需要时间的等价转化(正难则反,转化为数学描述不一样的等价事件)

式子 P ( X Y ≤ 0 ) = P ( X ≥ 0 , Y ≤ 0 ) + P ( X ≤ 0 , Y ≥ 0 ) P(XY \leq0)=P(X \geq0,Y \leq0)+P(X \leq0,Y \geq0) P(XY0)=P(X0,Y0)+P(X0,Y0)成立的直观原因在于 P ( A + B ) = P ( A ) + P ( B ) − P ( A B ) P(A+B)=P(A)+P(B)-P(AB) P(A+B)=P(A)+P(B)P(AB)

对立事件是“非此即彼”的

古典概型注意找对总事件

注意区分“所取产品中有一件是不合格品,另一件也是不合格品”与“第一次取为不合格品第二次也是不合格品“的不同

注意用条件概率 P ( B ∣ A i ) P(B|A_i) P(BAi) P ( B ) P(B) P(B),除了贝叶斯公式 P ( B ∣ A i ) = p ( A i ∣ B ) P ( B ) P ( A i ) P(B|A_i)=\frac{p(A_i|B)P(B)}{P(A_i)} P(BAi)=P(Ai)p(AiB)P(B),还有全概率公式 P ( B ) = ∑ i = 1 n P ( B ∣ A i ) P ( A i ) P(B)=\sum\limits_{i=1}^{n}P(B|A_i)P(A_i) P(B)=i=1nP(BAi)P(Ai)

0 < P ( A ) < 1 , 0 < P ( B ) < 1 00<P(A)<1,0<P(B)<1,有:

A 与 B 相 互 独 立 ⇔ P ( A ∣ B ) = P ( A ∣ B ˉ ) = 1 − P ( A ˉ ∣ B ˉ ) ⇔ P ( A ∣ B ) + P ( A ˉ ∣ B ˉ ) = 1 A与B相互独立 \Leftrightarrow P(A|B)=P(A|\bar B)=1-P(\bar A| \bar B) \Leftrightarrow P(A|B)+P(\bar A| \bar B)=1 ABP(AB)=P(ABˉ)=1P(AˉBˉ)P(AB)+P(AˉBˉ)=1

注意选择题的组合随机事件选项,如”至少发生2个“,”恰好发生两个“等,可以考虑代入值,查看什么时候结果是真来判断:

如事件: ( A + B ) ( B + C ) ( C + D ) (A+B)(B+C)(C+D) (A+B)(B+C)(C+D)

注意事件 A , B A,B A,B恰好有一个发生的概率是 P ( A ˉ B + A B ˉ ) P(\bar AB+A\bar B) P(AˉB+ABˉ),不是 P ( A ˉ B ) + P ( A B ˉ ) P(\bar AB)+P(A\bar B) P(AˉB)+P(ABˉ)

注意一种特殊的事件表达形式: A B = A ˉ B ˉ AB=\bar A\bar B AB=AˉBˉ,可以得出 A B A ˉ B ˉ = ∅ AB\bar A \bar B=\emptyset ABAˉBˉ=,即 A B AB AB A ˉ B ˉ \bar A \bar B AˉBˉ至少有一个是空集,由于二者相同,故两者都是空集。且 A ˉ B ˉ = ( A + B ) ‾ = ∅ \bar A \bar B=\overline {(A+B)} = \emptyset AˉBˉ=(A+B)=,那么 A + B = Ω A+B=\Omega A+B=Ω,即 A B = ∅ , A + B = Ω AB=\emptyset,A+B=\Omega AB=,A+B=Ω,那么 A , B A,B A,B为对立事件,那么 P ( A ∣ B ˉ ) = P ( A ∣ A ) = 1 P(A|\bar B)=P(A|A)=1 P(ABˉ)=P(AA)=1

2 一维随机变量及其分布

假设连续型随机变量 X X X的概率密度 f ( x ) f(x) f(x)为偶函数,且 F ( x ) F(x) F(x)为其分布函数,有:

F ( a ) + F ( − a ) = 1 P ( ∣ x ∣ ≤ a ) = 2 F ( a ) − 1 P ( ∣ x ∣ > a ) = 2 − 2 F ( a ) \begin{aligned} &F(a)+F(-a)=1\\ &P(|x| \leq a)=2F(a)-1\\ &P(|x|>a)=2-2F(a)\\ \end{aligned} F(a)+F(a)=1P(xa)=2F(a)1P(x>a)=22F(a)

注意 Z = max ⁡ { X , 1 } Z=\max\{X,1\} Z=max{X,1} Z = max ⁡ { X , Y } Z=\max\{X,Y\} Z=max{X,Y},前者为一维随机变量,后者为多维随机变量

挑选个数类分布可能为二项分布,毕竟多次挑项,选中和没选中,符合 B ( n , p ) B(n,p) B(n,p)的定义,且不一定是二类挑选,多类挑选亦可

独立的正态分布的和仍是正态分布

多个不独立的正态分布的和不一定是正态分布。

对于二维正态分布 ( X , Y ) (X,Y) (X,Y),有: X , Y 独 立 ⇔ X , Y 不 相 关 X,Y独立 \Leftrightarrow X,Y不相关 X,YX,Y

但是对于一般的两个分布 X , Y X,Y X,Y(不知道其联合分布是否为二维正态分布),则二者不相关不一定推得二者独立

3 一维随机变量函数的分布

常见函数的可加性:

  1. B ( n , p ) B(n,p) B(n,p)
  2. P ( λ ) P(\lambda) P(λ)
  3. N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)
  4. χ 2 ( n ) \chi^2(n) χ2(n)

对于求解幂级数的无穷分布律,注意多化为 P ( X > a ) P(X>a) P(X>a)的形式,而不要写为 1 − P ( X ≤ a ) 1-P(X\leq a) 1P(Xa)的形式,因为前者可能涉及到等差数列求和,在 n → ∞ n \rightarrow \infty n时,某项为1的情况。

例:设随机变量 X X X的分布律为 P ( X = k ) = ( 1 − p ) k − 1 p , k = 1 , 2 , ⋯ P(X=k)=(1-p)^{k-1}p,k=1,2,\cdots P(X=k)=(1p)k1p,k=1,2,,其中 0 < p < 1 00<p<1,求 P ( X > m + n ) P ( X > m ) \frac{P(X>m+n)}{P(X>m)} P(X>m)P(X>m+n)

解:有:

P ( X > m + n ) P ( X > m ) = ∑ k = m + n + 1 ∞ p ( 1 − p ) k − 1 ∑ k = m + 1 ∞ p ( 1 − p ) k − 1 = 等 差 数 列 求 和 公 式 ( 1 − p ) m + n ( 1 − p ) m = ( 1 − p ) n \frac{P(X>m+n)}{P(X>m)}=\frac{\sum\limits_{k=m+n+1}^{\infty}p(1-p)^{k-1}}{\sum\limits_{k=m+1}^{\infty}p(1-p)^{k-1}}\stackrel{\mathrm{等差数列求和公式}}{=}\frac{(1-p)^{m+n}}{(1-p)^m}=(1-p)^n P(X>m)P(X>m+n)=k=m+1p(1p)k1k=m+n+1p(1p)k1=(1p)m(1p)m+n=(1p)n

PS:如果这里贸然将 P ( X > m ) P(X>m) P(X>m)化为 P ( X > m ) = 1 − P ( X ≤ m ) = 1 − ∑ k = 1 m p ( 1 − p ) k − 1 P(X>m)=1-P(X\leq m)=1-\sum\limits_{k=1}^{m}p(1-p)^{k-1} P(X>m)=1P(Xm)=1k=1mp(1p)k1,虽然能用等比数列求和公式 p 1 ( 1 − ( 1 − p ) n ) 1 − ( 1 − p ) p\frac{1(1-(1-p)^n)}{1-(1-p)} p1(1p)1(1(1p)n),但是不能将 ( 1 − p ) n (1-p)^n (1p)n视为0,且后续与分子不好一起化简处理

在计算形如 ∫ e − x 2 d x , ∫ x e − x 2 d x , ∫ x 2 e − x 2 d x \int e^{-x^2}dx,\int xe^{-x^2}dx,\int x^2e^{-x^2}dx ex2dx,xex2dx,x2ex2dx的积分时,有两种常用解法:

  1. 转换为正态函数的数字特征去求解

  2. 利用gamma函数 Γ ( s ) \Gamma(s) Γ(s)

    Γ ( s ) = ∫ 0 + ∞ x s − 1 e − x d x ( s > 0 ) Γ ( s + 1 ) = s Γ ( s ) = s ! Γ ( 1 ) = ∫ 0 + ∞ e − x d x = 1 Γ ( 1 2 ) = ∫ 0 ∞ x − 1 2 e − x d x = π = ∫ − ∞ + ∞ e − x 2 d x = ∫ − ∞ + ∞ x 2 e − x 2 d x \begin{aligned} &\Gamma(s)=\int_{0}^{+\infty}x^{s-1}e^{-x}dx {\kern 5pt}(s>0)\\ &\Gamma(s+1)=s\Gamma(s)=s!\\ &\Gamma(1)=\int_{0}^{+\infty}e^{-x}dx=1\\ &\Gamma(\frac{1}{2})=\int_{0}^{\infty}x^{-\frac{1}{2}}e^{-x}dx=\sqrt{\pi}\\ &{\kern 22pt}=\int_{-\infty}^{+\infty}e^{-x^2}dx\\ &{\kern 22pt}=\int_{-\infty}^{+\infty}x^2e^{-x^2}dx\\ \end{aligned} Γ(s)=0+xs1exdx(s>0)Γ(s+1)=sΓ(s)=s!Γ(1)=0+exdx=1Γ(21)=0x21exdx=π =+ex2dx=+x2ex2dx

4 多维随机变量及其分布

X X X Y Y Y相互独立,则 X 2 X^2 X2 Y Y Y相互独立

X X X Y Y Y相互独立,则有以下四个结论:

F ( x , y ) = F X ( x ) F Y ( y ) f ( x , y ) = f X ( x ) f Y ( y ) E ( X Y ) = E ( X ) E ( Y ) D ( X ± Y ) = D ( X ) + D ( Y ) \begin{aligned} &F(x,y)=F_X(x)F_Y(y)\\ &f(x,y)=f_X(x)f_Y(y)\\ &E(XY)=E(X)E(Y)\\ &D(X \pm Y)=D(X)+D(Y)\\ \end{aligned} F(x,y)=FX(x)FY(y)f(x,y)=fX(x)fY(y)E(XY)=E(X)E(Y)D(X±Y)=D(X)+D(Y)

但是需要注意的是 X , Y X,Y X,Y不相关与 E ( X Y ) = E ( X ) E ( Y ) E(XY)=E(X)E(Y) E(XY)=E(X)E(Y)是充分条件,所以单独的 E ( X Y ) = E ( X ) E ( Y ) E(XY)=E(X)E(Y) E(XY)=E(X)E(Y)推不出 X , Y X,Y X,Y相互独立

无论 X , Y X,Y X,Y有没有关系都有 E ( a X + b Y ) = a E ( X ) + b E ( Y ) E(aX+bY)=aE(X)+bE(Y) E(aX+bY)=aE(X)+bE(Y)

注意相关式的充要条件 E ( X Y ) = E ( X ) E ( Y ) E(XY)=E(X)E(Y) E(XY)=E(X)E(Y)的使用:

  1. 知道联合概密 f ( x , y ) f(x,y) f(x,y)

    直接 E ( X Y ) = ∬ x y f ( x , y ) d x d y E(XY)=\iint xyf(x,y)dxdy E(XY)=xyf(x,y)dxdy

  2. 不知道联合概密 f ( x , y ) f(x,y) f(x,y),但知道分布 X , Y X,Y X,Y的关系式 Y = g ( X ) Y=g(X) Y=g(X),与 X X X的概密 f ( x ) f(x) f(x)

    E ( X Y ) = E ( X g ( X ) ) = ∫ x g ( x ) d x E(XY)=E(Xg(X))=\int xg(x)dx E(XY)=E(Xg(X))=xg(x)dx

讨论变量 X , Y X,Y X,Y相互独立性的方法:

  1. 从分布函数讨论: P ( X ≤ x , Y ≤ y ) = F ( x , y ) = F X ( x ) F Y ( y ) P(X \leq x,Y \leq y)=F(x,y)=F_X(x)F_Y(y) P(Xx,Yy)=F(x,y)=FX(x)FY(y)

  2. 从概率密度函数讨论: f ( x , y ) = f X ( x ) f Y ( y ) f(x,y)=f_X(x)f_Y(y) f(x,y)=fX(x)fY(y)

  3. 从事件的包含与被包含来讨论:

    注意一种特殊情况,即若: B ⊂ A B\subset A BA,那么有 P ( A ) P ( B ) < P ( A B ) = P ( B ) P(A)P(B)P(A)P(B)<P(AB)=P(B),那么就不相互独立

    比如选取 B = { ∣ X ≤ x 0 ∣ } , A = { X ≤ x 0 } B=\{|X \leq x_0|\},A=\{X \leq x_0\} B={Xx0},A={Xx0},那么显然 X X X Y = ∣ X ∣ Y=|X| Y=X就不独立

关于max函数的两个变换式:

max ⁡ ( a + b X 1 , a + b X 2 ) = a + b max ⁡ ( X 1 , X 2 ) max ⁡ ( X 1 , X 2 ) = 1 2 ( X 1 + X 2 + ∣ X 1 − X 2 ∣ ) \begin{aligned} &\max(a+bX_1,a+bX_2)=a+b\max(X_1,X_2)\\ &\max(X_1,X_2)=\frac{1}{2}(X_1+X_2+|X_1-X_2|)\\ \end{aligned} max(a+bX1,a+bX2)=a+bmax(X1,X2)max(X1,X2)=21(X1+X2+X1X2)

若已知连续变量的概密与离散变量的分布,则 “ ( 连 , 离 ) → 连 ” “(连,离)\rightarrow连” ()的分布函数还是可以积分求得的

“ ( 连 , 离 ) → 连 ” “(连,离)\rightarrow连” ()常用全概率公式,但如果变量不相互独立,则不可以全概率展开

“ ( 离 , 离 ) → 离 ” “(离,离)\rightarrow离” ()常用完备事件展开

5 多维随机变量函数的分布

对于联合分布 F ( x , y ) F(x,y) F(x,y)的求解,常用的几种方式:

  1. 积分:知道 f ( x , y ) f(x,y) f(x,y),直接在对应区域上求积分

  2. 独立性:若 F ( x , y ) = P ( X ≤ x , Y ≤ y ) F(x,y)=P(X \leq x,Y \leq y) F(x,y)=P(Xx,Yy),且分布 X , Y X,Y X,Y相互独立,又已知 F X ( x ) , F Y ( y ) F_X(x),F_Y(y) FX(x),FY(y),则有 F ( x , y ) = F X ( x ) F Y ( y ) F(x,y)=F_X(x)F_Y(y) F(x,y)=FX(x)FY(y)

  3. 未知转化成已知:

    若不知道 f ( x , y ) f(x,y) f(x,y),且 F ( x , y ) = P ( X ≤ x , Y ≤ y ) F(x,y)=P(X \leq x,Y \leq y) F(x,y)=P(Xx,Yy) X , Y X,Y X,Y由一些其余的分布 X 1 , X 2 , ⋯   , X k X_1,X_2,\cdots, X_k X1,X2,,Xk构成,若最后可转化为已知概密的联合分布(比如最后转化为了 F ( x , y ) = P ( X 1 ≤ x , X 2 ≤ y ) F(x,y)=P(X_1 \leq x,X_2 \leq y) F(x,y)=P(X1x,X2y),且已知联合概密 f X 1 X 2 ( x , y ) f_{X_1X_2}(x,y) fX1X2(x,y)),那么就在这个已知联合概密上积分求解

对于联合密度函数 f ( x , y ) f(x,y) f(x,y)的求解,常用的几种方式:

  1. 求导
  2. 独立性

注意联合概率密度函数没有”用已知求未知“的方法,因为分布函数有 F ( x , y ) = P ( X ≤ x , Y ≤ y ) F(x,y)=P(X \leq x,Y \leq y) F(x,y)=P(Xx,Yy)的定义,所以方便已知求未知,但是概率密度函数则没有。所以面对分布之间有已知关系,但是联合密度与联合分布均未知时,优先考虑计算联合分布。

但是有些联合分布是求不出来的,这种情况下要考虑是否真的有必要求联合分布。(如想利用 F ( x , y ) = 独 F X ( x ) F Y ( y ) F(x,y)\stackrel{\mathrm{独}}{=}F_X(x)F_Y(y) F(x,y)=FX(x)FY(y)进行独立性判断,但是有时 F ( x , y ) F(x,y) F(x,y)就是求不出来,此时可考虑用别的方法)

注意对于特殊多维随机变量函数 max ⁡ , min ⁡ \max,\min max,min的处理,简单的可以用公式,复杂的还是要理解推导的:

且注意对于概率 P ( X ≤ x , Y ≤ y ) P(X \leq x,Y \leq y) P(Xx,Yy),其内部相当于积事件 P ( A B ) P(AB) P(AB),而不是和事件 P ( A + B ) P(A+B) P(A+B)

由于分布函数的 F Z ( z ) F_Z(z) FZ(z)的概率形式是 P ( Z ≤ z ) P(Z \leq z) P(Zz),所以常遇见的都是 P ( max ⁡ { X , Y } ≤ z ) 或 P ( min ⁡ { X , Y } ≤ z ) P(\max\{X,Y\} \leq z )或P(\min\{X,Y\} \leq z ) P(max{X,Y}z)P(min{X,Y}z),且要注意是否有独立条件。

对于不常见的 P ( max ⁡ { X , Y } > z ) 或 P ( min ⁡ { X , Y } > z ) P(\max\{X,Y\} > z )或P(\min\{X,Y\} > z ) P(max{X,Y}>z)P(min{X,Y}>z),最终一般还是需要变成 1 − P ( max ⁡ { X , Y } ≤ z ) 或 1 − P ( min ⁡ { X , Y } ≤ z ) 1-P(\max\{X,Y\} \leq z )或1-P(\min\{X,Y\} \leq z ) 1P(max{X,Y}z)1P(min{X,Y}z)即可。事实上,两种形态随意转换,一般哪种简单用哪种。但是从计算的角度来讲,只用到联合分布是比较方便的(如果独立就更方便了,联合分布为各分布的积),所以最常用的还是 P ( max ⁡ { X , Y } ≤ z ) 或 P ( min ⁡ { X , Y } > z ) P(\max\{X,Y\} \leq z )或P(\min\{X,Y\} > z ) P(max{X,Y}z)P(min{X,Y}>z)形态

  1. max ⁡ \max max函数:

max ⁡ { X , Y } ≤ z ⇔ { X ≤ z } ∩ { Y ≤ z } max ⁡ { X , Y } > z ⇔ { X > z } ∪ { Y > z } \begin{aligned} &\max\{X,Y\} \leq z \Leftrightarrow\{X \leq z\} \cap \{Y \leq z\}\\ &\max\{X,Y\} > z \Leftrightarrow\{X > z\} \cup \{Y > z\}\\ \end{aligned} max{X,Y}z{Xz}{Yz}max{X,Y}>z{X>z}{Y>z}

即有:

P ( max ⁡ { X , Y } ≤ z ) = P ( { X ≤ z } ∩ { Y ≤ z } ) = P ( X ≤ z , Y ≤ z ) = F ( z , z ) = 独 F X ( z ) F Y ( z ) P(\max\{X,Y\} \leq z )=P(\{X \leq z\} \cap \{Y \leq z\})=P(X \leq z,Y \leq z)=F(z,z)\stackrel{\mathrm{独}}{=}F_X(z)F_Y(z) P(max{X,Y}z)=P({Xz}{Yz})=P(Xz,Yz)=F(z,z)=FX(z)FY(z)

  1. min ⁡ \min min函数:

min ⁡ { X , Y } ≤ z ⇔ { X ≤ z } ∪ { Y ≤ z } = { X ≤ z } + { Y ≤ z } − { { X ≤ z } ∩ { Y ≤ z } } min ⁡ { X , Y } > z ⇔ { X > z } ∩ { Y > z } \begin{aligned} &\min\{X,Y\} \leq z \Leftrightarrow\{X \leq z\} \cup \{Y \leq z\} = \{X \leq z\}+\{Y \leq z\} -\{\{X \leq z\} \cap \{Y \leq z\}\}\\ &\min\{X,Y\} > z \Leftrightarrow\{X > z\} \cap \{Y > z\}\\ \end{aligned} min{X,Y}z{Xz}{Yz}={Xz}+{Yz}{{Xz}{Yz}}min{X,Y}>z{X>z}{Y>z}

即有:

P ( min ⁡ { X , Y } ≤ z ) = F X ( z ) + F Z ( z ) − F X Y ( z , z ) P(\min\{X,Y\} \leq z )=F_X(z)+F_Z(z)-F_{XY}(z,z) P(min{X,Y}z)=FX(z)+FZ(z)FXY(z,z)

特别地,当 X , Y X,Y X,Y相互独立时有:

P ( min ⁡ { X , Y } ≤ z ) = 1 − P ( min ⁡ { X , Y } > z ) = 1 − P ( X > z ) P ( Y > z ) = 1 − [ 1 − F X ( z ) ] [ 1 − F Y ( z ) ] P(\min\{X,Y\} \leq z )=1-P(\min\{X,Y\} > z )=1-P(X>z)P(Y>z)=1-[1-F_X(z)][1-F_Y(z)] P(min{X,Y}z)=1P(min{X,Y}>z)=1P(X>z)P(Y>z)=1[1FX(z)][1FY(z)]

真正常用的还是 max ⁡ { X , Y } ≤ z \max\{X,Y\} \leq z max{X,Y}z或者 min ⁡ { X , Y } ≤ z \min\{X,Y\} \leq z min{X,Y}z,毕竟与分布函数相联系,其余的两种情况类似

例:已知 X 1 , X 2 X_1,X_2 X1,X2的分布函数 F ( x ) F(x) F(x),且 X = max ⁡ { X 1 , X 2 } , Y = min ⁡ { X 1 , X 2 } X=\max\{X_1,X_2\},Y=\min\{X_1,X_2\} X=max{X1,X2},Y=min{X1,X2},求 ( X , Y ) (X,Y) (X,Y)的分布函数 F ( x , y ) F(x,y) F(x,y)

解:易有:

F ( x , y ) = P ( max ⁡ { X 1 , X 2 } ≤ x , min ⁡ { X 1 , X 2 } ≤ y ) = P ( { X 1 ≤ x } ∩ { X 2 ≤ x } ∩ { { X 1 ≤ y } ∪ { X 2 ≤ y } } ) \begin{aligned} &F(x,y)=P(\max\{X_1,X_2\}\leq x,\min\{X_1,X_2\}\leq y)=P(\{X_1 \leq x\}\cap\{X_2 \leq x\}\cap\{\{X_1 \leq y\}\cup\{X_2 \leq y\}\})\\ \end{aligned} F(x,y)=P(max{X1,X2}x,min{X1,X2}y)=P({X1x}{X2x}{{X1y}{X2y}})

令: { X 1 ≤ x } , { X 2 ≤ x } , { X 1 ≤ y } , { X 2 ≤ y } \{X_1 \leq x\},\{X_2 \leq x\},\{X_1 \leq y\},\{X_2 \leq y\} {X1x},{X2x},{X1y},{X2y}分别为 A , B , C , D A,B,C,D A,B,C,D,有:

F ( x , y ) = P ( A B ( C + D ) ) = P ( A B C + A B D ) = P ( A B C ) + P ( A B D ) − P ( A B C D ) = P ( A C ) P ( B ) + P ( B D ) P ( A ) − P ( A C ) P ( B D ) \begin{aligned} F(x,y)&=P(AB(C+D))=P(ABC+ABD)=P(ABC)+P(ABD)-P(ABCD)\\ &=P(AC)P(B)+P(BD)P(A)-P(AC)P(BD)\\ \end{aligned} F(x,y)=P(AB(C+D))=P(ABC+ABD)=P(ABC)+P(ABD)P(ABCD)=P(AC)P(B)+P(BD)P(A)P(AC)P(BD)

接下来分类讨论。 x ≤ y x \leq y xy时, P ( A C ) = P ( A ) , P ( B D ) = P ( B ) P(AC)=P(A),P(BD)=P(B) P(AC)=P(A),P(BD)=P(B);当 x > y x>y x>y时, P ( A C ) = P ( C ) , P ( B D ) = P ( D ) P(AC)=P(C),P(BD)=P(D) P(AC)=P(C),P(BD)=P(D)

注意常见的题目,若已知随机变量 X X X的分布函数 f X ( x ) f_X(x) fX(x),又知道随机变量 X X X Y Y Y的关系 Y = g ( X ) Y=g(X) Y=g(X),与反函数 g − 1 ( Y ) g^{-1}(Y) g1(Y),若让求 Y Y Y的分布函数,那么显然用

P ( Y ≤ y ) = P ( g ( X ) ≤ y ) = P ( X ≤ g − 1 ( y ) ) P(Y \leq y)=P(g(X) \leq y)=P(X \leq g^{-1}(y)) P(Yy)=P(g(X)y)=P(Xg1(y))

注意这里关于 P ( X ≤ g − 1 ( y ) ) P(X \leq g^{-1}(y)) P(Xg1(y))的求解,不要直接由 f X ( x ) f_X(x) fX(x)积分,而是要实现求出分布函数 F X ( x ) F_X(x) FX(x),再代入分布函数。因为由于一般来讲都要根据 g − 1 ( y ) g^{-1}(y) g1(y)的值分段讨论,有的甚至能分4,5个段以上,重复求4,5个积分及其麻烦,不如事先求好分布函数再代入。

拓展:对于已知 ( X , Y ) (X,Y) (X,Y)的联合分布密度 f ( x , y ) f(x,y) f(x,y),与 Z Z Z的分布律,让求 U = X + Y + Z U=X+Y+Z U=X+Y+Z的分布函数,那么可以先令 V = X + Y V=X+Y V=X+Y,利用 f ( x , y ) f(x,y) f(x,y) F V ( v ) F_V(v) FV(v),那么就变成了求 U = V + Z U=V+Z U=V+Z的分布函数,剩下的参考上面内容

6 数字特征

常用的分布及数字特征:

$$

\begin{array}{ccc}
\hline
分布&期望&方差\
\hline
B(1,p)&p&p(1-p)\
B(n,p)&np&np(1-p)\
p(\lambda)& \lambda & \lambda \
U(a,b)&\frac{a+b}{2}&\frac{(b-a)^2}{12}\
E( \lambda )&\frac{1}{ \lambda }&\frac{1}{ \lambda ^2}\
G§&\frac{1}{p}&\frac{1}{p^2}\
H(N,M,n)&\frac{nM}{N}&\frac{nM}{N}(1-\frac{M}{N})\frac{N-n}{N-1}\
\chi^2(n)&n&2n\
t(n)&0&\frac{n}{n-2}\
\hline

\end{array}

$$

超几何分布 H ( N , M , n ) H(N,M,n) H(N,M,n) N N N件物品中, M M M个指定类,抽 n n n次(不放回),抽到指定类的次数的概率:

P ( x = k ) = C M k C N − M n − k C N n , k = 0 , 1 , ⋯   , min ⁡ { n , m } P(x=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n},\quad k=0,1,\cdots,\min\{n,m\} P(x=k)=CNnCMkCNMnk,k=0,1,,min{n,m}

Y = g ( X ) Y=g(X) Y=g(X)的均值,即可以考虑先求 Y Y Y的分布,再求均值,也可以考虑利用公式 E ( g ( x ) ) = ∫ − ∞ + ∞ g ( x ) f ( x ) d x E(g(x))=\int_{-\infty}^{+\infty}g(x)f(x)dx E(g(x))=+g(x)f(x)dx求解

分布律 P ( x i ) = p i , i = 1 , 2 , ⋯   , ∞ P(x_i)=p_i,\quad i=1,2,\cdots,\infty P(xi)=pi,i=1,2,,的期望存在的充要条件是 ∑ i = 1 ∞ a n p n \sum\limits_{i=1}^{\infty}a_np_n i=1anpn绝对收敛

若分布 X , Y X,Y X,Y的相关系数为 ± 1 \pm 1 ±1,则二者满足 Y = a X + b Y=aX+b Y=aX+b,具体 a , b a,b a,b可用数字特征求解

若相关系数存在,且 f ( x , y ) = f ( − x , y ) f(x,y)=f(-x,y) f(x,y)=f(x,y) f ( x , y ) = f ( x , − y ) f(x,y)=f(x,-y) f(x,y)=f(x,y),则二者相关系数系数为0

对于二维均匀分布,若区域 D D D为矩形,则 X , Y X,Y XY独立,反之则不独立。若 D D D关于 x x x轴或 y y y轴对称,则 X , Y X,Y XY不相关

方差 D ( X ) D(X) D(X)并没有专门的积分公式进行求解,但是可以用积分求解 E ( X ) E(X) E(X) E ( X 2 ) E(X^2) E(X2),再用 D ( X ) = E ( X 2 ) − E 2 ( X ) D(X)=E(X^2)-E^2(X) D(X)=E(X2)E2(X)

注意牛顿二项式公式: ( p + q ) n = ∑ k = 0 n C n k p k q n − k (p+q)^n=\sum\limits_{k=0}^{n}C_n^kp^kq^{n-k} (p+q)n=k=0nCnkpkqnk,注意其与伯努利分布的结合

如: X ∼ B ( n , p ) , Y = e X X \sim B(n,p),Y=e^X XB(n,p),Y=eX,则:

E Y = ∑ k = 0 n e k p k ( 1 − p ) n − k = ∑ k = 0 n ( p e ) k ( 1 − p ) n − k = ( p e + 1 − p ) n EY=\sum\limits_{k=0}^{n}e^kp^k(1-p)^{n-k}=\sum\limits_{k=0}^{n}(pe)^k(1-p)^{n-k}=(pe+1-p)^n EY=k=0nekpk(1p)nk=k=0n(pe)k(1p)nk=(pe+1p)n

当让求和式之间的协方差时(如 COV ( X , X + Y ) \text{COV}(X,X+Y) COV(X,X+Y)),可以考虑利用协方差计算的性质;但是若计算乘式之间的协方差时(如 COV ( X , X Y ) \text{COV}(X,XY) COV(X,XY)),则需要考虑公式 COV ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) \text{COV}(X,Y)=E(XY)-E(X)E(Y) COV(X,Y)=E(XY)E(X)E(Y)

让求二维正态分布的相关系数,勿忘凑二维正态分布的相关系数矩阵形式:

f ( x , y ) = 1 2 π σ 1 σ 2 1 − ρ 2 exp ⁡ { 1 2 ( 1 − ρ 2 ) [ ( x − μ 1 ) 2 σ 1 2 − 2 ρ ( x − μ 1 ) ( y − μ 2 ) σ 1 σ 2 + ( y − μ 2 ) 2 σ 2 2 ] } f(x,y)=\frac{1}{2\pi \sigma_1\sigma_2\sqrt{1-\rho^2}}\exp\{\frac{1}{2(1-\rho^2)}[\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]\} f(x,y)=2πσ1σ21ρ2 1exp{2(1ρ2)1[σ12(xμ1)22ρσ1σ2(xμ1)(yμ2)+σ22(yμ2)2]}

7 大数定理与中心极限定理

一共有3个大数定律,三者归根到底都是在讲一定条件下:

1 n ∑ i = 1 n X i ⟶ p 1 n ∑ i = 1 n E X i \frac{1}{n}\sum\limits_{i=1}^{n}X_i\stackrel{p}\longrightarrow \frac{1}{n}\sum\limits_{i=1}^{n}EX_i n1i=1nXipn1i=1nEXi

即用样本均值来逼近分布均值

三种大数定理及其条件:

  1. 切比雪夫大数定理条件

    1. 独立(并未要求同分布)
    2. 方差一致且有上界(有方差)
  2. 伯努利大数定理

    可由切比雪夫大数定理推得,很少用

  3. 辛钦大数定理:

    $$
    \begin{aligned}
    \forall \epsilon>0,\quad

    &\lim\limits_{n \rightarrow \infty}P{|\frac{1}{n}\sum\limits_{i=1}^{n}X_i-\mu|<\epsilon}=1或\
    &\lim\limits_{n \rightarrow \infty}P{|\frac{1}{n}\sum\limits_{i=1}^{n}X_i-\mu|\geq\epsilon}=0\
    \end{aligned}
    $$

    条件:

    1. 独立;
    2. 同分布;
    3. 期望存在(并未要求方差存在,方差不存在指方差趋近于 ∞ \infty

注意切比雪夫不等式与辛钦大数定理由于 P P P中含有绝对值,所以有时用之前应该凑一下形式,补一下绝对值号,才能看出来

中心极限定理:

lim ⁡ n → ∞ 1 n ∑ i = 1 n X i = X ‾ ⟶ p N ( μ , σ 2 n ) 或 : lim ⁡ n → ∞ ∑ i = 1 n X i ⟶ p N ( n μ , n σ 2 ) \begin{aligned} &\lim\limits_{n \rightarrow \infty}\frac{1}{n}\sum\limits_{i=1}^{n}X_i=\overline{X} \stackrel{p}\longrightarrow N(\mu,\frac{\sigma^2}{n})\quad或:\\ &\lim\limits_{n \rightarrow \infty}\sum\limits_{i=1}^{n}X_i \stackrel{p}\longrightarrow N(n\mu,n\sigma^2)\\ \end{aligned} nlimn1i=1nXi=XpN(μ,nσ2)nlimi=1nXipN(nμ,nσ2)

具体应用时记住,只要题目涉及独立同分布随机变量的和 ∑ X \sum\limits_{}^{}X X,就要考虑这个中心极限定理

如:知道每个元器件正常工作的概率为 p p p,求n个元器件一起工作时,至少m个正常工作的概率,那么就是 ∑ 1 100 X i ∼ N ( n p , n p ( 1 − p ) ) \sum\limits_{1}^{100}X_i \sim N(np,np(1-p)) 1100XiN(np,np(1p)),然后再求 P ( ∑ 1 100 X i ≥ m ) P(\sum\limits_{1}^{100}X_i \geq m) P(1100Xim)即可(转化为标准正态分布)

题目要证明依概率收敛的话,可以考虑用切比雪夫不等式,令 n → ∞ n \rightarrow \infty n时,取极限为0或1

若果题目是问依概率收敛为何值,那么已经默认是收敛,就不用切比雪夫不等式,应该利用结论:若 X i X_i Xi独立同分布,则 E ( X i 2 ) E(X_i^2) E(Xi2)存在,且有 lim ⁡ n → ∞ 1 n ∑ i = 1 n ⟶ p E ( X i k ) \lim\limits_{n \rightarrow \infty}\frac{1}{n}\sum\limits_{i=1}^{n}\stackrel{p}\longrightarrow E(X_i^k) nlimn1i=1npE(Xik),将原式子展开分别去求即可

切比雪夫不等式并没有 n → ∞ n \rightarrow \infty n的要求

8 统计量及其分布

S 2 S^2 S2 σ 2 \sigma^2 σ2的无偏估计与一致估计, S S S σ \sigma σ的无偏估计,但不一定是一致估计

本章涉及的分布多是 ∑ X 2 \sum X^2 X2类型的,要是有 ( ∑ X ) 2 (\sum X)^2 (X)2的,那么考虑分布 Y = ∑ X Y=\sum X Y=X,进而求 Y 2 Y^2 Y2的分布

均值与方差的统计特征:

E ( X ‾ ) = E ( X ) , D ( X ‾ ) = D ( X ) n E ( S 2 ) = D ( X ) \begin{aligned} &E(\overline X)=E(X),\quad D(\overline X)=\frac{D(X)}{n}\\ &E(S^2)=D(X)\\ \end{aligned} E(X)=E(X),D(X)=nD(X)E(S2)=D(X)

特别地,若是有 X i ∼ N ( μ , σ 2 ) X_i \sim N(\mu,\sigma^2) XiN(μ,σ2),则有 ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) σ2(n1)S2χ2(n1),则此时可求 D ( S 2 ) D(S^2) D(S2),但如果是一般性的分布,其方差就不一定有这个性质了;同理,对于正态分布的 D ( X ˉ 2 ) D(\bar X^2) D(Xˉ2)也可以利用 χ ( n ) \chi(n) χ(n)分布来进行计算。

来自正态分布总体的样本的均值与方差相互独立,这一点有时可以帮助分布之间的独立性:

例:设 X 1 , X 2 X_1,X_2 X1,X2是来自正态总体的简单随机样本,证明 ( X 1 + X 2 ) 2 (X_1+X_2)^2 (X1+X2)2 ( X 1 − X 2 ) 2 (X_1-X_2)^2 (X1X2)2相互独立

解:易有 X ˉ = X 1 + X 2 2 \bar X=\frac{X_1+X_2}{2} Xˉ=2X1+X2与方差 S 2 S^2 S2相互独立,而:

S 2 = ∑ i = 1 n ( X i − X ˉ ) 2 n − 1 = ( X 1 − X 1 + X 2 2 ) 2 + ( X 2 − X 1 + X 2 2 ) 2 = ( X 1 − X 2 ) 2 2 S^2=\frac{ \sum\limits_{i=1}^{n}(X_i-\bar X)^2}{n-1}=(X_1-\frac{X_1+X_2}{2})^2+(X_2-\frac{X_1+X_2}{2})^2=\frac{(X_1-X_2)^2}{2} S2=n1i=1n(XiXˉ)2=(X12X1+X2)2+(X22X1+X2)2=2(X1X2)2

所以 ( X 1 + X 2 ) (X_1+X_2) (X1+X2) ( X 1 − X 2 ) 2 (X_1-X_2)^2 (X1X2)2相互独立,即 ( X 1 + X 2 ) 2 (X_1+X_2)^2 (X1+X2)2 ( X 1 − X 2 ) 2 (X_1-X_2)^2 (X1X2)2相互独立

χ 2 ( 2 ) \chi^2(2) χ2(2) E ( 1 2 ) E(\frac{1}{2}) E(21)的概率密度函数相同

9 参数估计与假设检验

区分好 α \alpha α——显著性水平,与 1 − α 1-\alpha 1α——置信水平

区间估计与假设检验的核心公式:

估 μ { ( X ‾ − σ n Z α 1 , X ‾ + σ n Z α 2 ) ( X ‾ − S n t α 1 ( n − 1 ) , X ‾ + S n t α 1 ( n − 1 ) α 1 + α 2 = 1 Φ ( Z α 1 ) = 1 − α 1 , Φ ( Z α 2 ) = 1 − α 2 估\mu\begin{cases} &(\overline X-\frac{\sigma}{\sqrt{n}}Z_{\alpha_1},\overline X+\frac{\sigma}{\sqrt{n}}Z_{\alpha_2})\\ &(\overline X-\frac{S}{\sqrt{n}}t_{\alpha_1}(n-1),\overline X+\frac{S}{\sqrt{n}}t_{\alpha_1}(n-1)\\ &\alpha_1+\alpha_2=1\\ &\Phi(Z\alpha_1)=1-\alpha_1, \quad \Phi(Z\alpha_2)=1-\alpha_2\\ \end{cases} μ(Xn σZα1,X+n σZα2)(Xn Stα1(n1),X+n Stα1(n1)α1+α2=1Φ(Zα1)=1α1,Φ(Zα2)=1α2

若是令 α 1 = α 2 = α 2 \alpha_1=\alpha_2=\frac{\alpha}{2} α1=α2=2α,则称其为等尾置信区间,最为常用

假设检验是在区间估计的基础上推导的。共 2 ( 1 + 2 ) = 6 2(1+2)=6 2(1+2)=6种。

假设检验的假设一般是两个对立假设成对出现,即原假设 H 0 H_0 H0,对立假设 H 1 H_1 H1,其中原假设必须包含等号, H 1 H_1 H1对应的区间为拒绝域。

为了简便起见,以下仅讨论知道 σ 2 \sigma^2 σ2的等尾置信区间:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QM0vVlFj-1668578412518)(https://s3-us-west-2.amazonaws.com/secure.notion-static.com/a6a61ea0-97cf-4176-bfbf-6cc116d2fba9/Untitled.png)]

那么对应的 H 0 H_0 H0 H 1 H_1 H1及拒绝域为:

H 0 H 1 拒 绝 域 μ = μ 0 μ ≠ μ 0 U 1 + U 2 μ ≥ μ 0 μ < μ 0 U 1 μ ≤ μ 0 μ > μ 0 U 2 \begin{array}{ccc}\hline H_0&H_1&拒绝域\\ \hline \mu=\mu_0&\mu \neq\mu_0&U_1+U_2\\ \mu \geq \mu_0&\mu<\mu_0&U_1\\ \mu \leq \mu_0&\mu> \mu_0&U_2\\ \hline\end{array} H0μ=μ0μμ0μμ0H1μ=μ0μ<μ0μ>μ0U1+U2U1U2

有效是在无偏的基础上,故题目让判断是否有效,应先判断是否无偏

原假设必须包含等号,有一类题目会让检验什么东西,且这个东西不一定就要是原假设

如果分布 X X X为偶函数(如学生氏分布),则有 X 1 − α = − X α X_{1-\alpha}=-X_\alpha X1α=Xα

什么时候用二阶矩:

  1. 包含双参数,那么可以考虑通过一二阶矩方程构建方程组求解
  2. 虽然只有单参数,但是仅由一阶矩方程无法解出(如超越方程),此时可考虑建立二阶矩方程

注意第一类错误率与第二类错误率的计算式实际上就是条件概率,直接计算即可:

例:设 X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn为来自总体 X ∼ N ( μ , 1 ) X \sim N(\mu,1) XN(μ,1)的随机样本, X ˉ \bar X Xˉ为样本均值,证明对于假设检验 H 0 : μ = μ 0 H_0:\mu=\mu_0 H0:μ=μ0,若取拒绝域 R α = { X ˉ > μ 0 + 1.96 n } R_\alpha=\{\bar X > \mu_0+\frac{1.96}{\sqrt{n}}\} Rα={Xˉ>μ0+n 1.96},则第一类错误率 α \alpha α 1 − Φ ( 1.96 ) 1- \Phi(1.96) 1Φ(1.96)

解:易有:

α = P { 拒 绝 H 0 ∣ H 0 为 真 } = P { X ˉ > μ 0 + 1.96 n ∣ μ = μ 0 } \alpha=P\{拒绝H_0|H_0为真\}=P\{\bar X>\mu_0+\frac{1.96}{\sqrt{n}}|\mu=\mu_0\} α=P{H0H0}=P{Xˉ>μ0+n 1.96μ=μ0}

μ = μ 0 \mu=\mu_0 μ=μ0

α = P { X ˉ > μ 0 + 1.96 n } = 1 − P { X ˉ − μ 0 1 n ≤ 1.96 } = 1 − Φ ( 1.96 ) \alpha=P\{\bar X>\mu_0+\frac{1.96}{\sqrt{n}}\}=1-P\{\frac{\bar X-\mu_0}{\sqrt{\frac{1}{n}}} \leq 1.96\}=1-\Phi(1.96) α=P{Xˉ>μ0+n 1.96}=1P{n1 Xˉμ01.96}=1Φ(1.96)

注意,若 θ \theta θ的置信区间为 ( a , b ) (a,b) (a,b)的置信度为 p p p,那么有公式 P ( a < θ < b ) = p P(a<\thetaP(a<θ<b)=p

你可能感兴趣的:(考研数学,线性代数)