【数学基础】应用数理统计知识点

本文大纲来自于学堂在线平台重庆大学的数理统计课程。

1. 基本概念

1.1 研究随机现象的工具

研究随机现象的工具 { 概率论: X ∼ F ( x ; θ ) ⇒ { 概率 分布函数 分布律或者密度函数 期望或者方差 … 数理统计: X 1 X 2 ⋮ X n } ⇒ X ∼ F ( x ; θ ) 研究随机现象的工具 \begin{cases} 概率论: X \sim F(x;\theta) \Rightarrow \begin{cases} 概率 \\ 分布函数 \\ 分布律或者密度函数 \\ 期望或者方差 \\ \dots \end{cases} \\ 数理统计: \begin{rcases} X_1 \\ X_2 \\ \vdots \\ X_n \end{rcases} \Rightarrow X \sim F(x;\theta) \\ \end{cases} 研究随机现象的工具 概率论:XF(x;θ) 概率分布函数分布律或者密度函数期望或者方差数理统计:X1X2Xn XF(x;θ)

  • 概率论用演绎推理的方式,从已知分布出发,求各种值
  • 数理统计用归纳推理的方式,通过抽样,结合概率论相关理论,确定分布

1.2 常见概念

  • 总体:研究对象的总体,比如
    • 研究某厂生产的一批灯泡质量的好坏,总体就为这批灯泡的全体
    • 研究淘宝的用户,总体就为淘宝的所有用户
  • 个体:总体中的单个对象
  • 样本:从总体中抽样一部分出来,这一部分就称为样本,样本的大小称为样本容量。样本变量用 ( X 1 , X 2 , . . . . , X n ) (X_1,X_2,....,X_n) (X1,X2,....,Xn)表示,每个样本也称为随机变量
  • 观测值:对于样本中的每个样本,都会有一个具体的值,这个值称为观测值。观测值用 ( x 1 , x 2 , . . . , x n ) (x_1,x_2,...,x_n) (x1,x2,...,xn)表示

1.3 样本

样本满足如下性质:

  • 独立性:每次抽样之间没有关系,不会相互影响,即 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn相互独立
  • 同分布 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn中的每一个 X i X_i Xi与所考察的总体 X X X有相同的概率分布

这种样本也成为简单随机样本

1.3.1 样本的联合分布函数

F ( x 1 , x 2 , … , x n ) = P { X 1 ≤ x 1 , X 2 ≤ x 2 , … , X n ≤ x n } = P { X 1 ≤ x 1 } P { X 2 ≤ x 2 } … P { X n ≤ x n } = ∏ i = 1 n F ( x i ) \begin{aligned} F(x_1,x_2,\dots,x_n)&=P\{X_1 \leq x_1,X_2 \leq x_2,\dots,X_n \leq x_n \} \\ &= P\{X_1 \leq x_1\}P\{X_2 \leq x_2\} \dots P\{X_n \leq x_n\} \\ &=\prod_{i=1}^nF(x_i) \end{aligned} F(x1,x2,,xn)=P{X1x1,X2x2,,Xnxn}=P{X1x1}P{X2x2}P{Xnxn}=i=1nF(xi)

1.3.2 样本的联合密度函数

总体 X X X为连续性随机变量

f ( x 1 , x 2 , … , x n ) = f ( x 1 ) f ( x 2 ) … f ( x n ) = ∏ i = 1 n f ( x i ) \begin{aligned} f(x_1,x_2,\dots,x_n) &= f(x_1)f(x_2)\dots f(x_n)=\prod_{i=1}^nf(x_i) \end{aligned} f(x1,x2,,xn)=f(x1)f(x2)f(xn)=i=1nf(xi)

总体 X X X为离散型随机变量

P { X 1 = x 1 , X 2 = x 2 , … , X n = x n } = P { X 1 = x 1 } P { X 2 = x 2 } … P { X n = x n } = P { X = x 1 } P { X = x 2 } … P { X = x n } = ∏ i = 1 n P { X = x i } \begin{aligned} P\{ X_1=x_1,X_2=x_2,\dots,X_n=x_n \}&=P\{ X_1=x_1 \}P\{ X_2=x_2 \}\dots P\{ X_n=x_n \} \\ &=P\{ X=x_1 \}P\{ X=x_2 \}\dots P\{ X=x_n \} \\ &=\prod_{i=1}^nP\{ X=x_i \} \end{aligned} P{X1=x1,X2=x2,,Xn=xn}=P{X1=x1}P{X2=x2}P{Xn=xn}=P{X=x1}P{X=x2}P{X=xn}=i=1nP{X=xi}

1.4 统计量

样本的统计量:

名称 公式 说明
均值 X ‾ = 1 n ∑ i = 1 n X i \overline X = \frac{1}{n} \sum_{i=1}^nX_i X=n1i=1nXi
方差 S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 = 1 n − 1 ∑ i = 1 n ( X i 2 − n X ‾ 2 ) S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline X)^2=\frac{1}{n-1}\sum_{i=1}^n(X_i^2-n\overline X^2) S2=n11i=1n(XiX)2=n11i=1n(Xi2nX2) 分母为 n − 1 n-1 n1,表示样本方差是总体方差的无偏估计
标准差 S
样本K阶原点矩 M k = 1 n ∑ i = 1 n X i k M_k=\frac{1}{n}\sum_{i=1}^nX_i^k Mk=n1i=1nXik k = 1 k=1 k=1时,即为均值
样本K阶中心距 M k ∗ = 1 n ∑ i = 1 n ( X i − X ‾ ) k M_k^*=\frac{1}{n}\sum_{i=1}^n(X_i-\overline X)^k Mk=n1i=1n(XiX)k k = 2 k=2 k=2时,即位未修正的方差

1.4.1 样本均值的性质

性质1: ∑ i = 1 n ( X i − X ‾ ) = 0 \sum_{i=1}^n(X_i-\overline X)=0 i=1n(XiX)=0
性质2:若总体 X X X的期望 E X = μ EX=\mu EX=μ,方差为 D X = σ 2 DX=\sigma^2 DX=σ2,则:

E X ‾ = μ , D X ‾ = 1 n σ 2 E\overline X=\mu,D\overline X=\frac{1}{n}\sigma^2 EX=μDX=n1σ2

1.4.2 样本方差的性质

E S 2 = μ 2 ES^2=\mu^2 ES2=μ2

1.4.3 各个统计量之间的关系

样本均值与样本方差的关系: E X 2 = D X + ( E X ) 2 EX^2=DX+(EX)^2 EX2=DX+(EX)2

样本均值与样本1阶原点矩的关系: X ‾ = M 1 \overline X = M_1 X=M1

样本方差与样本2阶中心距的关系:

S 2 = n n − 1 M 2 ∗ S^2=\frac{n}{n-1} M_2^* S2=n1nM2

样本均值、样本2阶原点矩、样本2阶中心距的关系:

M 2 ∗ = 1 n ∑ i = 1 n X i 2 − X ‾ 2 = M 2 − X ‾ 2 M_2^*=\frac{1}{n}\sum_{i=1}^nX_i^2-\overline X^2=M_2-\overline X^2 M2=n1i=1nXi2X2=M2X2

1.5 样本顺序统计量与经验分布函数

X ( 1 ) ≤ X ( 2 ) ⋯ ≤ X ( n ) X_{(1)} \leq X_{(2)} \dots \leq X_{(n)} X(1)X(2)X(n) X ( 1 ) , X ( 2 ) , … X ( n ) X_{(1)},X_{(2)},\dots X_{(n)} X(1),X(2),X(n)称为顺序统计量。

特别地, X ( 1 ) = m i n { X 1 , X 2 , … , X n } X_{(1)}=min\{ X_1,X_2,\dots,X_n \} X(1)=min{X1,X2,,Xn} X ( n ) = m a x { X 1 , X 2 , … , X n } X_{(n)}=max\{ X_1,X_2,\dots,X_n \} X(n)=max{X1,X2,,Xn}

注意:顺序统计量既不独立,也不同分布

经验分布函数

F n ( x ) = { 0 , x < x ( 1 ) k n , x ( k ) ≤ x ≤ x ( k + 1 ) 1 , x ≥ x ( n ) F_n(x)= \begin{cases} 0, xFn(x)= 0,x<x(1)nk,x(k)xx(k+1)1,xx(n)

2. 常见分布

2.1 基础分布

分布 记法 分布律/概率密度函数 EX DX
0-1分布 X ∼ B ( 1 , p ) X\sim B(1,p) XB(1,p) P { X = k } = p k ( 1 − p ) 1 − k , k = 0 , 1 P\{ X=k \} = p^k(1-p)^{1-k},k=0,1 P{X=k}=pk(1p)1k,k=0,1 p p p p ( 1 − p ) p(1-p) p(1p)
二项分布 X ∼ B ( n , p ) X\sim B(n,p) XB(n,p) P { X = k } = C n k p k ( 1 − p ) 1 − k , k = 0 , 1 , … , n P\{ X=k \} = C_n^k p^k(1-p)^{1-k},k=0,1,\dots,n P{X=k}=Cnkpk(1p)1k,k=0,1,,n n p np np n p ( 1 − p ) np(1-p) np(1p)
泊松分布 X ∼ P ( λ ) X\sim P(\lambda) XP(λ) P { X = k } = λ k e − λ k ! , k = 0 , 1 P\{ X=k \} = \frac{\lambda^ke^{-\lambda}}{k!},k=0,1 P{X=k}=k!λkeλ,k=0,1 λ \lambda λ λ \lambda λ
均匀分布 X ∼ U ( a , b ) X\sim U(a,b) XU(a,b) f ( x ) = 1 b − a , a < x < b f(x)=\frac{1}{b-a},af(x)=ba1,a<x<b a + b 2 \frac{a+b}{2} 2a+b ( b − a ) 2 12 \frac{(b-a)^2}{12} 12(ba)2
几何分布 X ∼ G ( p ) X\sim G(p) XG(p) p ( 1 − p ) ( k − 1 ) p(1-p)^{(k-1)} p(1p)(k1) 1 p \frac{1}{p} p1 1 − p p 2 \frac{1-p}{p^2} p21p
指数分布 X ∼ Γ ( 1 , λ ) X\sim \Gamma(1,\lambda) XΓ(1,λ) f ( x ) = λ e − λ x , x > 0 f(x)=\lambda e^{-\lambda x},x>0 f(x)=λeλx,x>0 1 λ \frac{1}{\lambda} λ1 1 λ 2 \frac{1}{\lambda ^2} λ21
正态分布 X ∼ N ( μ , σ 2 ) X\sim N(\mu, \sigma ^ 2) XN(μ,σ2) μ \mu μ σ 2 \sigma^2 σ2

2.2 抽样分布

卡方分布
t t t分布
F F F分布

3. 分位数

4. 抽样分布定理

4.1 单正态总体的抽样分布

样本均值的抽样分布: X ‾ ∼ N ( μ , σ 2 n ) \overline X \sim N(\mu, \frac{\sigma^2}{n} ) XN(μ,nσ2)

样本方差的抽样分布:$$

密度函数、分布函数

离散型随机变量:

P ( x ) = P ( X = x ) P(x)=P(X=x) P(x)=P(X=x) F ( x ) = P ( X ≤ x ) = ∑ x k ≤ x P x k F(x)=P(X \leq x)=\sum_{x_k \leq x }P_{x_k} F(x)=P(Xx)=xkxPxk

连续型随机变量:

P ( x ) = f ( x ) P(x)=f(x) P(x)=f(x) F ( x ) = P ( X ≤ x ) = ∫ − ∞ x f ( t ) d t F(x)=P(X \leq x)=\int_{-\infty}^xf(t)dt F(x)=P(Xx)=xf(t)dt F ′ ( x ) = f ( x ) F'(x)=f(x) F(x)=f(x)

你可能感兴趣的:(数学,概率论,机器学习,人工智能)