本文大纲来自于学堂在线平台重庆大学的数理统计课程。
研究随机现象的工具 { 概率论: X ∼ F ( x ; θ ) ⇒ { 概率 分布函数 分布律或者密度函数 期望或者方差 … 数理统计: X 1 X 2 ⋮ X n } ⇒ X ∼ F ( x ; θ ) 研究随机现象的工具 \begin{cases} 概率论: X \sim F(x;\theta) \Rightarrow \begin{cases} 概率 \\ 分布函数 \\ 分布律或者密度函数 \\ 期望或者方差 \\ \dots \end{cases} \\ 数理统计: \begin{rcases} X_1 \\ X_2 \\ \vdots \\ X_n \end{rcases} \Rightarrow X \sim F(x;\theta) \\ \end{cases} 研究随机现象的工具⎩ ⎨ ⎧概率论:X∼F(x;θ)⇒⎩ ⎨ ⎧概率分布函数分布律或者密度函数期望或者方差…数理统计:X1X2⋮Xn⎭ ⎬ ⎫⇒X∼F(x;θ)
样本满足如下性质:
这种样本也成为简单随机样本。
F ( x 1 , x 2 , … , x n ) = P { X 1 ≤ x 1 , X 2 ≤ x 2 , … , X n ≤ x n } = P { X 1 ≤ x 1 } P { X 2 ≤ x 2 } … P { X n ≤ x n } = ∏ i = 1 n F ( x i ) \begin{aligned} F(x_1,x_2,\dots,x_n)&=P\{X_1 \leq x_1,X_2 \leq x_2,\dots,X_n \leq x_n \} \\ &= P\{X_1 \leq x_1\}P\{X_2 \leq x_2\} \dots P\{X_n \leq x_n\} \\ &=\prod_{i=1}^nF(x_i) \end{aligned} F(x1,x2,…,xn)=P{X1≤x1,X2≤x2,…,Xn≤xn}=P{X1≤x1}P{X2≤x2}…P{Xn≤xn}=i=1∏nF(xi)
总体 X X X为连续性随机变量
f ( x 1 , x 2 , … , x n ) = f ( x 1 ) f ( x 2 ) … f ( x n ) = ∏ i = 1 n f ( x i ) \begin{aligned} f(x_1,x_2,\dots,x_n) &= f(x_1)f(x_2)\dots f(x_n)=\prod_{i=1}^nf(x_i) \end{aligned} f(x1,x2,…,xn)=f(x1)f(x2)…f(xn)=i=1∏nf(xi)
总体 X X X为离散型随机变量
P { X 1 = x 1 , X 2 = x 2 , … , X n = x n } = P { X 1 = x 1 } P { X 2 = x 2 } … P { X n = x n } = P { X = x 1 } P { X = x 2 } … P { X = x n } = ∏ i = 1 n P { X = x i } \begin{aligned} P\{ X_1=x_1,X_2=x_2,\dots,X_n=x_n \}&=P\{ X_1=x_1 \}P\{ X_2=x_2 \}\dots P\{ X_n=x_n \} \\ &=P\{ X=x_1 \}P\{ X=x_2 \}\dots P\{ X=x_n \} \\ &=\prod_{i=1}^nP\{ X=x_i \} \end{aligned} P{X1=x1,X2=x2,…,Xn=xn}=P{X1=x1}P{X2=x2}…P{Xn=xn}=P{X=x1}P{X=x2}…P{X=xn}=i=1∏nP{X=xi}
样本的统计量:
名称 | 公式 | 说明 |
---|---|---|
均值 | X ‾ = 1 n ∑ i = 1 n X i \overline X = \frac{1}{n} \sum_{i=1}^nX_i X=n1∑i=1nXi | |
方差 | S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 = 1 n − 1 ∑ i = 1 n ( X i 2 − n X ‾ 2 ) S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline X)^2=\frac{1}{n-1}\sum_{i=1}^n(X_i^2-n\overline X^2) S2=n−11∑i=1n(Xi−X)2=n−11∑i=1n(Xi2−nX2) | 分母为 n − 1 n-1 n−1,表示样本方差是总体方差的无偏估计 |
标准差 | S | |
样本K阶原点矩 | M k = 1 n ∑ i = 1 n X i k M_k=\frac{1}{n}\sum_{i=1}^nX_i^k Mk=n1∑i=1nXik | k = 1 k=1 k=1时,即为均值 |
样本K阶中心距 | M k ∗ = 1 n ∑ i = 1 n ( X i − X ‾ ) k M_k^*=\frac{1}{n}\sum_{i=1}^n(X_i-\overline X)^k Mk∗=n1∑i=1n(Xi−X)k | k = 2 k=2 k=2时,即位未修正的方差 |
性质1: ∑ i = 1 n ( X i − X ‾ ) = 0 \sum_{i=1}^n(X_i-\overline X)=0 ∑i=1n(Xi−X)=0
性质2:若总体 X X X的期望 E X = μ EX=\mu EX=μ,方差为 D X = σ 2 DX=\sigma^2 DX=σ2,则:
E X ‾ = μ , D X ‾ = 1 n σ 2 E\overline X=\mu,D\overline X=\frac{1}{n}\sigma^2 EX=μ,DX=n1σ2
E S 2 = μ 2 ES^2=\mu^2 ES2=μ2
样本均值与样本方差的关系: E X 2 = D X + ( E X ) 2 EX^2=DX+(EX)^2 EX2=DX+(EX)2
样本均值与样本1阶原点矩的关系: X ‾ = M 1 \overline X = M_1 X=M1
样本方差与样本2阶中心距的关系:
S 2 = n n − 1 M 2 ∗ S^2=\frac{n}{n-1} M_2^* S2=n−1nM2∗
样本均值、样本2阶原点矩、样本2阶中心距的关系:
M 2 ∗ = 1 n ∑ i = 1 n X i 2 − X ‾ 2 = M 2 − X ‾ 2 M_2^*=\frac{1}{n}\sum_{i=1}^nX_i^2-\overline X^2=M_2-\overline X^2 M2∗=n1i=1∑nXi2−X2=M2−X2
X ( 1 ) ≤ X ( 2 ) ⋯ ≤ X ( n ) X_{(1)} \leq X_{(2)} \dots \leq X_{(n)} X(1)≤X(2)⋯≤X(n), X ( 1 ) , X ( 2 ) , … X ( n ) X_{(1)},X_{(2)},\dots X_{(n)} X(1),X(2),…X(n)称为顺序统计量。
特别地, X ( 1 ) = m i n { X 1 , X 2 , … , X n } X_{(1)}=min\{ X_1,X_2,\dots,X_n \} X(1)=min{X1,X2,…,Xn}, X ( n ) = m a x { X 1 , X 2 , … , X n } X_{(n)}=max\{ X_1,X_2,\dots,X_n \} X(n)=max{X1,X2,…,Xn}
注意:顺序统计量既不独立,也不同分布
经验分布函数
F n ( x ) = { 0 , x < x ( 1 ) k n , x ( k ) ≤ x ≤ x ( k + 1 ) 1 , x ≥ x ( n ) F_n(x)= \begin{cases} 0, x
分布 | 记法 | 分布律/概率密度函数 | EX | DX |
---|---|---|---|---|
0-1分布 | X ∼ B ( 1 , p ) X\sim B(1,p) X∼B(1,p) | P { X = k } = p k ( 1 − p ) 1 − k , k = 0 , 1 P\{ X=k \} = p^k(1-p)^{1-k},k=0,1 P{X=k}=pk(1−p)1−k,k=0,1 | p p p | p ( 1 − p ) p(1-p) p(1−p) |
二项分布 | X ∼ B ( n , p ) X\sim B(n,p) X∼B(n,p) | P { X = k } = C n k p k ( 1 − p ) 1 − k , k = 0 , 1 , … , n P\{ X=k \} = C_n^k p^k(1-p)^{1-k},k=0,1,\dots,n P{X=k}=Cnkpk(1−p)1−k,k=0,1,…,n | n p np np | n p ( 1 − p ) np(1-p) np(1−p) |
泊松分布 | X ∼ P ( λ ) X\sim P(\lambda) X∼P(λ) | P { X = k } = λ k e − λ k ! , k = 0 , 1 P\{ X=k \} = \frac{\lambda^ke^{-\lambda}}{k!},k=0,1 P{X=k}=k!λke−λ,k=0,1 | λ \lambda λ | λ \lambda λ |
均匀分布 | X ∼ U ( a , b ) X\sim U(a,b) X∼U(a,b) | f ( x ) = 1 b − a , a < x < b f(x)=\frac{1}{b-a},a |
a + b 2 \frac{a+b}{2} 2a+b | ( b − a ) 2 12 \frac{(b-a)^2}{12} 12(b−a)2 |
几何分布 | X ∼ G ( p ) X\sim G(p) X∼G(p) | p ( 1 − p ) ( k − 1 ) p(1-p)^{(k-1)} p(1−p)(k−1) | 1 p \frac{1}{p} p1 | 1 − p p 2 \frac{1-p}{p^2} p21−p |
指数分布 | X ∼ Γ ( 1 , λ ) X\sim \Gamma(1,\lambda) X∼Γ(1,λ) | f ( x ) = λ e − λ x , x > 0 f(x)=\lambda e^{-\lambda x},x>0 f(x)=λe−λx,x>0 | 1 λ \frac{1}{\lambda} λ1 | 1 λ 2 \frac{1}{\lambda ^2} λ21 |
正态分布 | X ∼ N ( μ , σ 2 ) X\sim N(\mu, \sigma ^ 2) X∼N(μ,σ2) | μ \mu μ | σ 2 \sigma^2 σ2 |
卡方分布
t t t分布
F F F分布
样本均值的抽样分布: X ‾ ∼ N ( μ , σ 2 n ) \overline X \sim N(\mu, \frac{\sigma^2}{n} ) X∼N(μ,nσ2)
样本方差的抽样分布:$$
离散型随机变量:
P ( x ) = P ( X = x ) P(x)=P(X=x) P(x)=P(X=x) F ( x ) = P ( X ≤ x ) = ∑ x k ≤ x P x k F(x)=P(X \leq x)=\sum_{x_k \leq x }P_{x_k} F(x)=P(X≤x)=xk≤x∑Pxk
连续型随机变量:
P ( x ) = f ( x ) P(x)=f(x) P(x)=f(x) F ( x ) = P ( X ≤ x ) = ∫ − ∞ x f ( t ) d t F(x)=P(X \leq x)=\int_{-\infty}^xf(t)dt F(x)=P(X≤x)=∫−∞xf(t)dt F ′ ( x ) = f ( x ) F'(x)=f(x) F′(x)=f(x)