概率论与统计(四) 参数估计(点估计、区间估计)

文章目录

    • 1.基础知识
      • 1.1中心极限定理
      • 1.2正态分布中的样本均值与方差
    • 2.点估计
      • 2.1矩估计
      • 2.2最大似然估计
      • 2.3贝叶斯估计
    • 3.单总体区间估计
      • 3.1单总体比例估计
      • 3.2单总体均值估计
      • 3.3单总体方差估计
    • 4.两独立总体区间估计
      • 4.1比率差的区间估计
      • 4.2均值差的区间估计
      • 4.3方差比的区间估计

1.基础知识

1.1中心极限定理

X1,X2,…Xn是一系列独立同分布的随机变量,当n足够大时 X 1 + X 2 + . . . + X n X_1+X_2+...+X_n X1+X2+...+Xn近似满足正态分布
推广结论:当样本数量足够大时(>30),样本均值近似服从正态分布,且期望值等于总体均值

1.2正态分布中的样本均值与方差

若X1,X2,…Xn来自同一正态分布的样本,样本均值的期望等于总体均值,样本方差的期望等于总体方差除以样本量
X ˉ ∼ N ( μ , σ 2 / n ) \bar X\sim N(\mu, \sigma^2/n) XˉN(μ,σ2/n)
( n − 1 ) S 2 / σ 2 ∼ χ ² ( n − 1 ) (n-1)S^2/\sigma^2 \sim χ²(n-1) (n1)S2/σ2χ²(n1)
n ( X ˉ − μ ) / S ∼ t n − 1 \sqrt{n}(\bar X-\mu)/S \sim t_{n-1} n (Xˉμ)/Stn1

2.点估计

借助于总体的一个样本来估计总体未知参数的值的问题称为参数的点估计问题

2.1矩估计

E [ X k ] E[X^k] E[Xk]称为随机变量X的k阶原点矩
E [ ( X − E [ X ] ) k ] E[(X-E[X])^k] E[(XE[X])k]称为随机变量X的k阶中心矩
一阶原点矩为样本期望,二阶中心矩为样本方差
通过建立矩的方程来估计参数

2.2最大似然估计

似然函数: L ( θ ∣ x ) = p ( x ∣ θ ) L(\theta|x)=p(x|\theta) L(θx)=p(xθ)
似然函数与概率密度函数的区别是已知量不同,似然函数已知x,概率密度函数已知 θ \theta θ
求参数 θ \theta θ的过程就是求似然函数最大值,而事件独立时,通常似然函数可以转化为每个事件概率的乘积,为了求似然函数最大值,可以转化为对数似然函数的最大值求解参数
m a x { l o g f ( x 1 , x 2 , . . . x n ∣ θ ) } max\{logf(x_1,x_2,...x_n|\theta)\} max{logf(x1,x2,...xnθ)}

2.3贝叶斯估计

P ( θ ∣ D ) = P ( D ∣ θ ) P ( θ ) P ( D ) P(\theta|D)=\frac{P(D|\theta)P(\theta)}{P(D)} P(θD)=P(D)P(Dθ)P(θ)
在估计参数 θ \theta θ时,先假设先验分布 P ( θ ) P(\theta) P(θ),再通过样本调整先验分布,计算出合理的参数 θ \theta θ

3.单总体区间估计

区间估计:最优估计±边际误差
最优估计=无偏点估计
边际误差=系数*估计标准误差
系数与所选定的置信区间有关
置信区间的物理意义:在一定的置信水平下(99%,95%,90%),我们所估计的参数(样本比例、样本均值、样本方差)会落在所求区间内
置信区间是通过从总体中多次抽样,当样本数足够大时,每系列样本可求出一个置信区间,这一系列置信区间有置信度的概率包括所求参数

3.1单总体比例估计

构造统计量, Z = p − π p ( 1 − p ) / n Z=\frac{p-\pi}{\sqrt{p(1-p)/n}} Z=p(1p)/n pπ,Z服从标准正态分布
双侧置信区间: ( p ^ − z α / 2 p ^ ( 1 − p ^ ) n , p ^ + z α / 2 p ^ ( 1 − p ^ ) n ) (\hat p-z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}{n}},\hat p+z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}{n}}) (p^zα/2np^(1p^) ,p^+zα/2np^(1p^) )
单侧置信区间: ( p ^ − z α p ^ ( 1 − p ^ ) n , ∞ ) (\hat p-z_{\alpha}\sqrt{\frac{\hat p(1-\hat p)}{n}},∞) (p^zαnp^(1p^) ,) ( − ∞ , p ^ + z α p ^ ( 1 − p ^ ) n ) (-∞,\hat p+z_{\alpha}\sqrt{\frac{\hat p(1-\hat p)}{n}}) (,p^+zαnp^(1p^) )

3.2单总体均值估计

若总体正态,则不论大样本小样本均可进行下述估计,若总体非正态,根据中心极限定理,当样本数>30时,近似服从正态分布,可进行下述估计
总体方差已知
构造统计量, Z = x ˉ − μ σ / n Z=\frac{\bar x-\mu}{\sigma/\sqrt{n}} Z=σ/n xˉμ,Z服从标准正态分布
双侧置信区间为 ( x ˉ − z α / 2 σ n , x ˉ + z α / 2 σ n ) (\bar x-z_{\alpha/2}\frac{\sigma}{\sqrt n},\bar x+z_{\alpha/2}\frac{\sigma}{\sqrt n}) (xˉzα/2n σ,xˉ+zα/2n σ)
单侧置信区间为 ( x ˉ − z α σ / n , ∞ ) (\bar x-z_\alpha \sigma/\sqrt n,∞) (xˉzασ/n ,) ( − ∞ , x ˉ + z α σ / n ) (-∞,\bar x+z_\alpha \sigma/\sqrt n) (,xˉ+zασ/n )
总体方差未知
构造统计量, t = x ˉ − μ S / n t=\frac{\bar x-\mu}{S/\sqrt{n}} t=S/n xˉμ,t服从自由度n-1的t分布(若样本量较大,可直接近似为正态分布)
双侧置信区间为 ( x ˉ − t α / 2 S n , X ˉ + t α / 2 S n ) (\bar x-t_{\alpha/2}\frac{S}{\sqrt n},\bar X+t_{\alpha/2}\frac{S}{\sqrt n}) (xˉtα/2n S,Xˉ+tα/2n S)
单侧置信区间为 ( x ˉ − t α S / n , ∞ ) (\bar x-t_\alpha S/\sqrt n,∞) (xˉtαS/n ,) ( − ∞ , x ˉ + t α S / n ) (-∞,\bar x+t_\alpha S/\sqrt n) (,xˉ+tαS/n )

3.3单总体方差估计

总体服从正态分布时可进行方差估计
构造统计量, K = ( n − 1 ) S 2 σ 2 K=\frac{(n-1)S^2}{\sigma^2} K=σ2(n1)S2,服从自由度为n-1的卡方分布
双侧置信区间为 ( ( n − 1 ) S 2 χ ² α / 2 , ( ( n − 1 ) S 2 χ ² 1 − α / 2 ) (\frac{(n-1)S^2}{χ²_{\alpha/2} },(\frac{(n-1)S^2}{χ²_{1-\alpha/2} }) (χ²α/2(n1)S2,(χ²1α/2(n1)S2)
单侧置信区间为 ( ( n − 1 ) S 2 χ ² α , ∞ ) (\frac{(n-1)S^2}{χ²_\alpha},∞) (χ²α(n1)S2,) ( − ∞ , ( n − 1 ) S 2 χ ² 1 − α ) (-∞,\frac{(n-1)S^2}{χ²_{1-\alpha}}) (,χ²1α(n1)S2)
概率论与统计(四) 参数估计(点估计、区间估计)_第1张图片

4.两独立总体区间估计

4.1比率差的区间估计

大样本时可以进行下述估计
构造统计量 Z = p 1 − p 2 p 1 ( 1 − p 1 ) / n 1 + p 2 ( 1 − p 2 ) / n 2 Z=\frac{p_1-p_2}{\sqrt{p_1(1-p_1)/n_1+p_2(1-p_2)/n_2}} Z=p1(1p1)/n1+p2(1p2)/n2 p1p2,Z服从标准正态分布
置信区间为 ( p 1 − p 2 − Z α / 2 p 1 ( 1 − p 1 ) / n 1 + p 2 ( 1 − p 2 ) / n 2 , p 1 − p 2 + Z α / 2 p 1 ( 1 − p 1 ) / n 1 + p 2 ( 1 − p 2 ) / n 2 ) (p_1-p_2-Z_{\alpha/2}\sqrt{p_1(1-p_1)/n_1+p_2(1-p_2)/n_2},p_1-p_2+Z_{\alpha/2}\sqrt{p_1(1-p_1)/n_1+p_2(1-p_2)/n_2}) (p1p2Zα/2p1(1p1)/n1+p2(1p2)/n2 ,p1p2+Zα/2p1(1p1)/n1+p2(1p2)/n2 )

4.2均值差的区间估计

大样本根据中心极限定理,样本分布服从正态分布,可进行下述估计,小样本,若总体服从正态分布,也可以进行下述估计
总体方差已知
构造统计量 Z = ( x ˉ 1 − x ˉ 2 ) − ( μ ˉ 1 − μ ˉ 2 ) σ 1 2 / n 1 + σ 2 2 / n 2 Z=\frac{(\bar x_1-\bar x_2)-(\bar \mu_1 -\bar \mu_2)}{\sqrt{\sigma_1^2/n_1+\sigma_2^2/n_2}} Z=σ12/n1+σ22/n2 (xˉ1xˉ2)(μˉ1μˉ2),Z服从标准正态分布
置信区间为 ( ( x ˉ 1 − x ˉ 2 ) − z α / 2 σ 1 2 / n 1 2 + σ 2 2 / n 2 2 , ( x ˉ 1 − x ˉ 2 ) + z α / 2 σ 1 2 / n 1 2 + σ 2 2 / n 2 2 ) ((\bar x_1-\bar x_2)-z_{\alpha/2}\sqrt{\sigma_1^2/n_1^2+\sigma_2^2/n_2^2},(\bar x_1-\bar x_2)+z_{\alpha/2}\sqrt{\sigma_1^2/n_1^2+\sigma_2^2/n_2^2}) ((xˉ1xˉ2)zα/2σ12/n12+σ22/n22 ,(xˉ1xˉ2)+zα/2σ12/n12+σ22/n22 )
大样本,总体方差未知
构造统计量 Z = ( x ˉ 1 − x ˉ 2 ) − ( μ ˉ 1 − μ ˉ 2 ) S 1 2 / n 1 + S 2 2 / n 2 Z=\frac{(\bar x_1-\bar x_2)-(\bar \mu_1 -\bar \mu_2)}{\sqrt{S_1^2/n_1+S_2^2/n_2}} Z=S12/n1+S22/n2 (xˉ1xˉ2)(μˉ1μˉ2),Z服从标准正态分布
置信区间为 ( ( x ˉ 1 − x ˉ 2 ) − z α / 2 S 1 2 / n 1 2 + S 2 2 / n 2 2 , ( x ˉ 1 − x ˉ 2 ) + z α / 2 S 1 2 / n 1 2 + S 2 2 / n 2 2 ) ((\bar x_1-\bar x_2)-z_{\alpha/2}\sqrt{S_1^2/n_1^2+S_2^2/n_2^2}, (\bar x_1-\bar x_2)+z_{\alpha/2}\sqrt{S_1^2/n_1^2+S_2^2/n_2^2}) ((xˉ1xˉ2)zα/2S12/n12+S22/n22 ,(xˉ1xˉ2)+zα/2S12/n12+S22/n22 )
小样本,总体方差未知
总体方差相等时:
S p 2 = ( n 1 − 1 ) S 1 2 − ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 S_p^2=\frac{(n_1-1)S_1^2-(n_2-1)S_2^2}{n_1+n_2-2} Sp2=n1+n22(n11)S12(n21)S22
构造统计量 t = ( x ˉ 1 − x ˉ 2 ) − ( μ ˉ 1 − μ ˉ 2 ) S 1 2 / n 1 + S 2 2 / n 2 t=\frac{(\bar x_1-\bar x_2)-(\bar \mu_1 -\bar \mu_2)}{\sqrt{S_1^2/n_1+S_2^2/n_2}} t=S12/n1+S22/n2 (xˉ1xˉ2)(μˉ1μˉ2),t服从自由度为n1+n2-2的t分布
置信区间为 ( ( x ˉ 1 − x ˉ 2 ) − t α / 2 ( n 1 + n 2 − 2 ) S p 1 / n 1 + 1 / n 2 , ( x ˉ 1 − x ˉ 2 ) + t α / 2 ( n 1 + n 2 − 2 ) S p 1 / n 1 + 1 / n 2 ) ((\bar x_1-\bar x_2)-t_{\alpha/2}(n_1+n_2-2)S_p\sqrt{1/n_1+1/n_2},(\bar x_1-\bar x_2)+t_{\alpha/2}(n_1+n_2-2)S_p\sqrt{1/n_1+1/n_2}) ((xˉ1xˉ2)tα/2(n1+n22)Sp1/n1+1/n2 ,(xˉ1xˉ2)+tα/2(n1+n22)Sp1/n1+1/n2 )

总体方差不等时:
v = ( s 1 2 / n 1 + s 2 2 / n 2 ) 2 ( s 1 2 / n 1 ) 2 n 1 − 1 + ( s 2 2 / n 2 ) 2 n 2 − 1 v=\frac{(s_1^2/n_1+s_2^2/n_2)^2}{\frac{(s_1^2/n_1)^2}{n_1-1}+\frac{(s_2^2/n_2)^2}{n_2-1}} v=n11(s12/n1)2+n21(s22/n2)2(s12/n1+s22/n2)2
构造统计量 t = ( x ˉ 1 − x ˉ 2 ) − ( μ ˉ 1 − μ ˉ 2 ) S 1 2 / n 1 + S 2 2 / n 2 t=\frac{(\bar x_1-\bar x_2)-(\bar \mu_1 -\bar \mu_2)}{\sqrt{S_1^2/n_1+S_2^2/n_2}} t=S12/n1+S22/n2 (xˉ1xˉ2)(μˉ1μˉ2),t服从自由度为v的t分布
置信区间为 ( ( x ˉ 1 − x ˉ 2 ) − t α / 2 ( v ) S 1 2 / n 1 2 + S 2 2 / n 2 2 , ( x ˉ 1 − x ˉ 2 ) + t α / 2 ( v ) S 1 2 / n 1 2 + S 2 2 / n 2 2 ) ((\bar x_1-\bar x_2)-t_{\alpha/2}(v)\sqrt{S_1^2/n_1^2+S_2^2/n_2^2},(\bar x_1-\bar x_2)+t_{\alpha/2}(v)\sqrt{S_1^2/n_1^2+S_2^2/n_2^2}) ((xˉ1xˉ2)tα/2(v)S12/n12+S22/n22 ,(xˉ1xˉ2)+tα/2(v)S12/n12+S22/n22 )
概率论与统计(四) 参数估计(点估计、区间估计)_第2张图片

4.3方差比的区间估计

构造统计量 F = S 1 2 S 2 2 σ 2 2 σ 1 2 F=\frac{S_1^2}{S_2^2}\frac{\sigma_2^2}{\sigma_1^2} F=S22S12σ12σ22,服从F(n1-1,n2-1)的F分布
置信区间为 ( σ 1 2 / σ 2 2 F α / 2 , σ 1 2 / σ 2 2 F 1 − α / 2 ) (\frac{\sigma_1^2/\sigma_2^2}{F_{\alpha/2}},\frac{\sigma_1^2/\sigma_2^2}{F_{1-\alpha/2}}) (Fα/2σ12/σ22,F1α/2σ12/σ22)

你可能感兴趣的:(数学基础)