X1,X2,…Xn是一系列独立同分布的随机变量,当n足够大时 X 1 + X 2 + . . . + X n X_1+X_2+...+X_n X1+X2+...+Xn近似满足正态分布
推广结论:当样本数量足够大时(>30),样本均值近似服从正态分布,且期望值等于总体均值
若X1,X2,…Xn来自同一正态分布的样本,样本均值的期望等于总体均值,样本方差的期望等于总体方差除以样本量
X ˉ ∼ N ( μ , σ 2 / n ) \bar X\sim N(\mu, \sigma^2/n) Xˉ∼N(μ,σ2/n)
( n − 1 ) S 2 / σ 2 ∼ χ ² ( n − 1 ) (n-1)S^2/\sigma^2 \sim χ²(n-1) (n−1)S2/σ2∼χ²(n−1)
n ( X ˉ − μ ) / S ∼ t n − 1 \sqrt{n}(\bar X-\mu)/S \sim t_{n-1} n(Xˉ−μ)/S∼tn−1
借助于总体的一个样本来估计总体未知参数的值的问题称为参数的点估计问题
E [ X k ] E[X^k] E[Xk]称为随机变量X的k阶原点矩
E [ ( X − E [ X ] ) k ] E[(X-E[X])^k] E[(X−E[X])k]称为随机变量X的k阶中心矩
一阶原点矩为样本期望,二阶中心矩为样本方差
通过建立矩的方程来估计参数
似然函数: L ( θ ∣ x ) = p ( x ∣ θ ) L(\theta|x)=p(x|\theta) L(θ∣x)=p(x∣θ)
似然函数与概率密度函数的区别是已知量不同,似然函数已知x,概率密度函数已知 θ \theta θ
求参数 θ \theta θ的过程就是求似然函数最大值,而事件独立时,通常似然函数可以转化为每个事件概率的乘积,为了求似然函数最大值,可以转化为对数似然函数的最大值求解参数
m a x { l o g f ( x 1 , x 2 , . . . x n ∣ θ ) } max\{logf(x_1,x_2,...x_n|\theta)\} max{logf(x1,x2,...xn∣θ)}
P ( θ ∣ D ) = P ( D ∣ θ ) P ( θ ) P ( D ) P(\theta|D)=\frac{P(D|\theta)P(\theta)}{P(D)} P(θ∣D)=P(D)P(D∣θ)P(θ)
在估计参数 θ \theta θ时,先假设先验分布 P ( θ ) P(\theta) P(θ),再通过样本调整先验分布,计算出合理的参数 θ \theta θ
区间估计:最优估计±边际误差
最优估计=无偏点估计
边际误差=系数*估计标准误差
系数与所选定的置信区间有关
置信区间的物理意义:在一定的置信水平下(99%,95%,90%),我们所估计的参数(样本比例、样本均值、样本方差)会落在所求区间内
置信区间是通过从总体中多次抽样,当样本数足够大时,每系列样本可求出一个置信区间,这一系列置信区间有置信度的概率包括所求参数
构造统计量, Z = p − π p ( 1 − p ) / n Z=\frac{p-\pi}{\sqrt{p(1-p)/n}} Z=p(1−p)/np−π,Z服从标准正态分布
双侧置信区间: ( p ^ − z α / 2 p ^ ( 1 − p ^ ) n , p ^ + z α / 2 p ^ ( 1 − p ^ ) n ) (\hat p-z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}{n}},\hat p+z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}{n}}) (p^−zα/2np^(1−p^),p^+zα/2np^(1−p^))
单侧置信区间: ( p ^ − z α p ^ ( 1 − p ^ ) n , ∞ ) (\hat p-z_{\alpha}\sqrt{\frac{\hat p(1-\hat p)}{n}},∞) (p^−zαnp^(1−p^),∞)与 ( − ∞ , p ^ + z α p ^ ( 1 − p ^ ) n ) (-∞,\hat p+z_{\alpha}\sqrt{\frac{\hat p(1-\hat p)}{n}}) (−∞,p^+zαnp^(1−p^))
若总体正态,则不论大样本小样本均可进行下述估计,若总体非正态,根据中心极限定理,当样本数>30时,近似服从正态分布,可进行下述估计
总体方差已知:
构造统计量, Z = x ˉ − μ σ / n Z=\frac{\bar x-\mu}{\sigma/\sqrt{n}} Z=σ/nxˉ−μ,Z服从标准正态分布
双侧置信区间为 ( x ˉ − z α / 2 σ n , x ˉ + z α / 2 σ n ) (\bar x-z_{\alpha/2}\frac{\sigma}{\sqrt n},\bar x+z_{\alpha/2}\frac{\sigma}{\sqrt n}) (xˉ−zα/2nσ,xˉ+zα/2nσ)
单侧置信区间为 ( x ˉ − z α σ / n , ∞ ) (\bar x-z_\alpha \sigma/\sqrt n,∞) (xˉ−zασ/n,∞)和 ( − ∞ , x ˉ + z α σ / n ) (-∞,\bar x+z_\alpha \sigma/\sqrt n) (−∞,xˉ+zασ/n)
总体方差未知:
构造统计量, t = x ˉ − μ S / n t=\frac{\bar x-\mu}{S/\sqrt{n}} t=S/nxˉ−μ,t服从自由度n-1的t分布(若样本量较大,可直接近似为正态分布)
双侧置信区间为 ( x ˉ − t α / 2 S n , X ˉ + t α / 2 S n ) (\bar x-t_{\alpha/2}\frac{S}{\sqrt n},\bar X+t_{\alpha/2}\frac{S}{\sqrt n}) (xˉ−tα/2nS,Xˉ+tα/2nS)
单侧置信区间为 ( x ˉ − t α S / n , ∞ ) (\bar x-t_\alpha S/\sqrt n,∞) (xˉ−tαS/n,∞)和 ( − ∞ , x ˉ + t α S / n ) (-∞,\bar x+t_\alpha S/\sqrt n) (−∞,xˉ+tαS/n)
总体服从正态分布时可进行方差估计
构造统计量, K = ( n − 1 ) S 2 σ 2 K=\frac{(n-1)S^2}{\sigma^2} K=σ2(n−1)S2,服从自由度为n-1的卡方分布
双侧置信区间为 ( ( n − 1 ) S 2 χ ² α / 2 , ( ( n − 1 ) S 2 χ ² 1 − α / 2 ) (\frac{(n-1)S^2}{χ²_{\alpha/2} },(\frac{(n-1)S^2}{χ²_{1-\alpha/2} }) (χ²α/2(n−1)S2,(χ²1−α/2(n−1)S2)
单侧置信区间为 ( ( n − 1 ) S 2 χ ² α , ∞ ) (\frac{(n-1)S^2}{χ²_\alpha},∞) (χ²α(n−1)S2,∞)和 ( − ∞ , ( n − 1 ) S 2 χ ² 1 − α ) (-∞,\frac{(n-1)S^2}{χ²_{1-\alpha}}) (−∞,χ²1−α(n−1)S2)
大样本时可以进行下述估计
构造统计量 Z = p 1 − p 2 p 1 ( 1 − p 1 ) / n 1 + p 2 ( 1 − p 2 ) / n 2 Z=\frac{p_1-p_2}{\sqrt{p_1(1-p_1)/n_1+p_2(1-p_2)/n_2}} Z=p1(1−p1)/n1+p2(1−p2)/n2p1−p2,Z服从标准正态分布
置信区间为 ( p 1 − p 2 − Z α / 2 p 1 ( 1 − p 1 ) / n 1 + p 2 ( 1 − p 2 ) / n 2 , p 1 − p 2 + Z α / 2 p 1 ( 1 − p 1 ) / n 1 + p 2 ( 1 − p 2 ) / n 2 ) (p_1-p_2-Z_{\alpha/2}\sqrt{p_1(1-p_1)/n_1+p_2(1-p_2)/n_2},p_1-p_2+Z_{\alpha/2}\sqrt{p_1(1-p_1)/n_1+p_2(1-p_2)/n_2}) (p1−p2−Zα/2p1(1−p1)/n1+p2(1−p2)/n2,p1−p2+Zα/2p1(1−p1)/n1+p2(1−p2)/n2)
大样本根据中心极限定理,样本分布服从正态分布,可进行下述估计,小样本,若总体服从正态分布,也可以进行下述估计
总体方差已知:
构造统计量 Z = ( x ˉ 1 − x ˉ 2 ) − ( μ ˉ 1 − μ ˉ 2 ) σ 1 2 / n 1 + σ 2 2 / n 2 Z=\frac{(\bar x_1-\bar x_2)-(\bar \mu_1 -\bar \mu_2)}{\sqrt{\sigma_1^2/n_1+\sigma_2^2/n_2}} Z=σ12/n1+σ22/n2(xˉ1−xˉ2)−(μˉ1−μˉ2),Z服从标准正态分布
置信区间为 ( ( x ˉ 1 − x ˉ 2 ) − z α / 2 σ 1 2 / n 1 2 + σ 2 2 / n 2 2 , ( x ˉ 1 − x ˉ 2 ) + z α / 2 σ 1 2 / n 1 2 + σ 2 2 / n 2 2 ) ((\bar x_1-\bar x_2)-z_{\alpha/2}\sqrt{\sigma_1^2/n_1^2+\sigma_2^2/n_2^2},(\bar x_1-\bar x_2)+z_{\alpha/2}\sqrt{\sigma_1^2/n_1^2+\sigma_2^2/n_2^2}) ((xˉ1−xˉ2)−zα/2σ12/n12+σ22/n22,(xˉ1−xˉ2)+zα/2σ12/n12+σ22/n22)
大样本,总体方差未知:
构造统计量 Z = ( x ˉ 1 − x ˉ 2 ) − ( μ ˉ 1 − μ ˉ 2 ) S 1 2 / n 1 + S 2 2 / n 2 Z=\frac{(\bar x_1-\bar x_2)-(\bar \mu_1 -\bar \mu_2)}{\sqrt{S_1^2/n_1+S_2^2/n_2}} Z=S12/n1+S22/n2(xˉ1−xˉ2)−(μˉ1−μˉ2),Z服从标准正态分布
置信区间为 ( ( x ˉ 1 − x ˉ 2 ) − z α / 2 S 1 2 / n 1 2 + S 2 2 / n 2 2 , ( x ˉ 1 − x ˉ 2 ) + z α / 2 S 1 2 / n 1 2 + S 2 2 / n 2 2 ) ((\bar x_1-\bar x_2)-z_{\alpha/2}\sqrt{S_1^2/n_1^2+S_2^2/n_2^2}, (\bar x_1-\bar x_2)+z_{\alpha/2}\sqrt{S_1^2/n_1^2+S_2^2/n_2^2}) ((xˉ1−xˉ2)−zα/2S12/n12+S22/n22,(xˉ1−xˉ2)+zα/2S12/n12+S22/n22)
小样本,总体方差未知:
总体方差相等时:
S p 2 = ( n 1 − 1 ) S 1 2 − ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 S_p^2=\frac{(n_1-1)S_1^2-(n_2-1)S_2^2}{n_1+n_2-2} Sp2=n1+n2−2(n1−1)S12−(n2−1)S22
构造统计量 t = ( x ˉ 1 − x ˉ 2 ) − ( μ ˉ 1 − μ ˉ 2 ) S 1 2 / n 1 + S 2 2 / n 2 t=\frac{(\bar x_1-\bar x_2)-(\bar \mu_1 -\bar \mu_2)}{\sqrt{S_1^2/n_1+S_2^2/n_2}} t=S12/n1+S22/n2(xˉ1−xˉ2)−(μˉ1−μˉ2),t服从自由度为n1+n2-2的t分布
置信区间为 ( ( x ˉ 1 − x ˉ 2 ) − t α / 2 ( n 1 + n 2 − 2 ) S p 1 / n 1 + 1 / n 2 , ( x ˉ 1 − x ˉ 2 ) + t α / 2 ( n 1 + n 2 − 2 ) S p 1 / n 1 + 1 / n 2 ) ((\bar x_1-\bar x_2)-t_{\alpha/2}(n_1+n_2-2)S_p\sqrt{1/n_1+1/n_2},(\bar x_1-\bar x_2)+t_{\alpha/2}(n_1+n_2-2)S_p\sqrt{1/n_1+1/n_2}) ((xˉ1−xˉ2)−tα/2(n1+n2−2)Sp1/n1+1/n2,(xˉ1−xˉ2)+tα/2(n1+n2−2)Sp1/n1+1/n2)
总体方差不等时:
v = ( s 1 2 / n 1 + s 2 2 / n 2 ) 2 ( s 1 2 / n 1 ) 2 n 1 − 1 + ( s 2 2 / n 2 ) 2 n 2 − 1 v=\frac{(s_1^2/n_1+s_2^2/n_2)^2}{\frac{(s_1^2/n_1)^2}{n_1-1}+\frac{(s_2^2/n_2)^2}{n_2-1}} v=n1−1(s12/n1)2+n2−1(s22/n2)2(s12/n1+s22/n2)2
构造统计量 t = ( x ˉ 1 − x ˉ 2 ) − ( μ ˉ 1 − μ ˉ 2 ) S 1 2 / n 1 + S 2 2 / n 2 t=\frac{(\bar x_1-\bar x_2)-(\bar \mu_1 -\bar \mu_2)}{\sqrt{S_1^2/n_1+S_2^2/n_2}} t=S12/n1+S22/n2(xˉ1−xˉ2)−(μˉ1−μˉ2),t服从自由度为v的t分布
置信区间为 ( ( x ˉ 1 − x ˉ 2 ) − t α / 2 ( v ) S 1 2 / n 1 2 + S 2 2 / n 2 2 , ( x ˉ 1 − x ˉ 2 ) + t α / 2 ( v ) S 1 2 / n 1 2 + S 2 2 / n 2 2 ) ((\bar x_1-\bar x_2)-t_{\alpha/2}(v)\sqrt{S_1^2/n_1^2+S_2^2/n_2^2},(\bar x_1-\bar x_2)+t_{\alpha/2}(v)\sqrt{S_1^2/n_1^2+S_2^2/n_2^2}) ((xˉ1−xˉ2)−tα/2(v)S12/n12+S22/n22,(xˉ1−xˉ2)+tα/2(v)S12/n12+S22/n22)
构造统计量 F = S 1 2 S 2 2 σ 2 2 σ 1 2 F=\frac{S_1^2}{S_2^2}\frac{\sigma_2^2}{\sigma_1^2} F=S22S12σ12σ22,服从F(n1-1,n2-1)的F分布
置信区间为 ( σ 1 2 / σ 2 2 F α / 2 , σ 1 2 / σ 2 2 F 1 − α / 2 ) (\frac{\sigma_1^2/\sigma_2^2}{F_{\alpha/2}},\frac{\sigma_1^2/\sigma_2^2}{F_{1-\alpha/2}}) (Fα/2σ12/σ22,F1−α/2σ12/σ22)