在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。这个概率被称为置信度(置信水平)。
一批零件长度服从\(N(\mu,\sigma^2)\)的正态分布,\(\mu,\sigma^2\)均为未知,现在随机抽取16个零件,\(\bar x=20(cm),S=1(cm)\),则\(\mu\)的置信度为0.90的置信区间为_________.
为了某种目的人为制造的随机变量的函数.
常用统计量:
1、样本均值:\(\bar X={1\over n} \sum^n_{i=1}X_i\).
2、样本方差:\(S^2={1\over n-1}\sum^n_{i=1}(X_i-\bar X)^2 \).
\(X\sim N(\mu,\sigma^2)\), 期望:\(EX=\mu\), 方差:\(DX=\sigma^2\), 标准化:\({X-\mu\over{\sigma^2}}\sim N(0,1)\).
若\(X_1,X_2,...X_n\sim N(0,1)\),则
$$X=\sum^n_{i=1}X^2_i\sim \chi^2(n),自由度为n$$ $$EX=n,DX=2n$$
若\(X\sim N(0,1)\),若\(Y\sim \chi^2(n)\),且\(X,Y\)相互独立:
$$t={X\over\sqrt{Y\over n}}\sim t(n),自由度为n.$$
若\(X\sim \chi^2(n_1)\),若\(Y\sim \chi^2(n_2)\),且\(X,Y\)相互独立:
$$F={{X/n_1}\over{Y/n_2}}\sim F(n_1,n_2)自由度n_1,n_2.$$
\(P(U\geq u_\alpha)=\alpha\),\(u_\alpha \)为上\(\alpha\)分位数.
通过查表可得到\(\alpha\)(概率密度函数的面积)对应的\(u_\alpha \)(分位值)的值.
\(P(|\bar X-\mu|<\delta)=1-\alpha, 1-\alpha\)为置信度, \(\alpha\)为显著性水平,人为选取.
大样本情况下, 由中心极限定理可知:
不论\(X_i\mathrel{\mathop{\sim}\limits^{iid}}F(\mu,\sigma^2)(任意分布)\),有$$\sum^n_{i=1}X_i{\mathrel{\mathop{\sim}\limits^{n\to\infty}}}{N(n\mu,n\sigma^2)}$$
\(\bar X\)与\(S^2\)相互独立, 且\(E\bar X=\mu,D\bar X={1\over n}\sigma^2,ES^2=\sigma^2\).
下面就可以根据样本统计量得到关于被估计参数测量值的分布情况:
$$S^2={1\over {n-1}}\sum^n_{i=1}(X_i-\bar X)^2$$
$${(n-1)S^2\over \sigma^2}=\sum^n_{i=1}\left(X_i-\bar X\over{\sigma}\right)^2\sim\chi^2(n-1)$$
$${{\bar X-\mu}\over{S/\sqrt n}}={{{\bar X-\mu}\over{\sigma/n}}\over{S/\sigma}}={{{\bar X-\mu}\over{\sigma/\sqrt n}}\over{\sqrt{{{\left(n-1\right)S^2}/{\sigma^2}}\over{n-1}}}}\sim t(n-1).$$
到此, 得到了t分布, t分布为已知分布, 置信区间自然唾手可得:
$$P\left(\left|{{\bar X-\mu}\over{S/\sqrt n}}\right|<{\delta\over{S/\sqrt n}}\right)=1-\alpha$$
$$P(|t|
样本均值\(\bar X=\mu\)的概率为0, 但\(\mu\)落在会以置信度\(1-\alpha\)为概率落在置信区间\((\bar X-\delta,\bar X+\delta)\)上.
特殊情况:
\(\sigma^2\)已知(理想化条件, 一般为未知)则:
$${{\bar X-\mu}\over{\sigma/\sqrt n}}\sim N(0,1)$$
此时, 置信区间可根据正太分布计算.