以某一范围提供对参数 θ \theta θ的估计。寻找统计量 θ 1 ∗ ( x 1 , x 2 , . . . , x n ) \theta_1^*(x_1,x_2,...,x_n) θ1∗(x1,x2,...,xn)和 θ 2 ∗ ( x 1 , x 2 , . . . , x n ) \theta_2^*(x_1,x_2,...,x_n) θ2∗(x1,x2,...,xn)满足 θ 1 ∗ < θ 2 ∗ \theta_1^*<\theta_2^* θ1∗<θ2∗;确定样本 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn之后,就将 θ \theta θ估计在区间 [ θ 1 ∗ ( x 1 , x 2 , . . . , x n ) , θ 2 ∗ ( x 1 , x 2 , . . . , x n ) ] [\theta_1^*(x_1,x_2,...,x_n),\theta_2^*(x_1,x_2,...,x_n)] [θ1∗(x1,x2,...,xn),θ2∗(x1,x2,...,xn)]
满足上述要求的区间有很多,但具体估计的时候有优良性要求。
实际上两者是冲突的,因此要引入置信区间的概念。
置信系数:给定一个很小的数 α > 0 \alpha>0 α>0若对 θ \theta θ的任意值均有 p ( θ 1 ∗ ( x 1 , x 2 , . . . , x n ) ≤ θ ≤ θ 2 ∗ ( x 1 , x 2 , . . . , x n ) ) = 1 − α p(\theta_1^*(x_1,x_2,...,x_n)\leq\theta\leq\theta_2^*(x_1,x_2,...,x_n))=1-\alpha p(θ1∗(x1,x2,...,xn)≤θ≤θ2∗(x1,x2,...,xn))=1−α称区间估计 [ θ 1 ∗ , θ 2 ∗ ] [\theta_1^*,\theta_2^*] [θ1∗,θ2∗]的置信系数为 1 − α 1-\alpha 1−α
置信水平:如果 p ( θ 1 ∗ ( x 1 , x 2 , . . . , x n ) ≤ θ ≤ θ 2 ∗ ( x 1 , x 2 , . . . , x n ) ) = 1 − α p(\theta_1^*(x_1,x_2,...,x_n)\leq\theta\leq\theta_2^*(x_1,x_2,...,x_n))=1-\alpha p(θ1∗(x1,x2,...,xn)≤θ≤θ2∗(x1,x2,...,xn))=1−α,而 β < 1 − α \beta<1-\alpha β<1−α;则 β \beta β均可称为 [ θ 1 ∗ , θ 2 ∗ ] [\theta_1^*,\theta_2^*] [θ1∗,θ2∗]的置信水平。
例如 1 − α = 0.95 1-\alpha=0.95 1−α=0.95,说明 θ \theta θ落在区间 [ θ 1 ∗ , θ 2 ∗ ] [\theta_1^*,\theta_2^*] [θ1∗,θ2∗]的概率等于0.95,置信水平为95%,或者比95%小的数,比如90%,当置信水平达到了95%,自然也达到了90%,置信水平越高,估计的区间也越大,如果区间是正无穷至负无穷,那置信水平也达到了100%,但此时是没有意义的。
在学习三大分布之前,需要知道 Γ \Gamma Γ函数(Gamma函数),区分Gamma函数和Gamma分布。
Gamma分布的背景来自于对泊松分布的推导。
例如一个站台的呼叫数,它只与时间间隔有关,而与时间(刻)本身无关,设 ξ ( t ) \xi(t) ξ(t)为 [ t 0 , t 0 + t ) [t_0,t_0+t) [t0,t0+t)内到达的呼叫数,则t时间间隔内到达k个呼叫数的概率 p ( ξ ( t ) = k ) = ( λ t ) k k ! e − λ t p(\xi(t)=k)=\frac{(\lambda t)^k}{k!}e^{-\lambda t} p(ξ(t)=k)=k!(λt)ke−λt,服从泊松分布。记 τ r \tau_r τr为第r个呼叫达到的时刻,根据泊松分布函数推导可以得到该自变量服从Gamma分布。
Gamma分布的密度函数:
g ( r , λ , t ) = λ r t r − 1 e − λ t Γ ( r ) g(r,\lambda,t)=\frac{\lambda^rt^{r-1}e^{-\lambda t}}{\Gamma(r)} g(r,λ,t)=Γ(r)λrtr−1e−λt
其中,r取整数时, Γ ( r ) = ( r − 1 ) ! \Gamma(r)=(r-1)! Γ(r)=(r−1)!
Γ ( r ) = ∫ 0 ∞ t r − 1 e − t d t \Gamma(r)=\int_0^\infty t^{r-1}e^{-t}dt Γ(r)=∫0∞tr−1e−tdt
为gamma函数( λ = 1 \lambda=1 λ=1, 对 t 进行了积分)
自由度为n卡方分布: χ n 2 = Γ ( n 2 , 1 2 ) = ( 1 / 2 ) n / 2 y n / 2 e − 1 2 y π \chi_n^2=\Gamma(\frac{n}{2},\frac{1}{2})=\frac{(1/2)^{n/2}y^{n/2}e^{-\frac{1}{2}y}}{\sqrt{\pi}} χn2=Γ(2n,21)=π(1/2)n/2yn/2e−21y
他的期望为n,方差为2n
Gamma分布的特例,其中 r = n 2 r=\frac{n}{2} r=2n, λ = 1 2 \lambda=\frac{1}{2} λ=21
补充:若 ξ N ( μ , σ 2 ) \xi ~ N(\mu, \sigma^2) ξ N(μ,σ2),则 η = ξ 2 \eta=\xi^2 η=ξ2服从自由度为1的卡方分布。
f ( x ; n ) = Γ ( ( n + 1 ) / 2 ) n π Γ ( n / 2 ) ( 1 + x 2 n ) − ( n + 1 ) / 2 f(x;n)=\frac{\Gamma((n+1)/2)}{\sqrt{n\pi}\Gamma(n/2)}(1+\frac{x^2}{n})^{-(n+1)/2} f(x;n)=nπΓ(n/2)Γ((n+1)/2)(1+nx2)−(n+1)/2
他的期望为0,方差为 n / ( n − 2 ) n/(n-2) n/(n−2)
对应抽样分布:设总体服从正态分布, x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn为样本, X ˉ \bar X Xˉ记为样本均值, S S S记为方差,则:随机变量 n ( X ˉ − μ ) S \frac{\sqrt n(\bar X-\mu)}{S} Sn(Xˉ−μ)服从自由度为n的t分布
f ( x ; m , n ) = n n 2 n n 2 Γ ( n / 2 + m / 2 ) Γ ( n / 2 ) Γ ( n / 2 ) ( m + n t ) − m + n 2 t n / 2 − 1 f(x;m,n)=\frac{n^{\frac n2}n^{\frac n2}\Gamma{(n/2+m/2)}}{\Gamma{(n/2)}\Gamma{(n/2)}}(m+nt)^{-\frac{m+n}{2}}t^{n/2-1} f(x;m,n)=Γ(n/2)Γ(n/2)n2nn2nΓ(n/2+m/2)(m+nt)−2m+ntn/2−1
他的期望为 n / ( m − 2 ) ( m > 2 ) n/(m-2) (m>2) n/(m−2)(m>2) 方差为: 2 m 2 ( n + m − 2 ) n ( m − 2 ) 2 ( m − 4 ) \frac{2m^2(n+m-2)}{n(m-2)^2(m-4)} n(m−2)2(m−4)2m2(n+m−2)
对应抽样分布:两个总体X和Y,分别服从正态分布,所抽样本量分别为n和m。则随机变量 S X 2 S Y 2 / σ 1 2 σ 2 2 \frac{S_X^2}{S_Y^2}/\frac{\sigma_1^2}{\sigma_2^2} SY2SX2/σ22σ12服从自由度为n-1,m-1的F分布
求置信区间的方法:枢轴变量法。
寻找一个与要估计参数 g ( θ ) g(\theta) g(θ)有关的统计量 T = T ( x 1 , x 2 , . . . , x n ) T=T(x_1,x_2,...,x_n) T=T(x1,x2,...,xn),一般是其优良点估计量。
设法寻找包含统计量 T T T以及待估参数 g ( θ ) g(\theta) g(θ)的随机变量 S ( T , g ( θ ) ) S(T,g(\theta)) S(T,g(θ))。要求 S ( T , g ( θ ) ) S(T,g(\theta)) S(T,g(θ))的分布与 θ \theta θ无关, S S S为枢轴变量。这个变量是服从某种已知分布的,如正态分布、t分布或者F分布等等
对于给定的 1 − α 1-\alpha 1−α,按照 p ( a ≤ S ( T , g ( θ ) ) ≤ b ) = 1 − α p(a\le S(T,g(\theta))\le b)=1-\alpha p(a≤S(T,g(θ))≤b)=1−α,求出a和b,这里求a和b实际上就是看分布的上下分位数
再由 a ≤ S ( T , g ( θ ) ) ≤ b a\le S(T,g(\theta))\le b a≤S(T,g(θ))≤b解出来 θ 1 ∗ ( T ) ≤ g ( θ ) ≤ θ 2 ∗ ( T ) \theta_1^*(T)\le g(\theta)\le \theta_2^*(T) θ1∗(T)≤g(θ)≤θ2∗(T)。则 [ θ 1 ∗ ( T ) , θ 2 ∗ ( T ) ] [\theta_1^*(T),\theta_2^*(T)] [θ1∗(T),θ2∗(T)]即为估计量的一个置信系数 1 − α 1-\alpha 1−α的区间估计。
常见的枢轴变量:
区间估计达到预先设定的置信系数要求,就需要把关注点转移到精度要求之上,无穷大的估计区间,再准也是没有意义的。
以正态分布方差已知,估计均值的例子为例:
p ( θ 1 ∗ ( x 1 , x 2 , . . . , x n ) ≤ θ ≤ θ 2 ∗ ( x 1 , x 2 , . . . , x n ) ) = 1 − α p(\theta_1^*(x_1,x_2,...,x_n)\leq\theta\leq\theta_2^*(x_1,x_2,...,x_n))=1-\alpha p(θ1∗(x1,x2,...,xn)≤θ≤θ2∗(x1,x2,...,xn))=1−α
p ( θ 1 ∗ ( x 1 , x 2 , . . . , x n ) ≤ n ( X ˉ − μ ) σ ≤ θ 2 ∗ ( x 1 , x 2 , . . . , x n ) ) = 1 − α p(\theta_1^*(x_1,x_2,...,x_n)\leq\frac{\sqrt n(\bar X-\mu)}{\sigma}\leq\theta_2^*(x_1,x_2,...,x_n))=1-\alpha p(θ1∗(x1,x2,...,xn)≤σn(Xˉ−μ)≤θ2∗(x1,x2,...,xn))=1−α
u 1 − α / 2 ≤ n ( X ˉ − μ ) σ ≤ u α / 2 u_{1-\alpha/2}\leq\frac{\sqrt n(\bar X-\mu)}{\sigma}\leq u_{\alpha/2} u1−α/2≤σn(Xˉ−μ)≤uα/2
σ u 1 − α / 2 n − X ˉ ≤ − μ ≤ σ u α / 2 n − X ˉ \frac{\sigma u_{1-\alpha/2}}{\sqrt n}-\bar X\leq-\mu\leq \frac{\sigma u_{\alpha/2}}{\sqrt n}-\bar X nσu1−α/2−Xˉ≤−μ≤nσuα/2−Xˉ
X ˉ − σ u α / 2 n ≤ μ ≤ X ˉ − σ u 1 − α / 2 n \bar X-\frac{\sigma u_{\alpha/2}}{\sqrt n}\leq\mu\leq \bar X-\frac{\sigma u_{1-\alpha/2}}{\sqrt n} Xˉ−nσuα/2≤μ≤Xˉ−nσu1−α/2
X ˉ − σ u α / 2 n ≤ μ ≤ X ˉ + σ u α / 2 n \bar X-\frac{\sigma u_{\alpha/2}}{\sqrt n}\leq\mu\leq \bar X+\frac{\sigma u_{\alpha/2}}{\sqrt n} Xˉ−nσuα/2≤μ≤Xˉ+nσuα/2
估计精度:
β = 2 σ u α / 2 n \beta=\frac{2\sigma u_{\alpha/2}}{\sqrt n} β=n2σuα/2
如果要求估计精度达到 β \beta β, 那相应样本容量n就要增大,大于多少也易求。
例如,在元件寿命服从指数分布的假定下,要通过对抽出若干个元件进行测试所得到的数据去判定“元件平均寿命不小于5000小时”是否成立问题。
原假设: H 0 : 1 / λ ≥ 5000 H_0:1/\lambda\geq5000 H0:1/λ≥5000
对立假设: H 1 : 1 / λ < 5000 H_1:1/\lambda<5000 H1:1/λ<5000
任何一个假设的检验都需要用到样本,如上例中服从指数分布,用样本去判断这个假设,首先要表达出平均,也就是对这个指数分布的均值进行估计。在这个检验中,只要样本的均值满足: X ˉ ≥ C \bar X\ge C Xˉ≥C(C为一个适当的数),就可以接受原假设.
则,能让原假设被接受的样本符合:
A = { ( x 1 , x 2 , . . . , x n ) : x 1 + x 2 + . . . + x n ≥ n C } A=\{(x_1,x_2,...,x_n):x_1+x_2+...+x_n\ge nC\} A={(x1,x2,...,xn):x1+x2+...+xn≥nC}
这是一个样本集,也称 接受域;
同样,A的互补集为 拒绝域
给定的常数C是临界值,但无论给出什么临界值,都避免不了犯错误。(1)在原假设为真情况下,样本落在了拒绝域内,拒绝了原假设,出现第一类错误:弃真错误。(2)原假设非真,但样本落在了接受域内,从而接受原假设,出现第二类错误:取伪错误。由于样本的随机性,错误总是不可避免,只能尽可能降低犯错概率。
对于上例中,原假设被否定概率用 β ϕ ( λ ) \beta_\phi(\lambda) βϕ(λ)表示:
β ϕ ( λ ) = P λ ( X ˉ < C ) \beta_\phi(\lambda)=P_\lambda(\bar X
表示的是样本落在拒绝域内的概率。
上例中,由于 2 n λ X ˉ 2n\lambda\bar X 2nλXˉ~ χ 2 n 2 \chi_{2n}^2 χ2n2,则有:
β ϕ ( λ ) = P λ ( X ˉ < C ) = K 2 n ( 2 n λ C ) \beta_\phi(\lambda)=P_\lambda(\bar X
可见,这个概率(样本落在拒绝域,也即均值小于5000小时)随 λ \lambda λ增大而增加, λ \lambda λ越大, 1 / λ 1/\lambda 1/λ越小,越小于5000小时,样本落在小于5000小时的概率就越大。作为一个合理的假设, λ \lambda λ越大,就应该用更大的概率否定原假设。
功效函数 是假设检验的重要概念:
β ϕ ( θ 1 , θ 2 , . . . , θ k ) = P θ 1 , θ 2 , . . . , θ k ( d e n y − H 0 ) \beta_\phi(\theta_1,\theta_2,...,\theta_k)=P_{\theta_1,\theta_2,...,\theta_k}(deny-H_0) βϕ(θ1,θ2,...,θk)=Pθ1,θ2,...,θk(deny−H0)
功效函数是未知参数的函数。当 θ 1 , θ 2 , . . . , θ k \theta_1,\theta_2,...,\theta_k θ1,θ2,...,θk属于对立假设时,我们希望 β ϕ ( θ 1 , θ 2 , . . . , θ k ) \beta_\phi(\theta_1,\theta_2,...,\theta_k) βϕ(θ1,θ2,...,θk)尽可能大(拒绝原假设的概率尽可能大)
发生两类错误的概率:
(1)原假设正确但被否了。用 α 1 ϕ ( θ 1 , θ 2 , . . . , θ k ) \alpha_{1\phi}(\theta_1,\theta_2,...,\theta_k) α1ϕ(θ1,θ2,...,θk)表示。
如果 θ 1 , θ 2 , . . . , θ k ∈ H 0 \theta_1,\theta_2,...,\theta_k\in H_0 θ1,θ2,...,θk∈H0
α 1 ϕ ( θ 1 , θ 2 , . . . , θ k ) = β ϕ ( θ 1 , θ 2 , . . . , θ k ) \alpha_{1\phi}(\theta_1,\theta_2,...,\theta_k)=\beta_\phi(\theta_1,\theta_2,...,\theta_k) α1ϕ(θ1,θ2,...,θk)=βϕ(θ1,θ2,...,θk)
如果 θ 1 , θ 2 , . . . , θ k ∉ H 0 \theta_1,\theta_2,...,\theta_k\notin H_0 θ1,θ2,...,θk∈/H0
α 1 ϕ ( θ 1 , θ 2 , . . . , θ k ) = 0 \alpha_{1\phi}(\theta_1,\theta_2,...,\theta_k)=0 α1ϕ(θ1,θ2,...,θk)=0
(2)原假设错误,但被接受。用 α 2 ϕ ( θ 1 , θ 2 , . . . , θ k ) \alpha_{2\phi}(\theta_1,\theta_2,...,\theta_k) α2ϕ(θ1,θ2,...,θk)表示。
如果 θ 1 , θ 2 , . . . , θ k ∈ H 0 \theta_1,\theta_2,...,\theta_k\in H_0 θ1,θ2,...,θk∈H0
α 2 ϕ ( θ 1 , θ 2 , . . . , θ k ) = 0 \alpha_{2\phi}(\theta_1,\theta_2,...,\theta_k)=0 α2ϕ(θ1,θ2,...,θk)=0
如果 θ 1 , θ 2 , . . . , θ k ∉ H 0 \theta_1,\theta_2,...,\theta_k\notin H_0 θ1,θ2,...,θk∈/H0
α 2 ϕ ( θ 1 , θ 2 , . . . , θ k ) = 1 − β ϕ ( θ 1 , θ 2 , . . . , θ k ) \alpha_{2\phi}(\theta_1,\theta_2,...,\theta_k)=1-\beta_\phi(\theta_1,\theta_2,...,\theta_k) α2ϕ(θ1,θ2,...,θk)=1−βϕ(θ1,θ2,...,θk)
检验水平 :一个常数 α \alpha α( 0 ≤ α ≤ 1 0\le\alpha\le1 0≤α≤1),对任何的 θ 1 , θ 2 , . . . , θ k ∈ H 0 \theta_1,\theta_2,...,\theta_k\in H_0 θ1,θ2,...,θk∈H0,都有 β ϕ ( θ 1 , θ 2 , . . . , θ k ) ≤ α \beta_\phi(\theta_1,\theta_2,...,\theta_k)\le\alpha βϕ(θ1,θ2,...,θk)≤α,称该检验为原假设在水平 α \alpha α的检验。
原假设认为 θ 1 , θ 2 , . . . , θ k ∈ H 0 \theta_1,\theta_2,...,\theta_k\in H_0 θ1,θ2,...,θk∈H0,如果对任意的参数取值 θ 1 , θ 2 , . . . , θ k ∈ H 0 \theta_1,\theta_2,...,\theta_k\in H_0 θ1,θ2,...,θk∈H0,都能保证犯错误的概率小于某个数 α \alpha α,那我们接受它的意愿就更有说服力了, α \alpha α取得小,犯第一类错误的概率很小。也即原假设正确下,所有可能的样本组合,能拒绝原假设的概率很小。反过来看,如果样本的所有可能组合,拒绝原假设的概率很小,设定某一水平,如果概率小于这个水平,是可以认为原假设正确的。
重要的假设检验:
(1)正态均值检验
x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn为正态总体抽取的样本,讨论 θ \theta θ的假设检验问题:
H 0 : θ ≥ θ 0 ; H 1 : θ < θ 0 H_0:\theta\ge\theta_0;H_1:\theta<\theta_0 H0:θ≥θ0;H1:θ<θ0
σ 2 \sigma^2 σ2已知时
选择 X ˉ \bar X Xˉ作为参数 θ \theta θ的估计量,设定检验 ϕ \phi ϕ:当 X ˉ ≥ C \bar X\ge C Xˉ≥C时,接受原假设,当 X ˉ < C \bar X< C Xˉ<C时,否定原假设。
要给定常数C使之具有水平 α \alpha α,按照功效函数定义,在此检验下拒绝原假设的概率为:
β ϕ ( θ ) = P θ ( X ˉ < C ) = P θ ( n ( X ˉ − θ ) σ < n ( C − θ ) σ ) = ϕ ( n ( C − θ ) σ ) = α \beta_\phi(\theta)=P_{\theta}(\bar X
如果要检验水平为 α \alpha α,即要 β ϕ ( θ ) ≤ α \beta_\phi(\theta)\le\alpha βϕ(θ)≤α,
仅需取: n ( C − θ ) σ = u 1 − α = − u α \frac{\sqrt n(C-\theta)}{\sigma}=u_{1-\alpha}=-u_\alpha σn(C−θ)=u1−α=−uα
可得: C = θ 0 − σ u α / n C=\theta_0-\sigma u_\alpha/\sqrt n C=θ0−σuα/n
将C带入功效函数:
β ϕ ( θ ) = ϕ ( n ( θ 0 − θ ) σ − u α ) \beta_\phi(\theta)=\phi(\frac{\sqrt n(\theta_0-\theta)}{\sigma}-u_\alpha) βϕ(θ)=ϕ(σn(θ0−θ)−uα)
从上式知, β ϕ \beta_\phi βϕ与参数 θ \theta θ、水平 α \alpha α以及标准差 θ \theta θ均有关:
理论分布已知,对分布检验
对分布的假设:
H 0 H_0 H0: p ( X = a i ) = p i p(X=a_i)=p_i p(X=ai)=pi, i=1,2,…,k
从总体中抽出容量n的样本或进行n次观察,得到样本 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn,根据样本检验 H 0 H_0 H0, n p i np_i npi为 a i a_i ai的理论样本数量,统计 a i a_i ai出现的次数为 v i v_i vi(实际统计的样本数量),为观察值。
显然,差异越小越乐于接受它。
皮尔逊的拟合优度 χ 2 \chi^2 χ2统计量:
Z = ∑ n p i − v i n p i Z=\sum\frac{np_i-v_i}{np_i} Z=∑npinpi−vi
假设成立,在样本量很大时, Z Z Z服从自由度 k − 1 k-1 k−1的 χ 2 \chi^2 χ2的分布。
拟合优度 对这个检验,计算得到一定水平下的临界值为 Z 0 Z_0 Z0,显然当统计量Z满足 Z > Z 0 Z>Z_0 Z>Z0时否定原假设。在原假设为真时, P ( Z > Z 0 ) P(Z>Z_0) P(Z>Z0)的概率就是犯错误的概率。定义拟合优度:
P ( Z 0 ) = P ( Z > Z 0 ∣ H 0 ) = 1 − K k − 1 ( Z 0 ) P(Z_0)=P(Z>Z_0|H_0)=1-K_{k-1}(Z_0) P(Z0)=P(Z>Z0∣H0)=1−Kk−1(Z0)
拟合优度越大, Z 0 Z_0 Z0越小,犯错误的概率越低,表示理论与实际符合的越好。
例 一家工厂早中晚三班,每班8小时,发生一些事故,早班6次,中班3次,晚班6次,怀疑事故发生与班次有关。
H 0 H_0 H0(事故与班次无关) p i = 1 / 3 p_i=1/3 pi=1/3,i =1,2,3
试验15次,可计算拟合优度统计量:
Z 0 = ( ( 5 − 6 ) 2 + ( 3 − 6 ) 2 + ( 5 − 6 ) 2 ) / 5 = 1.2 Z_0=((5-6)^2+(3-6)^2+(5-6)^2)/5=1.2 Z0=((5−6)2+(3−6)2+(5−6)2)/5=1.2
χ 2 ( 1.2 ) = 0.451 \chi_{2}(1.2)=0.451 χ2(1.2)=0.451,拟合优度 p ( Z 0 ) = 0.549 p(Z_0)=0.549 p(Z0)=0.549
在一定准则下考虑是否拒绝原假设。
理论分布未知
总体X只取有限个值,其概率: p ( X = a i ) = p i ( θ 1 , θ 2 , . . . , θ r ) p(X=a_i)=p_i(\theta_1,\theta_2,...,\theta_r) p(X=ai)=pi(θ1,θ2,...,θr),其中, θ 1 , θ 2 , . . . , θ r \theta_1,\theta_2,...,\theta_r θ1,θ2,...,θr为未知参数。
设对X进行n次观察,以 v i v_i vi记为X出现的次数。
假设: H 0 : p ( X = a i ) = p i ( θ 1 , θ 2 , . . . , θ r ) H_0: p(X=a_i)=p_i(\theta_1,\theta_2,...,\theta_r) H0:p(X=ai)=pi(θ1,θ2,...,θr),对参数 θ 1 , θ 2 , . . . , θ r \theta_1,\theta_2,...,\theta_r θ1,θ2,...,θr的某一组值 θ 1 0 , θ 2 0 , . . . , θ r 0 \theta_1^0,\theta_2^0,...,\theta_r^0 θ10,θ20,...,θr0成立。
列联表检验统计量
记 u i u_i ui=p(属性A在水平i); v j v_j vj=p(属性B在水平j); p i j p_{ij} pij=p(属性A在水平i且 属性B在水平j)。假设: H 0 H_0 H0: p i j = u i v j p_{ij}=u_iv_j pij=uivj, i=1,2,…a; j = 1,2,…,b.
根据极大似然法,求得 u ^ i = n i ⋅ n \hat u_i=\frac{n_{i\cdot}}{n} u^i=nni⋅; v ^ j = n j ⋅ n \hat v_j=\frac{n_{j\cdot}}{n} v^j=nnj⋅
由此可得 p ^ i j = n i ⋅ n j ⋅ n 2 \hat p_{ij}=\frac{n_{i\cdot}n_{j\cdot}}{n^2} p^ij=n2ni⋅nj⋅
第(i,j)得理论值: n p i j = n i ⋅ n j ⋅ n np_{ij}=\frac{n_{i\cdot}n_{j\cdot}}{n} npij=nni⋅nj⋅
统计量 Z = ∑ i a ∑ 1 b ( n ⋅ n i j − n i ⋅ n j ⋅ ) 2 n ⋅ n i ⋅ n j ⋅ Z=\sum_i^a\sum_1^b\frac{(n\cdot n_{ij}-n_{i\cdot}n_{j\cdot})^2}{n\cdot n_{i\cdot}n_{j\cdot}} Z=∑ia∑1bn⋅ni⋅nj⋅(n⋅nij−ni⋅nj⋅)2
例文化水平与支出
纵轴A,123表示教育水平高中低;横轴B,12表示支出水平高低。
1 | 2 | 3 | sum | |
---|---|---|---|---|
1 | 63 | 37 | 60 | 160 |
2 | 16 | 17 | 8 | 41 |
sum | 79 | 54 | 68 | 201 |
计算统计量 Z 0 Z_0 Z0为7.2078,拟合优度p=0.0207,过低,拒绝原假设:收入与文化消费无关。收入高者,文化指出偏低。