【概率论与数理统计(研究生课程)】知识点总结8(假设检验)

原文地址: 【概率论与数理统计(研究生课程)】知识点总结8(假设检验)

目录

    • 假设检验
      • 依据
      • 方法(概率论反证法)
      • 逻辑
    • 两类错误
      • 第一类错误
      • 第二类错误
    • 解题步骤
      • 以单正态总体均值 μ \mu μ双边检验为例,方差 σ \sigma σ已知,显著水平 1 − α 1-\alpha 1α
      • 以单正态总体均值 μ \mu μ左边检验为例,方差 σ \sigma σ已知,显著水平 1 − α 1-\alpha 1α
      • 以单正态总体均值 μ \mu μ右边检验为例,方差 σ \sigma σ已知,显著水平 1 − α 1-\alpha 1α
    • 单正态总体均值假设检验,方差未知
    • 单正态总体假设检验,均值未知
    • 两个正态总体参数的假设检验,检验两正态总体均值相等
    • 两正态总体均值之差的假设检验,方差未知
    • 两正态总体方差相等的假设检验,均值未知
    • 大子样总体均值的假设检验
    • 大子样总体均值相等的假设检验
    • 非正态总体的参数假设检验
      • 0-1分布
    • 非正态总体均值的假设检验
    • 两个非正态筒体均值的假设检验
    • 分布拟合检验 卡方检验法
    • 独立性检验(相关性检验)

假设检验

依据

小概率原理: 小概率事件在一次试验中几乎不会发生(实际推断原理)

小概率事件在一次试验中发生的概率记为 α \alpha α α \alpha α为显著水平,检验水平

方法(概率论反证法)

  1. 先对关心问题提出原假设 H 0 H_0 H0和备择假设
  2. 运用样本信息看在 H 0 H_0 H0成立下会不会矛盾
  3. 最后对 H 0 H_0 H0成立与否做出判断:
    若小概率事件发生,则否定 H 0 H_0 H0;否则接受 H 0 H_0 H0

逻辑

小概率事件在一次试验中居然发生,就可以以很大把握否定原假设。

注意:不否定 H 0 H_0 H0并不是肯定 H 0 H_0 H0一定对,而是说差异不够显著,没有达到足以否定 H 0 H_0 H0的程度

两类错误

第一类错误

记事件 A A A为犯第一类错误
P { A } = P { reject  H 0 ∣ H 0  is true } = α P\{A\}=P\{\text{reject } H_0 | H_0\text{ is true}\}=\alpha P{A}=P{reject H0H0 is true}=α

第二类错误

记事件 B B B为犯第二类错误
P { B } = P { accept  H 0 ∣ H 0  is false } = β β = ∫ μ 0 − U α 2 σ n μ 0 + U α 2 σ n 1 2 π σ n e − ( x ˉ − μ 1 ) 2 2 σ 2 n d x ˉ = Φ ( μ 0 − μ 1 σ / n + U α 2 ) − Φ ( μ 0 − μ 1 σ / n − U α 2 ) \begin{aligned} P\{B\}&=P\{\text{accept } H_0 | H_0\text{ is false}\}=\beta \\ \beta&=\int\limits_{\mu_0-U_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}}^{\mu_0+U_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}}\frac{1}{\sqrt{2\pi}\frac{\sigma}{\sqrt{n}}}e^{-\frac{(\bar{x}-\mu_1)^2}{2\frac{\sigma^2}{n}}}d\bar{x} \\ &=\Phi(\frac{\mu_0-\mu_1}{\sigma/\sqrt{n}}+U_{\frac{\alpha}{2}})-\Phi(\frac{\mu_0-\mu_1}{\sigma/\sqrt{n}}-U_{\frac{\alpha}{2}}) \end{aligned} P{B}β=P{accept H0H0 is false}=β=μ0U2αn σμ0+U2αn σ2π n σ1e2nσ2(xˉμ1)2dxˉ=Φ(σ/n μ0μ1+U2α)Φ(σ/n μ0μ1U2α)

  1. 当样本容量固定式,一类错误概率减少导致另一类错误概率增加。 α \alpha α减少,区间长度 2 U α 2 σ n 2U_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}} 2U2αn σ变长,则 β \beta β变大。
  2. 要同时降低两类错误的概率,或在 α \alpha α不变时降低 β \beta β,需要增加样本容量。
  3. 显著性检验只对犯第一类错误的概率加以控制,而不考虑犯第二类错误的概率

解题步骤

以单正态总体均值 μ \mu μ双边检验为例,方差 σ \sigma σ已知,显著水平 1 − α 1-\alpha 1α

  1. 提出原假设和备择假设:
    H 0 : μ = μ 0 ; H 1 : μ ≠ μ 0 H_0:\mu=\mu_0;\quad H_1:\mu \neq\mu_0 H0:μ=μ0;H1:μ=μ0

  2. 选取统计量
    U = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0,1) U=σ/n Xˉμ0N(0,1)

  3. 写出拒绝域
    ∣ U ∣ = ∣ X ˉ − μ 0 σ / n ∣ ≥ Z α 2 |U|=|\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}| \ge Z_{\frac{\alpha}{2}} U=σ/n Xˉμ0Z2α

  4. 确定 Z α 2 Z_{\frac{\alpha}{2}} Z2α

  5. 计算 ∣ U ∣ |U| U

  6. 判断结果
    ∣ U ∣ ≥ Z α 2 reject  H 0 ∣ U ∣ < Z α 2 accept  H 0 \begin{aligned} |U|\ge Z_{\frac{\alpha}{2}} \quad \text{reject } H_0 \\ |U|< Z_{\frac{\alpha}{2}} \quad \text{accept } H_0 \end{aligned} UZ2αreject H0U<Z2αaccept H0

以单正态总体均值 μ \mu μ左边检验为例,方差 σ \sigma σ已知,显著水平 1 − α 1-\alpha 1α

  1. 提出原假设和备择假设:
    H 0 : μ ≥ μ 0 ; H 1 : μ < μ 0 H_0:\mu\ge\mu_0;\quad H_1:\mu <\mu_0 H0:μμ0;H1:μ<μ0

  2. 选取统计量
    U = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0,1) U=σ/n Xˉμ0N(0,1)

  3. 写出拒绝域
    U = X ˉ − μ 0 σ / n ≤ − Z α U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \le -Z_{\alpha} U=σ/n Xˉμ0Zα

  4. 确定 Z α Z_{\alpha} Zα

  5. 计算 U U U

  6. 判断结果
    U ≤ − Z α reject  H 0 U > − Z α accept  H 0 \begin{aligned} U\le -Z_{\alpha} &\quad \text{reject } H_0 \\ U> -Z_{\alpha} &\quad \text{accept } H_0 \end{aligned} UZαU>Zαreject H0accept H0

以单正态总体均值 μ \mu μ右边检验为例,方差 σ \sigma σ已知,显著水平 1 − α 1-\alpha 1α

  1. 提出原假设和备择假设:
    H 0 : μ ≤ μ 0 ; H 1 : μ > μ 0 H_0:\mu\le\mu_0;\quad H_1:\mu >\mu_0 H0:μμ0;H1:μ>μ0

  2. 选取统计量
    U = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0,1) U=σ/n Xˉμ0N(0,1)

  3. 写出拒绝域
    U = X ˉ − μ 0 σ / n ≥ Z α U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \ge Z_{\alpha} U=σ/n Xˉμ0Zα

  4. 确定 Z α Z_{\alpha} Zα

  5. 计算 U U U

  6. 判断结果
    U ≥ Z α reject  H 0 U < Z α accept  H 0 \begin{aligned} U\ge Z_{\alpha} &\quad \text{reject } H_0 \\ U< Z_{\alpha} &\quad \text{accept } H_0 \end{aligned} UZαU<Zαreject H0accept H0

注意:

  1. 无论是双边检验还是单边检验,原假设 H 0 H_0 H0中一定要包含等于。

  2. 左边检验和右边检验原假设箭头方向问题。可以这么理解:左边检验,检验的是下界,箭头就是 ≥ \ge ,右边检验检验的是上界,箭头就是 ≤ \le

  3. 单边检验和双边检验使用情况总结:

    右边检验:是否提高、是否偏高、是否增加、是否超过,原假设就是没有提高,用小于等于…

    左边检验:是否降低、是否偏低、是否减少、是否不足,原假设就是没有降低,用大于等于…

    双边检验:是否正常、是否合格、有无差别、有无差异、有无变化、有无影响

    总的来说,单边检验问题中有方向性,双边检验问题无方向性。

    关于原假设的提法,我也是搞了很久,一直不明白,我们再回顾一下假设检验的逻辑:小概率事件在一次试验中居然发生了,那我们就有很大把握否定原假设,因此原假设必然是大概率的,你没有足够的证据就不能说明原假设是错的(类似于法律上的无罪推定),也就是所谓的 H 0 H_0 H0受保护。那什么样的假设是大概率的?或者说我们该如何提原假设?我认为应该把通常情况,或者说过去一直发生的情况,或者说某种标准,再或者原先就有的结论作为原假设,因为这些事件都是大概率的;把我们需要去证明的结论作为备择假设(这种主要用于前面所说的几种情况题目中都没给)。比如题目中可能会说,某标准为不超过多少,问是否符合标准,此时应假设是符合标准的,即 H 0 : μ ≤ μ 0 H_0:\mu\le \mu_0 H0:μμ0。比如以往某机器精度为 μ 0 \mu_0 μ0,让检验现在机器是否正常工作,此时应假设正常工作,即 H 0 : μ = μ 0 H_0:\mu=\mu_0 H0:μ=μ0。再比如什么都不知道,题目问能否认为某某超过 μ 0 \mu_0 μ0,此时假设 H 1 : μ > μ 0 H_1:\mu > \mu_0 H1:μ>μ0。至于说足够的证据,那就是一次试验中小概率事件发生了,根据实际推断原理,小概率事件是几乎不可能在一次试验中发生的,那既然发生了,我们就可以认为 H 0 H_0 H0错了,也就拒绝 H 0 H_0 H0

以下双边检验仅提供统计量和拒绝域以及单边检验的原假设和拒绝域:

单正态总体均值假设检验,方差未知

  • 双边

选取统计量: T = X ˉ − μ S / n ∼ t ( n − 1 ) T=\frac{\bar{X}-\mu}{S/\sqrt{n}}\sim t(n-1) T=S/n Xˉμt(n1)

拒绝域: ∣ T ∣ ≥ t α 2 ( n − 1 ) |T|\ge t_{\frac{\alpha}{2}}(n-1) Tt2α(n1)

  • 单边

right : H 0 : μ ≤ μ 0 ; H 1 : μ > μ 0 rejection region : X ˉ − μ S / n ≥ t α ( n − 1 ) left : H 0 : μ ≥ μ 0 ; H 1 : μ < μ 0 rejection region : X ˉ − μ S / n ≤ − t α ( n − 1 ) \begin{aligned} \text{right}&: \quad H_0:\mu\le\mu_0;\quad H_1:\mu>\mu_0 \\ \text{rejection region}&: \quad \frac{\bar{X}-\mu}{S/\sqrt{n}}\ge t_\alpha(n-1) \\ \text{left}&: \quad H_0:\mu\ge\mu_0;\quad H_1:\mu<\mu_0 \\ \text{rejection region}&: \quad \frac{\bar{X}-\mu}{S/\sqrt{n}}\le -t_\alpha(n-1) \end{aligned} rightrejection regionleftrejection region:H0:μμ0;H1:μ>μ0:S/n Xˉμtα(n1):H0:μμ0;H1:μ<μ0:S/n Xˉμtα(n1)

单正态总体假设检验,均值未知

  • 双边

选取统计量: χ 2 = ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \chi^2=\frac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1) χ2=σ2(n1)S2χ2(n1)

拒绝域: χ 2 ≤ χ 1 − α 2 2 ( n − 1 ) \chi^2\le\chi^2_{1-\frac{\alpha}{2}}(n-1) χ2χ12α2(n1) χ 2 ≥ χ α 2 2 ( n − 1 ) \chi^2\ge\chi^2_{\frac{\alpha}{2}}(n-1) χ2χ2α2(n1) 两个临界值都需要确定

  • 单边

right : H 0 : σ 2 ≤ σ 0 2 ; H 1 : σ 2 > σ 0 2 rejection region : χ 2 ≥ χ α 2 ( n − 1 ) left : H 0 : σ 2 ≥ σ 0 2 ; H 1 : σ 2 < σ 0 2 rejection region : χ 2 ≤ χ 1 − α 2 ( n − 1 ) \begin{aligned} \text{right}&: \quad H_0:\sigma^2\le\sigma^2_0;\quad H_1:\sigma^2>\sigma^2_0 \\ \text{rejection region}&: \quad\chi^2\ge\chi^2_{\alpha}(n-1) \\ \text{left}&: \quad H_0:\sigma^2\ge\sigma^2_0;\quad H_1:\sigma^2<\sigma^2_0 \\ \text{rejection region}&: \quad\chi^2\le\chi^2_{1-\alpha}(n-1) \end{aligned} rightrejection regionleftrejection region:H0:σ2σ02;H1:σ2>σ02:χ2χα2(n1):H0:σ2σ02;H1:σ2<σ02:χ2χ1α2(n1)

两个正态总体参数的假设检验,检验两正态总体均值相等

H 0 : μ 1 = μ 2 ; H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2;\quad H_1:\mu_1\neq\mu_2 H0:μ1=μ2;H1:μ1=μ2

  1. 方差 σ 2 \sigma^2 σ2已知

    • 双边

    选取统计量: U = X ˉ − Y ˉ σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\bar{Y}}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1) U=n1σ12+n2σ22 XˉYˉN(0,1)

    拒绝域: ∣ U ∣ ≥ U α 2 |U|\ge U_{\frac{\alpha}{2}} UU2α

    • 单边

    right : H 0 : μ 1 ≤ μ 2 ; H 1 : μ 1 > μ 2 rejection region : U ≥ U α left : H 0 : μ 1 ≥ μ 2 ; H 1 : μ 1 < μ 2 rejection region : U ≤ − U α \begin{aligned} \text{right}&: \quad H_0:\mu_1\le\mu_2;\quad H_1:\mu_1>\mu_2 \\ \text{rejection region}&: \quad U\ge U_\alpha \\ \text{left}&: \quad H_0:\mu_1\ge\mu_2;\quad H_1:\mu_1<\mu_2 \\ \text{rejection region}&: \quad U\le -U_\alpha \end{aligned} rightrejection regionleftrejection region:H0:μ1μ2;H1:μ1>μ2:UUα:H0:μ1μ2;H1:μ1<μ2:UUα

  2. 方差 σ 2 \sigma^2 σ2未知

    • 双边

      选取统计量: T = X ˉ − Y ˉ S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) , S w = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 T=\frac{\bar{X}-\bar{Y}}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2),\quad S_w=\sqrt{\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}} T=Swn11+n21 XˉYˉt(n1+n22),Sw=n1+n22(n11)S12+(n21)S22

      拒绝域: ∣ T ∣ ≥ t α 2 ( n 1 + n 2 − 2 ) |T|\ge t_{\frac{\alpha}{2}}(n_1+n_2-2) Tt2α(n1+n22)

    • 单边
      right : H 0 : μ 1 ≤ μ 2 ; H 1 : μ 1 > μ 2 rejection region : T ≥ t α ( n 1 + n 2 − 2 ) left : H 0 : μ 1 ≥ μ 2 ; H 1 : μ 1 < μ 2 rejection region : T ≤ − t α ( n 1 + n 2 − 2 ) \begin{aligned} \text{right}&: \quad H_0:\mu_1\le\mu_2;\quad H_1:\mu_1>\mu_2 \\ \text{rejection region}&: \quad T\ge t_\alpha(n_1+n_2-2) \\ \text{left}&: \quad H_0:\mu_1\ge\mu_2;\quad H_1:\mu_1<\mu_2 \\ \text{rejection region}&: \quad T\le -t_\alpha(n_1+n_2-2) \end{aligned} rightrejection regionleftrejection region:H0:μ1μ2;H1:μ1>μ2:Ttα(n1+n22):H0:μ1μ2;H1:μ1<μ2:Ttα(n1+n22)

两正态总体均值之差的假设检验,方差未知

  • 双边

H 0 : μ 1 − μ 2 = δ ; H 1 : μ 1 − μ 2 ≠ δ H_0:\mu_1-\mu_2=\delta; \quad H_1:\mu_1-\mu_2\neq\delta H0:μ1μ2=δ;H1:μ1μ2=δ

如果是检验 μ 1 \mu_1 μ1 μ 2 \mu_2 μ2是否相等,则 δ = 0 \delta=0 δ=0

选取统计量: T = X ˉ − Y ˉ − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 = X ˉ − Y ˉ − δ S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) T=\frac{\bar{X}-\bar{Y}-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}=\frac{\bar{X}-\bar{Y}-\delta}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2) T=Swn11+n21 XˉYˉ(μ1μ2)=Swn11+n21 XˉYˉδt(n1+n22)

拒绝域: ∣ T ∣ ≥ t α 2 ( n 1 + n 2 − 2 ) |T|\ge t_{\frac{\alpha}{2}}(n_1+n_2-2) Tt2α(n1+n22)

  • 单边

right : H 0 : μ 1 − μ 2 ≤ δ ; H 1 : μ 1 − μ 2 > δ rejection region : T ≥ t α ( n 1 + n 2 − 2 ) left : H 0 : μ 1 − μ 2 ≥ δ ; H 1 : μ 1 − μ 2 < δ rejection region : T ≤ − t α ( n 1 + n 2 − 2 ) \begin{aligned} \text{right}&: \quad H_0:\mu_1-\mu_2\le \delta;\quad H_1:\mu_1-\mu_2 > \delta \\ \text{rejection region}&: \quad T\ge t_\alpha(n_1+n_2-2) \\ \text{left}&: \quad H_0:\mu_1-\mu_2\ge \delta;\quad H_1:\mu_1-\mu_2 < \delta \\ \text{rejection region}&: \quad T\le -t_\alpha(n_1+n_2-2) \end{aligned} rightrejection regionleftrejection region:H0:μ1μ2δ;H1:μ1μ2>δ:Ttα(n1+n22):H0:μ1μ2δ;H1:μ1μ2<δ:Ttα(n1+n22)

两正态总体方差相等的假设检验,均值未知

  • 双边

H 0 : σ 1 2 = σ 2 2 ; H 1 : σ 1 2 ≠ σ 2 2 H_0:\sigma_1^2=\sigma_2^2;\quad H_1:\sigma_1^2\neq\sigma_2^2 H0:σ12=σ22;H1:σ12=σ22

选取统计量: F = S 1 2 / σ 1 2 S 2 2 / σ 2 2 = S 1 2 S 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) F=\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}=\frac{S_1^2}{S_2^2}\sim F(n_1-1,n_2-1) F=S22/σ22S12/σ12=S22S12F(n11,n21)

拒绝域: F ≤ F 1 − α 2 ( n 1 − 1 , n 2 − 1 ) F\le F_{1-\frac{\alpha}{2}}(n_1-1,n_2-1) FF12α(n11,n21) F ≥ F α 2 ( n 1 − 1 , n 2 − 1 ) F\ge F_{\frac{\alpha}{2}}(n_1-1,n_2-1) FF2α(n11,n21)

  • 单边
    right : H 0 : σ 1 2 ≤ σ 2 2 ; H 1 : σ 1 2 > σ 2 2 rejection region : F ≥ F α ( n 1 + n 2 − 2 ) left : H 0 : σ 1 2 ≥ σ 2 2 ; H 1 : σ 1 2 < σ 2 2 rejection region : F ≤ F 1 − α ( n 1 + n 2 − 2 ) \begin{aligned} \text{right}&: \quad H_0:\sigma_1^2\le\sigma_2^2;\quad H_1:\sigma_1^2>\sigma_2^2 \\ \text{rejection region}&: \quad F\ge F_\alpha(n_1+n_2-2) \\ \text{left}&: \quad H_0:\sigma_1^2\ge\sigma_2^2;\quad H_1:\sigma_1^2<\sigma_2^2 \\ \text{rejection region}&: \quad F\le F_{1-\alpha}(n_1+n_2-2) \end{aligned} rightrejection regionleftrejection region:H0:σ12σ22;H1:σ12>σ22:FFα(n1+n22):H0:σ12σ22;H1:σ12<σ22:FF1α(n1+n22)

大子样总体均值的假设检验

μ \mu μ假设检验是 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) XN(μ,σ2)下提出的,当 X X X不能服从正态分布时,只需要 n n n足够大,对 μ \mu μ均可用 Z Z Z检验。

  1. 方差已知

    选取统计量: Z = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) Z=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}\sim N(0,1) Z=σ/n Xˉμ0N(0,1)【近似】

  2. 方差未知

    选取统计量: Z = X ˉ − μ 0 S / n ∼ N ( 0 , 1 ) Z=\frac{\bar{X}-\mu_0}{S/\sqrt{n}}\sim N(0,1) Z=S/n Xˉμ0N(0,1)【近似】

大子样总体均值相等的假设检验

  1. 方差已知

    选取统计量: X ˉ − Y ˉ σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) \frac{\bar{X}-\bar{Y}}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1) n1σ12+n2σ22 XˉYˉN(0,1)【近似、大子样】

  2. 方差未知

    选取统计量: X ˉ − Y ˉ S 1 2 n 1 + S 2 2 n 2 ∼ N ( 0 , 1 ) \frac{\bar{X}-\bar{Y}}{\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}}}\sim N(0,1) n1S12+n2S22 XˉYˉN(0,1)

    若考虑 X ˉ 、 Y ˉ \bar{X}、\bar{Y} XˉYˉ ∣ X ˉ − Y ˉ ∣ > U α 2 S 1 2 n 1 + S 2 2 n 2 |\bar{X}-\bar{Y}|>U_{\frac{\alpha}{2}}\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}} XˉYˉ>U2αn1S12+n2S22

非正态总体的参数假设检验

0-1分布

P { X = x } = p x ( 1 − p ) 1 − x P\{X=x\}=p^x(1-p)^{1-x} P{X=x}=px(1p)1x

H 0 : p = p 0 ; H 1 : p ≠ p 0 H_0:p=p_0;H_1:p\neq p_0 H0:p=p0;H1:p=p0

E ( X ˉ ) = p , D ( X ˉ ) = 1 n p ( 1 − p ) E(\bar{X})=p,D(\bar{X})=\frac{1}{n}p(1-p) E(Xˉ)=p,D(Xˉ)=n1p(1p)

n n n很大时, U = X ˉ − p p ( 1 − p ) n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-p}{\sqrt{\frac{p(1-p)}{n}}}\sim N(0,1) U=np(1p) XˉpN(0,1)

拒绝域: ∣ U ∣ = ∣ X ˉ − p 0 ∣ p 0 ( 1 − p 0 ) / n ≥ U α 2 |U|=\frac{|\bar{X}-p_0|}{\sqrt{p_0(1-p_0)}/{\sqrt{n}}}\ge U_\frac{\alpha}{2} U=p0(1p0) /n Xˉp0U2α

非正态总体均值的假设检验

H 0 : μ = μ 0 ; H 1 : μ ≠ μ 0 H_0:\mu=\mu_0;H_1:\mu\neq\mu_0 H0:μ=μ0;H1:μ=μ0

中心极限定理:当 n n n充分大时,

  • 方差已知

    选取统计量: U = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}\sim N(0,1) U=σ/n Xˉμ0N(0,1)【近似】

  • 方差未知

    选取统计量: U = X ˉ − μ 0 S / n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\mu_0}{S/\sqrt{n}}\sim N(0,1) U=S/n Xˉμ0N(0,1)【近似】

拒绝域: ∣ U ∣ ≥ U α 2 |U|\ge U_{\frac{\alpha}{2}} UU2α

两个非正态筒体均值的假设检验

  • 方差已知

    选取统计量: U = X ˉ − Y ˉ − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\bar{Y}-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1) U=n1σ12+n2σ22 XˉYˉ(μ1μ2)N(0,1)【近似】

  • 方差未知

    选取统计量: U = X ˉ − Y ˉ − ( μ 1 − μ 2 ) S 1 2 n 1 + S 2 2 n 2 ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\bar{Y}-(\mu_1-\mu_2)}{\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}}}\sim N(0,1) U=n1S12+n2S22 XˉYˉ(μ1μ2)N(0,1)【近似】

拒绝域: ∣ U ∣ ≥ U α 2 |U|\ge U_{\frac{\alpha}{2}} UU2α

分布拟合检验 卡方检验法

H 0 : F ( x ) = F 0 ( x ) ; H 1 : F ( x ) ≠ F 0 ( x ) H_0:F(x)=F_0(x);\quad H_1:F(x)\neq F_0(x) H0:F(x)=F0(x);H1:F(x)=F0(x)

  1. F(x)不含未知参数

    选取统计量: χ 2 = ∑ i = 1 k ( f i − n p i ) 2 n p i ∼ χ 2 ( k − 1 ) \chi^2=\sum\limits_{i=1}^{k}\frac{(f_i-np_i)^2}{np_i}\sim \chi^2(k-1) χ2=i=1knpi(finpi)2χ2(k1) H 0 H_0 H0为真, n n n充分大】

    拒绝域: χ 2 ≥ χ α 2 ( k − 1 ) \chi^2\ge\chi^2_\alpha(k-1) χ2χα2(k1)

  2. F(x)含有未知参数

    • 先求未知参数的极大似然估计 p ^ i = p ^ ( A i ) \hat{p}_i=\hat{p}(A_i) p^i=p^(Ai)
    • 选取统计量: χ 2 = ∑ i = 1 k ( f i − n p ^ i ) 2 n p ^ i = ∑ i = 1 k f i 2 n p ^ i − n ∼ χ 2 ( k − r − 1 ) \chi^2=\sum\limits_{i=1}^{k}\frac{(f_i-n\hat{p}_i)^2}{n\hat{p}_i}=\sum\limits_{i=1}^{k}\frac{f_i^2}{n\hat{p}_i}-n\sim \chi^2(k-r-1) χ2=i=1knp^i(finp^i)2=i=1knp^ifi2nχ2(kr1)[ H 0 H_0 H0为真, n n n充分大] (r是未知参数个数)
    • 拒绝域: χ 2 ≥ χ α 2 ( k − r − 1 ) \chi^2\ge \chi^2_\alpha(k-r-1) χ2χα2(kr1)

注意:

  1. 大样本, n ≥ 50 n\ge 50 n50
  2. 要求各组理论频数 n p i ≥ 5 np_i\ge5 npi5 n p ^ i ≥ 5 n\hat{p}_i\ge 5 np^i5
  3. 一般数据分成7到14组

存在问题:

  1. 分组不同,拟合的结果不同
  2. 需要有足够的样本容量
  3. 对连续型变量的优度拟合, χ 2 \chi^2 χ2检验不是理想的方法

独立性检验(相关性检验)

H 0 : X , Y H_0:X,Y H0:X,Y 独立; H 1 : X , Y \quad H_1:X,Y H1:X,Y 不独立

选取统计量: χ 2 = n ∑ i = 1 m ∑ j = 1 k ( n i j − n i ⋅ n ⋅ j n ) 2 n i ⋅ n ⋅ j = n ( ∑ i = 1 m ∑ j = 1 k n i j 2 n i ⋅ n ⋅ j − 1 ) ∼ χ 2 ( ( m − 1 ) ( k − 1 ) ) \chi^2=n\sum\limits_{i=1}^{m}\sum\limits_{j=1}^{k}\frac{(n_{ij}-\frac{n_{i\cdot}n_{\cdot j}}{n})^2}{n_{i\cdot}n_{\cdot j}}=n(\sum\limits_{i=1}^{m}\sum\limits_{j=1}^{k}\frac{n_{ij}^2}{n_{i\cdot}n_{\cdot j}}-1)\sim \chi^2((m-1)(k-1)) χ2=ni=1mj=1kninj(nijnninj)2=n(i=1mj=1kninjnij21)χ2((m1)(k1))【近似】

拒绝域: χ 2 ≥ χ α 2 ( ( m − 1 ) ( k − 1 ) ) \chi^2\ge \chi^2_\alpha((m-1)(k-1)) χ2χα2((m1)(k1))

同时,还能通过独立性判断相关性。

你可能感兴趣的:(计算机基础,数学,概率论,机器学习,人工智能,1024程序员节)