[统计学教程] 第七章 假设检验

导读:
  第七章 假设检验
  
  第一节 检验原理
  
   一.提出原假设( Null Hypothesis)和备择假设(Alternative Hypothesis);
  所谓假设,是指需要进行验证的统计结论。
  原假设是作为统计分析前提的假设,备择假设是在原假设不成立的情况下所接受的假设。
   二.确定适当的检验统计量 T;
  检验统计量T是用于检验原假设是否成立的标准,在原假设成立的前提下,统计量T满足某种特征,
   三.规定显著性水平 a (犯弃真错误的概率);
  显著性水平是设定一个弃真错误的概率,理论上说,没有一个检验是百分之百正确的,必然有一定的概率犯错误。
  检验的错误分为两种类型,一是弃真错误,二是取伪错误。
  所谓弃真错误,是指原假设为真,但检验的结果拒绝了原假设;
  取伪错误,是指原假设为假,但检验的结果接受了原假设。
  当在原假设条件下,T值出现的概率小于a时,拒绝原假设。
  一个小概率事件出现,因此拒绝原假设。
  a值越大,表明犯弃真错误的概率越大,越容易拒绝原假设,此时称检验越严格。
  如果减小拒绝域,就意味着扩大接受域,从而扩大了犯取伪错误的概率。弃真和取伪是一对矛盾体,只有通过改进检验方法,例如扩大样本量,或者使用更好的统计量,才可以使二者同时缩小。
  a值需要由检验目的来确定,当取伪造成的损失大于弃真造成的损失时,应扩大a值。
   四.计算检验统计量 T的值;
  根据检验中获得的数据,计算统计量T的值。
   五.作出统计决策。
  根据T的取值特征,计算取该值的概率,如果此概率小于a,则拒绝原假设。
  
   例子:
  某裁判观察到球员A有类似于上肢触球的表现,现需决定是否判其为手球。
  1.确定原假设:球员A没有上肢触球
  2.确定统计量T:球在接触球员A的身体后反弹的角度
  3.确定显著性水平:a=0.05
  4.计算T值:根据裁判的观察确定球的反弹角度为X
  5.统计判断:当一名球员使用上肢之外的身体部分触球时,球的反弹角度为X的概率为0.03。由于0.03<0.05,拒绝原假设,即认为球员A存在上肢触球。
  在本例中,有3%的可能性发生弃真错误,即球员A没有上肢触球,但裁判作出了错误判断。
  
  第二节 利用正态分布的假设检验案例
  
  利用正态分布的特征进行假设检验是比较常用的方法,有许多统计量符合正态分布,因此可以利用正态分布进行分析。
  
  例题:
  某厂产品使用寿命符合正态分布,其中m0=1020,s=100,从最近生产的产品中抽选16件,测得m1=1080,试在a=0.05的水平下,检验产品质量是否有显著提高。
  本例使用正态分布的前提条件,H0:m1= m0=1020
  计算统计量z
  因此,拒绝原假设。
  统计软件中提供的 P-level 为统计量处于T值范围之外的概率,当此概率小于a值时,拒绝原假设。
  在本例中,P(Z>2.4)=0.0082<0.05
  因此拒绝原假设。
  在统计软件中,对于左侧、右侧和双侧检验需进行区分。
  
  第三节 非参数统计
  
  非参数统计方法不涉及描述总体分布的有关参数,例如正态分布的方差、期望等内容,因此称为与分布无关的(Distribution Free)。
  在推断过程中,仍需利用样本的其他分布信息,尤其是关于秩(rank)的信息。
  将数据从小到大进行排列,每一个具体数据项所处的位置或次序,称为该数据的秩。
  
   一.卡方检验 Chi-Square Goodness-of-Fit Test)
  卡方检验一直有极其广大的应用领域,所有这些应用有一个共同点,即拥有足够大的样本使得在零假设下通过多元的正态中心极限定理来保证检验统计量有渐近的Chi-Square 分布
  一个重要的Chi-Square 检验类型为Pearson拟合优度统计量
  在r个不重叠的类中,所观察到的计数O与在零假设下的期望值E之间的差距。在零假设成立时,Q满足(r-1)个自由度的分布。
  
  例题:
  已知某型生态群落中A、B、C、D四类植物的比重分别为80%,12%,7%和1%。现观察某地共500株植物,发现四类植物的数量分别为380、69、43和8株。
  试在5%的显著性水平下,判断该地生态群落是否为某型。
  植物 O E O-E (O-E)^2 (O-E)^2/E
  A 380 400 -20 400 1.00
  B 69 60 9 81 1.35
  C 43 35 8 64 1.83
  D 8 5 3 9 1.80
  合计 500 500 - - 5.98
  
  查表得(4-1)=3个自由度,a=0.05的分布值为7.82,所以不能拒绝原假设。
  
   二.列联表分析
  列联表是调查数据处理中最常见的形式。列联表分析的目的在于研究两个变量之间是否存在相互影响的关系。可以认为是一种定类尺度的相关分析。
  
  例题:
  下例为三种不同类型电风扇在三个不同地带销售的数量情况。欲了解电风扇类型与地带之间是否存在相关关系。
  
  热带 温带 寒带 合计
  台式 14 30 4 48
  落地式 67 105 60 232
  台地式 30 13 14 57
  合计 111 148 78 337
  
  假定销售地区与销售产品类型之间没有相关关系,则同为台式电风扇,在热带、温带、寒带的销售数量比例应当等同于这三个地带购买电风扇数量的比例。
  即:台式-热带=48111/337
  同样可求出其余各单元格的期望数值
  利用观察值与期望值之间的差异,可进行检验。
  
  热带 温带 寒带 合计
  台式 14/15.81 30/21.08 4/13.19 48
  落地式 67/76.42 105/101.88 60/3.70 232
  台地式 30/18.77 13/25.04 14/11.11 57
  合计 111 148 78 337
  Q值满足自由度为(R-1)(C-1)的分布
  查表得4个自由度,a=0.05的值为9.49,拒绝原假设。
  
   三.符号检验
  对于一个只存在+、-两种符号的序列,考察两种符号的出现是否具有倾向性。
  建立原假设 H0:P+=P-
  计算两种符号的数量S+和S-,利用二项分布计算S+或S-出现的概率是否处于接受域。
  在n>20的情况下,二项分布可以用正态分布进行近似
  
   四.游程检验
  游程检验又称连贯检验或串检验,用于考察一个序列中两种符号的出现次序是否随机。
  一种符号连续出现的段称为一个游程。序列AABBAB共有四个游程,即AA、BB、A、B。
  在符号随机出现的情况下,游程数应当适中。符号出现非随机的情况包括:
  游程数过少:序列有成群的倾向
  游程数过多:序列有混合的倾向
  
  例题:
  观察一个系列,分析30个脸谱的出现是否有规律AAAABBBBBBBBBBBBBBBBAAABBBBBBB。
  H0:脸谱的出现是随机的
  H1:脸谱的出现具有成群的倾向
  当两种符号的数量之和m+n=N>20时,游程总数目U近似符合正态分布:
  平均值:1+2mn/N
  方差:2mn(2mn-N)/N*N*(N-1)
  在本例中:m=7,n=23,N=30,U=4
  计算Z值
  P-level值为0.0002,拒绝原假设,即认为U过小,原序列有成群的倾向。
  
   五.上下游程检验
  上下游程(Runs Up and Down)亦称升降串,是利用观察值前后大小变化来进行游程检验的一种方法。
  将数据按获得的先后顺序进行排列,将每个观察值与其前面的观察值进行比较,如果前面的数值较小,记+号,如果前面的数值较大,记-号。+、-号构成一个新的游程序列。
  例如序列:7、15、1、2、5、8,经处理后转化为+、-、+、+、+。其中N=6,游程数V=3。
  
  例题:
  对24名儿童依次进行一项测试活动,获得下列分数序列:
  31,23,36,43,41,44,12,26,43,75,2,3,15,13,78,24,13,27,86,61,13,7,6,8
  转化成上下游程,为:-,+,+,-,+,-,+,+,+,-,+,+,-,+,-,-,+,+,-,-,-,-,+
  其中游程数V=14,N=24
  当N>25时,V满足正态分布:
  均值:(2N-1)/3
  方差:(16N-29)/90

你可能感兴趣的:(c,活动,测试,null,UP,产品)