假设检验与常见的统计检验方法

1.假设检验:

1.1 基本思想:

小概率反证法思想,小概率思想认为小概率事件在一次试验中基本上不可能发生,在这个方法下,我们首先对总体作出一个假设,这个假设大概率会成立,如果在一次试验中,试验结果和原假设相背离,也就是小概率事件竟然发生了,那我们就有理由怀疑原假设的真实性,从而拒绝这一假设

1.2 P值

P值(P value)就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明原假设情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。总之,P值越小,表明结果越显著。但是检验的结果究竟是“显著的”、“中度显著的”还是“高度显著的”需要我们自己根据P值的大小和实际问题来解决。

单侧检验:按分布的一侧计算显著性水平概率的检验。用于检验大于、小于等有确定性大小关系的假设检验问题。这类问题的确定是有一定的理论依据的。假设检验写作:μ1<μ2或μ1>μ2。

双侧检验:按分布两端计算显著性水平概率的检验, 应用于理论上不能确定两个总体一个一定比另一个大或小的假设检验。一般假设检验写作H1:μ1≠μ2

显著性水平:我们一般认为P-value<=0.05就可以认为假设是不正确的。0.05这个标准就是显著水平,当然选择多少作为显著水平也是主观的。

 

1.3 基本步骤:

a:提出假设,确定检验水平\aa

提出检验假设又称无效假设,符号是H0;备择假设的符号是H1。
H0:样本与总体或样本与样本间的差异是由抽样误差引起的(我们希望推翻的);
H1:样本与总体或样本与样本间存在本质差异(我们希望成立了的);
预先设定的检验水准为0.05;当 p_value<0.05,我们则认为H0发生是小概率事件,不接受H0,则接受H1

b:确立检验方法:

由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等。

c: 计算p值,进行统计推断:

若P>α,结论为按α所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P≤α,结论为按所取α水准显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值表得到。

 

2.相关检验

2.1 T 检验(均值比较)

T检验是用t分布理论来推论差异发生的概率,从而比较两组平均数的差异是否显著

可以分为单总体检验(数据来自于一组样本)和双总体检验(数据来自于两组同正太分布样本)。

例:比如用来检测男女身高是否存在显著性差异。

2.2 F 检验(方差分析)

又叫方差齐性检验,其中要判断两总体方差是否相等,就可以用F检验。

F检验还可以用于三组或者多组之间的均值比较,但是如果被检验的数据无法满足均是正态分布的条件时,该数据的稳健型会大打折扣,特别是当显著性水平比较低时

:检测A,B,C三个苹果品种结果率是否存在差异

2.3 \chi ^{^{2}} 检验(独立性,拟合度检验)

卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。

卡方检验针对分类变量

例:检验是否化妆是否和性别(男女)存在关系

你可能感兴趣的:(数据分析)