卡方检验、t检验和方差分析的区别

一、what

1、卡方检验 Chi-Square Test,关于什么是卡方检验可看这篇博文https://www.jianshu.com/p/807b2c2bfd9b

卡方检验就是检验两个变量之间有没有关系。
以运营为例:

  • 卡方检验可以检验男性或者女性对线上买生鲜食品有没有区别;
  • 不同城市级别的消费者对买SUV车有没有什么区别;

如果有显著区别的话,我们会考虑把这些变量放到模型或者分析里去。

2、t检验

亦称student t检验(Student's t test),主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。

T检验是用于两个样本(或样本与群体)平均值差异程度的检验方法。它是用T分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。

可参考这篇博文:https://www.jianshu.com/p/46d9b111dffc

3、方差分析

Analysis of Variance,简称ANOVA,又称“变异数分析

从方差分析的目的来看,是要检验各个水平(因素中的内容)的均值μ1、μ2、…、μm是否相等(m为水平个数),而实现这个目的的手段是通过方差的比较(即考察各观察数据的差异)。通俗说,就是有没有变异。

可参考这篇博文:https://www.jianshu.com/p/f5f54a39cb19

二、卡方检验和方差分析的区别:

1、二者的基本思想不同

方差分析基本思想:变异分解,总变异=随机变异+处理因素导致的变异,又可以分解为总变异=组内变异+组间变异,F=组间变异/组内变异,F的值越大,处理因素的影响越大。

卡方检验基本思想:以卡方分布为基础,计算观察值和期望值之间的偏离程度。

2、适用的前提条件不同

方差分析:数据具有独立性、正态性、方差齐性。

卡方检验:最小期望频数均大于1;至少4/5的单元格期望频数大于5;计算时如果单元格期望频数小于5要和其他种类合并;样本观察值量超过50。

3、适用的场景不同

方差分析:均数间的多重比较(全部两两比较)、各组均数的精细比较(可以指定要比较的两个组,通过设定系数)、组间均数的趋势检验(为了利用分组变量中体现出的次序信息,目的不是为了拟合线性或非线性的模型,而是希望知道因素的水平改变时均数的变化趋势)。

卡方检验:单样本卡方检验、两样本卡方检验、两分类变量间关联程度的度量、Kappa一致性检验、Mcnemar 配对卡方检验、分层卡方检验。

 

三、卡方检验和t检验的区别:

卡方检验和T检验的前提条件(原假设)是对立的: 
卡方检验:假设没有相关性 
T检验:假设没有差异(相等)

可参考这篇博文:https://blog.csdn.net/yunru_yang/article/details/60956491

一个不错的统计类论坛-统计之都https://d.cosx.org/

你可能感兴趣的:(分析模型和算法,R语言,python)