T检验、F检验、Z检验、卡方检验

文章目录

  • 一、几种假设检验
  • 二、Z检验
    • 1. Z分布
    • 2.适用条件
    • 3. 用途
    • 4.公式
    • 5. 应用实例
  • 三、T检验
    • 1. T分布
    • 2.适用条件
    • 3. 用途
    • 4. 公式
  • 四、F检验
    • 1. F分布
    • 2.适用条件
    • 3. 用途
  • 五、卡方检验
    • 1. 卡方分布
    • 2. 用途
    • 3. 案例


一、几种假设检验

1.有关平均值参数u的假设检验(Z检验、T检验)
根据总体方差是否已知及样本容量大小,分为T检验与Z检验,如下图:
T检验、F检验、Z检验、卡方检验_第1张图片

2.有关参数方差σ2的假设检验(F检验)
F检验主要用于检验两个分布的方差是否相同

3.检验两个或多个变量之间是否有关系(卡方检验)
卡方检验属于非参数检验,主要是比较两个及两个以上样本率(构成比)以及两个分类变量的关联性分析,其根本思想在于比较理论频数和实际频数的吻合程度或者拟合优度问题。

通俗来说,卡方分布主要用于检验样本是否偏离了期望,例如偏离了期望的分布(拟合优度检验),期望的比例(列联表)等

二、Z检验

1. Z分布

Z分布即为正态分布(normal distribution)。
正态分布的两个参数μ和σ决定了正态分布的位置和形态。为了应用方便,常将一般的正态变量X通过u变换[(X-μ)/σ]转化成标准正态变量Z,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布(standard normaldistribution),亦称Z分布。
根据中心极限定理,通过抽样模拟试验表明,在正态分布总体中以固定 n 抽取若干个样本时,样本均数的分布仍服从正态分布,即N(μ,σ)。所以,对样本均数的分布进行Z变换,也可变换为标准正态分布N (0,1)

正态分布的概率密度函数为:
f ( x ) = 1 σ 2 π e − ( x − μ ) 2 2 σ 2 f(x)=\frac{1}{\sigma\sqrt{2\pi }}e^{-\frac{(x-\mu)^2}{2\sigma^2}} f(x)=σ2π 1e2σ2(xμ)2

其图像如下:
T检验、F检验、Z检验、卡方检验_第2张图片

2.适用条件

  • 正态分布
  • 总体标准差已知或者样本容量足够大(>30)

3. 用途

  • 检验一个样本平均数与一个己知的总体平均数的差异是否显著
  • 检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著

4.公式

  1. 总体标准差已知或样本容量大于30,比较某个总体的均值与某个常数是否有显著性的差异,检验公式如下:
    X ‾ − μ 0 σ n \frac{\overline{X}-\mu_0}{\frac{\sigma}{\sqrt{n}}} n σXμ0
    其中, X ‾ \overline{X} X为样本均值, μ 0 \mu_0 μ0为总体均值, σ \sigma σ为总体标准差, n n n为样本容量。
  2. 总体标准差已知或样本容量大于30,比较两个总体的均值是否有显著性的差异,检验公式如下:
    X 1 ‾ − X 2 ‾ σ 1 2 n 1 + σ 2 2 n 2 \frac{\overline{X_1}-\overline{X_2}}{\sqrt{\frac{\sigma_1^2}{{n_1}}+\frac{\sigma_2^2}{{n_2}}}} n1σ12+n2σ22 X1X2

5. 应用实例

T检验、F检验、Z检验、卡方检验_第3张图片

三、T检验

为什么小样本用t检验?从抽样研究所得的样本均数特点来看,只要样本量>60,(无论总体是否服从正态分布)抽样研究的样本均数服从或者近似服从正态分布;而如果样本量较小(参考样本量<100),抽样分布随着样本量的减小,与正态分布的差别越来越大。此时需要用小样本理论来解释样本均数的分布——而t分布就是小样本理论的代表。因此,小样本的检验需要用到t检验。

1. T分布

由于在实际工作中,往往σ(总体方差)是未知的,常用s(样本方差)作为σ的估计值,为了与Z变换区别,称为t变换,统计量T值的分布称为T分布。


T分布的图像类似标准正态分布N(0,1),但T分布的峰值低于N(0,1),其密度函数的尾部也比N(0,1)更粗。随着自由度 v 的增加,则越来越接近N(0,1)。

2.适用条件

  • 计量资料
  • 小样本(不是必须)
  • 独立性、正态性或近似正态、方差齐性(两小样本所对应的两总体方差相等,一般用F检验)
  • 当样本例数较小时,要求样本取自正态总体;(当样本数少于30时,需要检验满足正态分布,若数量较多,根据中心极限定律,样本会趋向正态分布)

3. 用途

  • 样本均数与群体均数的比较看差异是否显著;
  • 两样本均数的比较看差异是否显著。

具体来讲,T检验分为单样本T检验、配对样本T检验和双独立样本T检验

  • 单样本T检验:检测样本均值与总体均值之间的差异
  • 配对样本T检验:检验样本某个状况前后的均值有无差异
  • 双独立样本T检验:检测两组样本均值有无差异(需保证两组小样本的方差齐性)

4. 公式

T检验、F检验、Z检验、卡方检验_第4张图片
T检验、F检验、Z检验、卡方检验_第5张图片

四、F检验

1. F分布

T检验、F检验、Z检验、卡方检验_第6张图片

2.适用条件

  • 总体均值未知
  • 样本来自于正态总体

3. 用途

  • 比较两组数据的方差,以确定他们的精密度是否有显著性差异
  • 在进行双独立样本T检验时,对于两组小样本,需进行F检验以测试其方差齐性

五、卡方检验

1. 卡方分布


2. 用途

用于检验两个变量之间有没有关系。

  • 卡方检验可以检验男性或者女性对线上买生鲜食品有没有区别;
  • 不同城市级别的消费者对买SUV车有没有什么区别;

3. 案例

你可能感兴趣的:(Business,Statistics,概率论)