卡方分布和卡方检验的定义?

卡方分布(chi-square distribution, χ2-distribution)是概率统计里常用的一种概率分布。

我们先来看看卡方分布的定义:

若n个独立的随机变量,,⋯,,且符合标准正态分布N(0,1),则这n个随机变量的平方和

X=

为服从自由度为n的卡方分布,记为:

X∼χ2(n), 其中n为卡方分布的自由度。

χ2检验:(也称拟合优度检验)

是以χ2分布为基础的一种假设检验方法,主要用于分类变量。其基本思想是根据样本数据推断总体的分布与期望分布是否有显著性差异,或者推断两个分类变量是否相关或者独立。

一般可以设原假设为 H0:观察频数与期望频数没有差异,或者两个变量相互独立不相关。

实际应用中,我们先假设H0成立,计算出χ2的值,χ2表示观察值与理论值之间的偏离程度。根据χ2分布,χ2统计量以及自由度,可以确定在H0成立的情况下获得当前统计量以及更极端情况的概率p。如果p很小,说明观察值与理论值的偏离程度大,应该拒绝原假设。否则不能拒绝原假设。

χ2的计算公式为:

χ2=∑(A−T)2T

其中,A为实际值,T为理论值。

χ2用于衡量实际值与理论值的差异程度,这也是卡方检验的核心思想。χ2包含了以下两个信息:

1.实际值与理论值偏差的绝对大小。

2.差异程度与理论值的相对大小。

你可能感兴趣的:(卡方分布和卡方检验的定义?)