卡方分布(Chi-squared Distribution)与卡方检验(Chi-square Test)

卡方分布

概念:

具有k个自由度的卡方分布是一个由k个独立标准正态随机变量的和所构成的分布。卡方分布经常用于我们常见的卡方检验中。卡方检验一方面可以用来衡量观测分布和理论分布之间的拟合程度,另一方面也可以测量定性数据两个分类标准间的独立性。

定义:

如果Z_{1},Z_{2},...,Z_{k}是标准正态随机变量,那么这些变量的平方和就表现出k个自由度的卡方分布:

K_{d}=\sum Z_{i}^{2}

通常表示成如下形式:

K_{d} \sim \chi ^{^{2}}(k)

另,需要注意,卡方分布中只有一个参数k,k是一个正整数。


卡方检验

概念:

通过观察实际值与理论值的偏差来确定理论的正确与否。

先假设两个变量是独立的(原假设),然后观察实际值(观察值)与理论值(该理论值是指“两者确实独立”的情况下应该有的值)的偏离程度:如果偏差足够小,即可认为误差是很自然的样本误差,且两者确实是独立的,此时接受原假设;如果偏差大到一定程度,则认为两者实际是相关的,即否定原假设,接受备择假设。

你可能感兴趣的:(统计分析)