【数据分析】卡方检验

一般使用卡方检验进行分析的目的是比较差异性。例如研究人员想知道两组学生对于手机品牌的偏好差异情况。

卡方值表示观察值与理论值之间的偏离程度。

卡方值的大小与样本量(自由度)有关。一般来说,卡方值越大越好,但并不准确。比如5000和5010的差异为10;40和50的差异为10,明显后者差异更大。

(1) 交叉卡方

使用频率高,仅使用Pearson卡方,不支持加权数据。

【数据分析】卡方检验_第1张图片【数据分析】卡方检验_第2张图片

 可以看到卡方值为16.667,p =0.000<0.01,所以不同地区的饮食习惯情况呈现出显著性差异

你可能感兴趣的:(数据分析,数据挖掘)