Python数据分析实战-实现卡方检验(附源码和实现效果)

实现功能

使用scipy.stats模块中的chi2_contingency函数来执行卡方检验(Chi-square test)。卡方检验用于检验两个或多个分类变量(组别)之间是否存在显著关联(差异)。

例1:从某中学随机抽取两个班,调查他们对待文理分科的态度,结果,甲班37人赞成,27人反对;乙班39人赞成,21人反对,这两个班对待文理分科的态度是否有显著差异(α= .05)?

例2:探究(不同组)死亡年龄和居住地、性别是否有关(有显著差异)?

Python数据分析实战-实现卡方检验(附源码和实现效果)_第1张图片

实现代码

from scipy.stats import chi2_contingency

# 例1:构建列联表(二维数组)
observed = [[37,27], 
            [39,21]]

# 执行卡方检验
statistic, p_value, dof, expected = chi2_contingency(observed)

# 打印结果
print("Chi-square statistic:", statistic)
print("p-value:", p_value)
print("Degrees of freedom:", dof)
print("Expected frequencies:", expected)


# 例2:构建列联表(二维数组)
observed = [[11.7,8.7,15.4,8.4], 
            [18.1,11.7,24.3,13.6],
            [26.9,20.3,37,19.3],
            [41,30.9,54.6,35.1],
            [66,54.3,71.1,50]]

# 执行扩展卡方检验
statistic, p_value, dof, expected = chi2_contingency(observed)

# 打印结果
print("Chi-square statistic:", statistic)
print("p-value:", p_value)
print("Degrees of freedom:", dof)
print("Expected frequencies:", expected)

实现效果

Python数据分析实战-实现卡方检验(附源码和实现效果)_第2张图片

本人读研期间发表5篇SCI数据挖掘相关论文,现在某研究院从事数据挖掘相关科研工作,对数据挖掘有一定认知和理解,会结合自身科研实践经历不定期分享关于python、机器学习、深度学习基础知识与案例。

致力于只做原创,以最简单的方式理解和学习,关注我一起交流成长。

邀请三个朋友关注V订阅号:数据杂坛,即可在后台联系我获取相关数据集和源码,送有关数据分析、数据挖掘、机器学习、深度学习相关的电子书籍。

你可能感兴趣的:(数据分析,数据分析,数据挖掘,python)