【数学与统计基础】常用统计检验方法的Python实现

一、简介

介绍了8种常见的统计检验方法,包括方差分析、卡方检验、t检验等。首先简单回顾统计检验方法的作用、原假设、应用场景等,然后用Python实现并解读结果。同时,为获取直观理解,穿插展示了热力图、Q-Q图、小提琴图、散点矩阵图、交互效果图等可视化图表。内容重在实战,不涉及高深理论知识及推导。

重要事情说三遍~
想听我讲案例,请点这里,进入B站
想听我讲案例,请点这里,进入B站
想听我讲案例,请点这里,进入B站

二、框架

【数学与统计基础】常用统计检验方法的Python实现_第1张图片

三、附部分代码及输出

#相关系数
plt.figure(figsize=(15,12))
sns.heatmap( data_a.corr(method='pearson'), annot=True )
plt.show()
#散点矩阵图
cates=['v_0', 'v_1', 'v_2']
sns.pairplot(data[cates])

from scipy import stats
#方差齐性检验
w, p = stats.levene(*test_data)
#单因素方差分析
f, p = stats.f_oneway(*test_data)

from statsmodels.stats.multicomp import pairwise_tukeyhsd
print(pairwise_tukeyhsd(data['price_log'], data['bodyType']))

#多方差分析
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm
anova_res = anova_lm(ols('price_log~C(bodyType)+C(brand)+C(bodyType):C(brand)', data).fit())

# 这三个交互效果的可视化画图
from statsmodels.graphics.api import interaction_plot
from pylab import mpl      # 显示中文

#t-检验
from scipy.stats import ttest_ind
stat, p = ttest_ind(data1, data2)

#卡方检验
from scipy.stats import chi2_contingency
#列联表
obs=pd.crosstab(data['amend_a_regionCode'],data['brand'], rownames=['amend_a_regionCode'], colnames=['brand'])
stat, p, dof, expected = chi2_contingency(obs)

#Q-Q图
from statsmodels.graphics.api import qqplot
qqplot(data['price_log'],fit=True, line='45').show()

#正态检验
from scipy.stats import shapiro
stat, p = shapiro(data)

#Mann-Whitney U Test
from scipy.stats import mannwhitneyu
stat, p = mannwhitneyu(data1, data2)

【数学与统计基础】常用统计检验方法的Python实现_第2张图片
【数学与统计基础】常用统计检验方法的Python实现_第3张图片
【数学与统计基础】常用统计检验方法的Python实现_第4张图片
【数学与统计基础】常用统计检验方法的Python实现_第5张图片
【数学与统计基础】常用统计检验方法的Python实现_第6张图片
【数学与统计基础】常用统计检验方法的Python实现_第7张图片
【数学与统计基础】常用统计检验方法的Python实现_第8张图片

四、参考材料

微信公众号"Datawhale"及CSDN博客

文章1:<常用数据分析方法:方差分析及实现!>
文章2:<机器学习数学基础:常见分布与假设检验>

可结合公众号文章与我的视频一起学习,加深理解!

你可能感兴趣的:(数学与统计基础,Python,数据挖掘)