数据分析学习笔记3

线性回归模型与不服从正太分布时的t检验

1、线性回归模型

# 简单线性回归模型
sns.lmplot(x='Year',y='GDP',data=data,truncate=True)
fit = sm.formula.ols('GDP~Year',data=data).fit()  # 模型拟合
fit.params  # 查看模型参数

# 多元线性回归模型
fit=sm.formula.ols('Profit~RD_Spend+Administration+Marketing_Spend',data=data).fit()  # 初步拟合模型
fit.summary()  # 查看模型检验
fit2=sm.formula.ols('Profit~RD_Spend+Marketing_Spend',data=data).fit()  # 优化后模型拟合
pred=fit2.predict(data[['RD_Spend','Marketing_Spend']])  # 预测
x=pd.concat([pd.Series(data.Profit,name='real'),pd.Series(pred,name='prediction')],axis=1)  # 查看预测值与真实值结果

2、不服从正太分布时的t检验

# 单样本t检验
import numpy as np
stats.wilcoxon(np.array(data,dtype=float)-7725)  # 数据不服从正太分布时用wilcoxon检验

# 配对/独立样本t检验
stats.mannwhitneyu(data1,data2)  # 当数据不是正态分布时用mannwhitneyu检验

你可能感兴趣的:(数据分析,python,数据分析)