使用statsmodels模块做多元线性回归

import pandas as pd
import numpy as np
import statsmodels.api as sm

#创建数据
data=pd.DataFrame({'Y':np.random.normal(0,1,30),'X1':-3*np.random.normal(0,1,30),'X2':5*np.random.normal(0,1,30)})

#拟合模型方法一
X=data[['X1','X2']]#解释变量
X = sm.add_constant(X)#添加常数项
Y=data['Y']#被解释变量
model = sm.OLS(Y, X).fit()#模型拟合

#如果采用Newey-West 标准误差,'maxlags'可以调整滞后阶数,则使用:
model = sm.OLS(Y, X).fit(cov_type='HAC',cov_kwds={'maxlags':1})#模型拟合

#拟合模型方法二
model=sm.formula.ols('Y~X1+X2',data=data).fit()

attribute=dir(model)  # 键入dir(model)以获得完整的属性列表
print(model.predict.__doc__)#查看帮助文档
model.summary()#统计信息汇总
model.summary2()

#系数检验
params=model.params#系数
tvalues=model.tvalues#系数t值
bse=model.bse#系数标准误
pvalues=model.pvalues#系数p值

#模型检验
resid=model.resid#残差序列
model.aic#模型的AIC值
model.bic#模型的BIC值
model.ess#模型的回归误差平方和
model.ssr#模型的残差平方和
model.fvalue#F值
model.f_pvalue#F检验P值
model.df_model#模型自由度,自变量个数k
model.df_resid#残差自由度,n-k-1,样本个数-自变量个数-1
model.mse_model#ess/df_model
model.mse_resid#ssr/df_resid
model.mse_total#(ess + ssr) / (df_model+df_resid)
model.rsquared#R方
model.rsquared_adj#调整的R方

#预测
model.predict(exog=data[['X1','X2']])

你可能感兴趣的:(python操作基础知识,线性回归,数学建模,python)