Python OLS模型

OLS模型

#OLS ordinary least square model
import numpy as np
import statsmodels.api as sm
#.api不能省
x = np.arange(-10, 10)
#假设y与x之间关系如下
y = 2*x + np.random.normal(size=len(x))
#python包中的ols模型默认没有常数项,如果要加,需要下面这一样
X = sm.add_constant(x)
#通过OLS回归模型获得各个参数
model = sm.OLS(y, X)
fit = model.fit()
print (fit.summary())
#回归的结果用表格输出,包括R平方,一些检测的P值等等
fittedValue = fit.fittedValues
#拟合值,y umlaut
residual = fit.resid
#残差值
parameter = fit.params
#各个参数
#使用dir(fit)可以看到还有哪些method或者是attributes是available的

#如果有dummy variable,使用下面的函数生成dummy variable的matix
#如果有n个observations(dummyOriginal是n行的),dummy variable有m种类型,那么下面生成的dummy会是n*m的矩阵
#drop=True表示原来的dummy original不会出现在新生成的矩阵的第一列(0列)
dummy = sm.categorical(dummyOriginal, drop = True)
#dummy跟其他变量放在一起的时候用np.hstack连接。

你可能感兴趣的:(python学习)