线性回归

line model lm

1、残差:估计量\hat{Y}和观测值Y的差

2、最小二乘法

是一种求最优解的数学优化技术

离差平方和(TSS)最小=》离差平方和 对回归参数求偏导得出回归参数值

3、拟合优度:

TSS (离差平方和)= ESS (回归平方和)+ RSS(残差平方和)

回归平方和:\hat{Y}\bar{Y}的差和

残差平方和:Y与\hat{Y}的查和

可决系数r^{2} = ESS/TSS(回归平方和在总离差中的比例,越大拟合优度越高),r^{2}=1 完全拟合,r^{2}=0无线性关系

每个系数的t检验

整体的f检验

4、python使用方法

from sklearn.linear_model import LinearRegression
x = data[['balance','interval']]
y = data['sign']
'''拆分训练数据与测试数据 '''
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.2)
linerg = LinearRegression()
model = linerg.fit(x_train,y_train)
print linerg.intercept_
print linerg.coef_
'''预测'''
y_pre = linerg.predict(x_test)

你可能感兴趣的:(datamining)