线性回归——回归算法

线性回归:

线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为y = w’x+e,e为误差服从均值为0的正态分布。
回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。

通过sklearn机器学习工具库
代码十分简洁,内有详细步骤和解释。
直接复制,带入数据,进行调用即可出结果,模型参数设置见文末

def Linear_Regression(X_train, Y_train, X_test, Y_test):
    """
    X_train: 特征训练集
    Y_train: 标注训练集
    X_test: 特征测试集
    Y_test: 标注测试集
    """

    # 01.创建模型
    from sklearn.linear_model import LinearRegression
    LR_model = LinearRegression()

    # 02.训练模型
    LR_model = LR_model.fit(X_train, Y_train)

    # 03.模型预测
    Y_pred = LR_model.predict(X_test)

    # 04.模型评价
    from sklearn.metrics import mean_squared_error
    print('MSE:', mean_squared_error(Y_test, Y_pred))

    # 05.输出模型参数
    print('coef:', LR_model.coef_)
    print('intercept:', LR_model.intercept_)

    return

这里的模型评价指标选择了:
均方误差MSE

在上面代码中都是针对测试集的效果,也可以对训练集进行预测,然后评价训练集的效果,综合比较,可以看看是否会出现过拟合现象。

输出的模型参数:

· coef_:回归系数
· intercept_:常数项(截距)
……
更多的模型参数,见官网

你可能感兴趣的:(【Python】机器学习,回归,线性回归,机器学习)