机器学习14 线性回归代码实现(boston房价)

文章目录

      • 线性回归表示
      • 模型参数
      • 属性
      • 方法
      • 补充:0-1规划(去量纲/归约)不受单位的影响
      • !实战代码
        • 基础操作(导包,导数据,生成xy,训练集测试集划分,准确度)
        • 调参
        • 最优参数
        • 错误鉴赏
        • 完整boston房价数据调参代码

线性回归表示

注意区分,一般lr缩写表示逻辑回归,线性回归不要用这个缩写

模型参数

机器学习14 线性回归代码实现(boston房价)_第1张图片

属性

机器学习14 线性回归代码实现(boston房价)_第2张图片

方法

在这里插入图片描述

补充:0-1规划(去量纲/归约)不受单位的影响

机器学习14 线性回归代码实现(boston房价)_第3张图片
需要去掉量纲,公式如下:
机器学习14 线性回归代码实现(boston房价)_第4张图片

!实战代码

基础操作(导包,导数据,生成xy,训练集测试集划分,准确度)

机器学习14 线性回归代码实现(boston房价)_第5张图片

调参

机器学习14 线性回归代码实现(boston房价)_第6张图片
机器学习14 线性回归代码实现(boston房价)_第7张图片
还有就是,这里准确度用的数据是x_test 和 y_test ,要把上面代码的score写成'score':linear.score(x_test,y_test)

最优参数

机器学习14 线性回归代码实现(boston房价)_第8张图片
最优参数看准确率score最高的,有两个都是0.668759,都可以选,
但是,实际工作中,fit_intercept=True 表示要截距 ,normaliza = False表示不进行归一化(归约),不进行归一化可以少一步计算量

错误鉴赏

机器学习14 线性回归代码实现(boston房价)_第9张图片
TrueFalse 在python里是关键字,不加引号
DataFrame应该在循环外面

机器学习错误3 忘记使用fit() 导致报错`AttributeError: ‘LinearRegression‘ object has no attribute ‘coef_‘

完整boston房价数据调参代码

导入包

from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
import pandas as pd #后期用DataFrame时补加上

导入数据

#波士顿房价数据集
boston = datasets.load_boston() #系统自带数据
boston.keys()

查看x和y

x=boston.data
x
y=boston.target
y

分裂测试集和训练集

x_train, x_test, y_train, y_test = train_test_split( x, y, test_size=0.2, random_state=42)

调参(在循环里建模,字典,追加,DataFrame显示)

result = []
for inercept in [True,False]:
    for norm in [True,False]:
        linear = LinearRegression(fit_intercept=inercept,normalize=norm)
        linear.fit(x_train,y_train)
        
        
        d = {'fit_intercept':inercept,'normalize':norm,'score':linear.score(x_test,y_test),'coef':linear.coef_ ,'intercept':linear.intercept_}
        result.append(d)
    
result_df = pd.DataFrame(result)
result_df
        

你可能感兴趣的:(机器学习,机器学习,线性回归,python)