【学习笔记】机器学习西瓜书-第三章:线性模型

文章目录

  • 3.1 基本形式
  • 3.2 线性回归

3.1 基本形式

线性模型试图学得一个通过属性的线性组合来进行预测的函数,即

f(x) = w1x1 + w2x2 + … + wdxd + b

一般用向量形式写成 f(x) = wTx + b
其中,x=(x1;x2;…;xd),表示由d个属性描述组成的示例。

3.2 线性回归

线性回归(linear regression)试图学得一个线性模型以尽可能准确地预测实值输出标记。

1.首先只考虑输入属性只有一个的情形,即

f(x) = wxi + b,使得f(xi) ≈ yi

(1)首先需要对输入属性进行转换操作,对于离散属性:

  • 如果属性值间存在“序”(order)关系,可通过连续化将其转化为连续值。
    eg:二值属性“身高”的取值“高”“矮”可转化为{1.0, 0.0};
  • 如果属性值间不存在序关系,假定有k个属性值,则通常转化为k维向量。
    eg:属性“瓜类”的取值“西瓜”、“南瓜”和“黄瓜”,可转化为(0,0,1),(0,1,0),(1,0,0)。

(2)w和b的确定

借用均方误差来衡量预测值和真实值之间的区别,令均方误差最小化:
【学习笔记】机器学习西瓜书-第三章:线性模型_第1张图片
均方误差对应了常用的欧几里得距离(欧氏距离),基于均方误差最小化来进行模型求解的方法称之为“最小二乘法”,也就是试图找到一条直线,使所有样本到直线上的欧式距离之和最小。

求解w和b使得均方误差最小化的过程,称为线性回归模型的最小二乘“参数估计”

将E(w,b)分别对w和b求导:
【学习笔记】机器学习西瓜书-第三章:线性模型_第2张图片
令上面两个式子为0就得到w和b最优解的闭式解:
【学习笔记】机器学习西瓜书-第三章:线性模型_第3张图片
【学习笔记】机器学习西瓜书-第三章:线性模型_第4张图片
2.考虑更一般的情况,即数据样本由d个属性描述,此时试图学得

f(xi) = wTxi + b,使得f(xi) ≈ yi

称为“多元线性回归”或“多变量线性回归”。

你可能感兴趣的:(机器学习,学习,人工智能)