周志华《机器学习》读书笔记(2)

第三章 线性模型

  1. 给定由d个属性描述的示例 x=(x1;x2;...;xd) ,其中 xi x 在第 i 个属性上的取值。线性模型(linear model)试图学得一个通过属性的线性组合来进行预测的函数,即

    f(x)=w1x1+w2x2+...+wdxd+b

    一般用向量形式写成
    f(x)=wTx+b

    其中 w=(w1;w2;...;wd) wb

    线性模型有很好得解析性,例如在西瓜问题中学得 f(x)=0.2x+0.5x+0.3x+1 ,则意味着可通过综合考虑色泽、根蒂和敲声来判断瓜好不好,其中根蒂最重要,而敲声比色泽更重要。

  2. 线性回归。

    • 给定数据集 D={(x1,y1),(x2,y2),(x3,y3),...,(xm,ym)} ,其中 xi=(xi1;xi2;xi3;...;xid)yiR ,线性回归试图学得一个线性模型以尽可能准确的预测实值输出标记。
    • 我们考虑一种最简单的标记:输入属性的数目只有一个。此时我们忽略关于属性的下标,即 D={xi,yi}mi=1
    • 对离散属性,如果属性间存在“序”(order)关系,可通过连续化将其转化为连续值,例如身高中的“高”、“矮”,可转化为 {1.0,0.0} 。三值属性“高度”的取值“高”、“中”、“低”。可转化为k维向量,例如属性“瓜类”中的取值“西瓜”、“南瓜”“黄瓜”可转化为 (0,0,1),(0,1,0),(1,0,0)

    若将无序属性连续化,则会不恰当的引入序关系,对后续处理如距离计算等造成误导。

  3. 线性回归试图学得
    f(xi)=wxi+b
    ,使得
    f(xi)yi
  4. (w,b)=argmin(w,b)i=1m(f(xi)yi)2=argmin(w,b)i=1m(yiwxib)2

你可能感兴趣的:(机器学习,机器学习,读书笔记)