函数间隔和几何间隔

根据李航老师书,自己理清一下对于函数间隔和几何间隔部分的理解。

超平面:

wx+b=0

超平面关于样本点的函数间隔为:

h = y_i (wx + b)

当超平面为:

2wx + 2b = 0

时,超平面还是原来那个超平面,但函数间隔已经变为

2h = y_i(2wx + 2b)

所以当同比例缩放w和b时,h可以趋向无穷大,这也就没有求函数间隔最大化的意义了。

而几何间隔就是超平面到点的物理距离,公式也等于函数间隔除以w的范数,即

h = y_i(\frac{w}{||w||}x + \frac{b}{||w||})

,当同比例缩放w和b时,几何间隔的值是确定的,所以我们发现几何间隔能够更好的分类。用它来做间隔最大化.

PS:什么时候用函数间隔,什么时候用几何间隔?

感知机最后形式是函数间隔,因为感知机是误分类系统,感知机的目标是使误分类的点的个数为0,加不加||w||的范数对于损失函数的的正负判定毫无影响,而且加了后会增加计算的复杂度。

而间隔最大化思想找到最优超平面,几何间隔相对于函数间隔的一个区别就是它不受参数( w 和 b )缩放影响。所以这两个的作用场景是不同的,需要我们具体情况具体分析。

你可能感兴趣的:(笔记本,支持向量机,机器学习,算法)