分类算法----线性可分支持向量机(SVM)算法的原理推导

支持向量机(support vector machines, SVM)是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,

其目标是在特征空间中找到一个分离超平面,能将实例分到不同的类,分离超平面将特征空间划分为两部分,正类和负类,法向量

指向的为正类,

1.几何间隔和函数间隔

分类算法----线性可分支持向量机(SVM)算法的原理推导_第1张图片

如下图,有红色和绿色两类,假设红色为正,绿色为负类,数据集线性可分,这是有许多直线将两类数据正确分开,线性可分支持向量机

对应着将两类数据正确划分并且间隔最大的直线

分类算法----线性可分支持向量机(SVM)算法的原理推导_第2张图片

函数间隔

对于给定的训练数据集T和超平面(w,b)定义函数间隔为


分类算法----线性可分支持向量机(SVM)算法的原理推导_第3张图片

函数间隔可以表示分类预测的正确性及确信度,但是选择分离超平面时只有函数间隔是不够的,

因为只要成比例的改变w和b,超平面并没有改变,但是函数间隔却相应改变,因此需要对分离超平面进行约束,

使得间隔是确定的,这时函数间隔就变成几何间隔。

分类算法----线性可分支持向量机(SVM)算法的原理推导_第4张图片

则定义超平面(w,b)关于训练数据T的几何间隔为超平面(w,b)关于T中所有样本点(xi,yi)的几何间隔之最小值,即


由上面式子可得函数间隔和几何间隔存在如下关系式

分类算法----线性可分支持向量机(SVM)算法的原理推导_第5张图片

2.间隔最大化

对于线性可分支持向量机,线性可分分离超平面有无穷多个,但集合间隔最大的分离超超平面是唯一的

1.最大间隔分离超平面

分类算法----线性可分支持向量机(SVM)算法的原理推导_第6张图片

2 拉格朗日对偶算法解最优化问题

分类算法----线性可分支持向量机(SVM)算法的原理推导_第7张图片

分类算法----线性可分支持向量机(SVM)算法的原理推导_第8张图片

分类算法----线性可分支持向量机(SVM)算法的原理推导_第9张图片

分类算法----线性可分支持向量机(SVM)算法的原理推导_第10张图片

到此线性可分支持向量机基本推到完毕,总计其过程如下

(1)构造并求解约束最优化问题

分类算法----线性可分支持向量机(SVM)算法的原理推导_第11张图片

(2)计算w*和b*

分类算法----线性可分支持向量机(SVM)算法的原理推导_第12张图片

(3)求得分离超平面和分离决策函数

分类算法----线性可分支持向量机(SVM)算法的原理推导_第13张图片

后续线性支持向量机和线性不可分支持向量机以及SMO算法


你可能感兴趣的:(分类算法)