SVM算法扫盲理解

名称:SVM(support vector machine)支持向量机

要解决的问题:二分类问题

形象理解:用一个超平面,将数据二分类。寻找最优超平面,并使得两个类别中,距离超平面距离最近的点,距超平面的距离最远。也即:两个类别中,距离超平面最近的点,会分别决定两个平行的超平面,这两个超平面称为支持向量。

本质:凸函数优化问题(一定有全局最优解),优化的目标为:两个支持向量距离最远。

线性可分:在N维空间中,若有n-1维的向量可完成数据的分类,该问题即线性可分,寻找到的n-1维向量即超平面。

如何解决非线性问题:通过核函数,将数据映射到高纬空间,使得在低纬度空间的非线性问题转化为高纬度的非线性问题。

核函数:SVM中常用的有高斯核函数,多项式核函数。在寻找最优解的过程中,只涉及到样本点间内积的计算,故核函数不需要给出显式的计算过程,只需要给出样本点内积计算的函数映射即可。

 

你可能感兴趣的:(SVM算法扫盲理解)