吴恩达机器学习笔记——支持向量机

对应吴恩达机器学习网易云课程第13章的内容。

在监督学习方面,与神经网络和逻辑回归相比,支持向量机在学习复杂的非线性方程时有很大的优势。


SVM优化目标


 

  • 支持向量机的优化目标:支持向量机的优化目标表达式是从逻辑回归改进而来的。在cost函数中,在y=0和y=1时使用两条直线来代替曲线,分别得到的两个表达式我们定为cost_{0}(\Theta ^{T}x^{(i)})cost_{1}(\Theta ^{T}x^{(i)})。进而我们将最小值表达式乘m,使用新的权重表示变量C代替原有的\lambda。得到SVM的优化目标表达式如下。

吴恩达机器学习笔记——支持向量机_第1张图片

  • 与逻辑回归h_{\theta }(x)输出概率不同,SVM直接输出结果,也即,利用求得的\Theta向量,计算\Theta^{T}x

吴恩达机器学习笔记——支持向量机_第2张图片


SVM大间隔


吴恩达机器学习笔记——支持向量机_第3张图片

  • 从直观上来说,SVM(也被称为大间距分类器)求得的决策边界与样本的最大间距更大一些。这个间距称为支持向量机的间距。

吴恩达机器学习笔记——支持向量机_第4张图片

  • 当我们将C设置的非常大时,我们的分类器将对异常数据非常敏感,即,当增加了图中这样的异常点时,决策边界将从竖直线变为斜线。但如果C不被设置为这么大,它将对敏感数据有一定的“宽容性”,决策边界极有可能保持竖直线不变。

核函数


吴恩达机器学习笔记——支持向量机_第5张图片

 

吴恩达机器学习笔记——支持向量机_第6张图片

通过定义核函数产生新的特征,也即任选一些点,对每一个点周围的点有一个量化相似度的函数,称为核函数(这里我们使用高斯核函数),当相似度高时,核函数值趋近于甚至等于1,否则则无限趋近于0。在公式中我们将不同点l^{(i)}对应的衡量相似度的函数记为f_{i},那么给定一个待判断点,我们可以结合参数向量通过计算\Theta ^{T}x是否大于0来得到模型预计的结果,>=0默认预测结果为1,否则为0。

吴恩达机器学习笔记——支持向量机_第7张图片

因此,在SVM中,我们可以通过标记点和相似性函数,来定义新的特征变量,从而训练复杂的非线性边界。

那么,我们如何得到并选择这些标记点?其他的核函数是什么样子的?

我们可以就选择训练集中的点作为标记点。l^{(i)}=x^{(i)}

吴恩达机器学习笔记——支持向量机_第8张图片吴恩达机器学习笔记——支持向量机_第9张图片

所以每个样本的x^{(i)}对应一个特征向量f^{(i)}f_{j}^{(i)}代表训练样本点x^{(i)}与预设点l^{(j)}=x^{(j)}之间的相似度。故f_{i}^{(i)}=1。我们还会在特征向量f^{(i)}中添加一个分量f_{0}^{(i)}=1。

所以加入核函数改进后的SVM是根据给定的特征向量x得到新的特征向量f,它是m+1维的。

吴恩达机器学习笔记——支持向量机_第10张图片

得到新的代价函数如上,我们求得的是使得上式取得最小值的\Theta向量。需要注意的是,不仅cost函数内部被更换,后面正则项中n代表的是新特征的数目,即m。而\Theta _{0}不参与正则化。


SVM参数


C :较大的C,正则化程度越低,越容易过拟合。

\sigma ^{2}\sigma^{2}​​​​​​​越大,曲线越平缓,容易得到一个高偏差、低方差的模型。它倾向于得到一个随着x变化得缓慢的模型。

吴恩达机器学习笔记——支持向量机_第11张图片

你可能感兴趣的:(机器学习,神经网络)