西瓜书笔记(第六章 支持向量机)

西瓜书笔记(第六章 支持向量机)

6.1 间隔与支持向量

西瓜书笔记(第六章 支持向量机)_第1张图片

直观上看,应该去找位于两类训练样本“正中间”的划分超平面,即图6.1中红色的那个,因为该划分超平面对训练样本局部扰动的“容忍”性最好.例如,由于训练集的局限性或噪声的因素,训练集外的样本可能比图6.1中的训练样本更接近两个类的分隔界,这将使许多划分超平面出现错误,而红色的超平面受影响最小,换言之,这个划分超平面所产生的分类结果是最鲁棒的,对未见示例的泛化能力最强。
西瓜书笔记(第六章 支持向量机)_第2张图片

西瓜书笔记(第六章 支持向量机)_第3张图片

6.2 对偶问题

西瓜书笔记(第六章 支持向量机)_第4张图片

西瓜书笔记(第六章 支持向量机)_第5张图片

西瓜书笔记(第六章 支持向量机)_第6张图片

西瓜书笔记(第六章 支持向量机)_第7张图片

6.3 核函数

在本章前面的讨论中,我们假设训练样本是线性可分的,即存在一个划分超平面能将训练样本正确分类,然而在现实任务中,原始样本空间内也许并不存在一个能正确划分两类样本的超平面,例如图6.3中的“异或”问题就不是线性可分的。

西瓜书笔记(第六章 支持向量机)_第8张图片

西瓜书笔记(第六章 支持向量机)_第9张图片

西瓜书笔记(第六章 支持向量机)_第10张图片
西瓜书笔记(第六章 支持向量机)_第11张图片

6.4 软间隔与正则化

在前面的讨论中,我们一直假定训练样本在样本空间或特征空间中是线性可分的,即存在一个超平面能将不同类的样本完全划分开,然而,在现实任务中往往很难确定合适的核函数使得训练样本在特征空间中线性可分;退一步说即便恰好找到了某个核函数使训练集在特征空间中线性可分,也很难断定这个貌似线性可分的结果不是由于过拟合所造成的.
缓解该问题的一个办法是允许支持向量机在一些样本上出错.为此,要引入“软间隔”(soft margin)的概念,如图6.4所示.

西瓜书笔记(第六章 支持向量机)_第12张图片

西瓜书笔记(第六章 支持向量机)_第13张图片

西瓜书笔记(第六章 支持向量机)_第14张图片

西瓜书笔记(第六章 支持向量机)_第15张图片

西瓜书笔记(第六章 支持向量机)_第16张图片

6.5 支持向量回归

西瓜书笔记(第六章 支持向量机)_第17张图片

西瓜书笔记(第六章 支持向量机)_第18张图片

西瓜书笔记(第六章 支持向量机)_第19张图片

西瓜书笔记(第六章 支持向量机)_第20张图片

西瓜书笔记(第六章 支持向量机)_第21张图片

6.6 核方法

(略)

你可能感兴趣的:(机器学习,支持向量机,算法,机器学习)