《机器学习》赵卫东学习笔记 第8章支持向量机(课后习题及答案)

1 作为一种分类算法,支持向量机的基本原理是什么?

支持向量机是一种二类分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器,支持向量机还包括核技巧,这使它成为实质上的非线性分类器。支持向量机的学习策略就是间隔最大化,可形式化为一个求解凸二次规划的问题,也等价于正则化的合页损失函数的最小化问题。支持向量机的学习算法是求解凸二次规划的最优化算法。

2 支持向量机适合解决什么问题?

支持向量机用于二元分类问题,对于多元分类可以将其分解为多个二元分类问题,再进行分类。

3 支持向量机常用在哪些领域?

支持向量机常用在图像分类、文本分类、面部识别以及垃圾邮件检测等领域。

4 支持向量机常用的核函数有哪些?

线性核函数:主要用于线性可分的情况。

多项式核函数:一种非稳态核函数,适合于正交归一化后的数据。

径向基核函数:具有很强的灵活性,应用广泛。大多数情况下有较好的性能。

Sigmoid核:来源于MLP中的激活函数,SVM使用Sigmoid相当于一个两层的感知机网络。

5 核函数的选择对支持向量机的性能有何影响?

只要一个对称函数所对应的核矩阵半正定,它就能作为核函数使用。事实上,对于一个半正定核矩阵,总能找到一个与之对应的映射。核函数的使用,不一定能够准确的划分,只能说使用哪个核函数,能够逼近真实的划分效果。因此特征空间的好坏对支持向量机的性能至关重要。在不知道特征映射的形式时,我们并不知道什么样的核函数是合适的,而核函数也仅是隐式定义了这个特征空间。于是,核函数的选择成为了支持向量机的最大变数。若核函数选择不合适,则意味着映射到一个不合适的特征空间,很可能导致性能不佳。

你可能感兴趣的:(4_数据挖掘与机器学习)