算法刷题(6)

题目一:如果将数据中除圈起来的三个点以外的其他数据全部移除,那么决策边界是否会改变? 算法刷题(6)_第1张图片

A

B

不会

解析:正确答案是: B,决策边界只会被支持向量影响,跟其他点无关。

 

题目二:关于SVM泛化误差描述正确的是

A

超平面与支持向量之间距离

B

SVM对未知数据的预测能力

C

SVM的误差阈值

解析:正确答案是: B,统计学中的泛化误差是指对模型对未知数据的预测能力。

 

题目三:训练SVM的最小时间复杂度为O(n2),那么一下哪种数据集不适合用SVM?

A

大数据集

B

小数据集

C

中等大小数据集

D

和数据集大小无关

解析:正确答案是:A,有明确分类边界的数据集最适合SVM,因为大数据即更不易有明确边界。

 

题目四:支持向量是那些最接近决策平面的数据点

A

B

解析:正确答案是:A,支持向量就在间隔边界上,这里要考虑一个问题软件间隔的时候,有分类错误的点可能距离更近。

 

题目五:假定你使用了一个很大γ值的RBF核,这意味着:

A

模型将考虑使用远离超平面的点建模

B

模型仅使用接近超平面的点来建模

C

模型不会被点到超平面的距离所影响

D

以上都不正确

解析:正确答案是: B,SVM调参中的γ衡量距离超平面远近的点的影响。 对于较小的γ,模型受到严格约束,会考虑训练集中的所有点,而没有真正获取到数据的模式、对于较大的γ,模型能很好地学习到模型。参考

SVM 中为了得到更加复杂的分类面并提高运算速度,通常会使用核函数的技巧。径向基核函数(RBF)也称为高斯核函数是最常用的核函数,其核函数的表达式如下所示:

形式与高斯分布类似,Gamma γ 是高斯分布中标准差 Sigma σ 的导数。我们知道在高斯分布中,σ 越小,对应的高斯曲线就越尖瘦。也就是说 γ 越大,高斯核函数对应的曲线就越尖瘦。这样,运用核技巧得到的 SVM 分类面就更加曲折复杂,甚至会将许多样本隔离成单个的小岛。

下面是 γ 分别取 1、10、100 时对应的 SVM 分类效果:

算法刷题(6)_第2张图片

值得一提的是,γ 过小容易造成欠拟合,γ 过大容易造成过拟合。

你可能感兴趣的:(刷题)