SVM(Andrew ng ML)

这是我的第一篇使用markdown的博客,我一定要写这么一句话


今天看完了andrew ng的SVM,觉得很有意思,其实主要的内容可以看我的参考资料1,不过有两点还是思考了一下:

1.如何通过C来控制margin

对于C来说,如果是为了控制margin,那么其实通过C可以控制其过拟合以及acc的效果,那么是通过什么来实现的呢?实际上是通过loss来实现的,如果C很大,那么错一个对象,就会loss很大,所以如果C很大,会产生过拟合的情况;如果C很小,那么就会使得对于错误样本的惩罚比较小,这样能够增强泛化能力,但是准确率会相对降低。

所以通过控制C,过大则会过拟合,虽然训练的时候acc很高;过小则会acc不足,欠拟合。

最后学习到的内容是theta,也就是在新的空间中的一个权重的分布。

2.对于m和n的关系问题

n表示原始特征的数目
m表示锚点的数目

如果n相对于m很大,那么原始数据中就可能包含进行划分的特征组合,强行降维也许并不是那么好。

如果n相对于m很小,就那么点儿数据,巧妇难为无米之炊,再怎么升高维度,也不过是原始数据的组合。

如果m和n相差不大,那么映射到另一个空间中,可能一定程度上减少原来数据中的干扰。

这其实让我想起了一个室内定位的方法,我已经忘记了具体的实现,但是主要的思路是这样的。如果通过rssi技术来定位,那么误差比较大,所以通过在室内首先找几个确定的位置来记录其在多个锚点的rssi的强度向量。这几个确定的位置作为一个基准,每一个新的需要测量的位置点,我也记录其rssi的向量,然后通过向量的距离来判断可能和哪个点比较近似。

这两个场景都是类似的思想,我认为。在室内定位中,实际的rssi的分布可能并不如理论上的那么好,所以实测比较准确,所以不是从原始数据进行判断,而是和在这个空间中的几个基准点进行判断,而这几个基准点有准确的label。

在svm中,原始数据也可能有一些误差,因此通过一些基准点映射到一个新的空间上,使得其能够在新的空间中进行划分,这样能够相对准确。前提是,数据信息并不会损失太多。


参考资料:

1.ng SVM主要内容

http://www.tuicool.com/articles/3Q7nie

你可能感兴趣的:(机器学习,svm)