瓜书学习笔记-多分类学习啰嗦版

对瓜书63页个人消化理解

作为一个小白,最近在课业压力下坚持不懈的看着瓜书。总是会觉得看视频的效果好于自己啃书,然鹅。。瓜书有视频版么??(一想到以后要持续不断地翻看英文论文和书籍心情就#%+||?*?……@?)
Anyway,言归正传。在自己啃书的时候会遇到很多问题(比如想发一篇博客都得花20min速成一下Markdown编辑器),在前三章过程中最难啃的莫过于这个多分类学习(瓜书63页)。第一遍阅读的时候觉得莫名其妙一脸懵逼,接连阅读几次才得到其中真义,顿觉周大神真心这里省略了很多啰嗦的语言,虽然言简意赅但是对于初学者也是不容易看懂的。所以下面就上一个包租婆啰嗦版,并不确定自己理解的对不对,第一次发博文,有任何的地方都请第一时间联系我,希望能得到大家批评指正。
废话不多说,懒癌患者直接上图

瓜书学习笔记-多分类学习啰嗦版_第1张图片

图片来源于周志华《机器学习》

OvO的方法简单来说
第一步:两两配对。简单来说就是先将属于类C1的样例集合分别和属于类C2的样例集合、属于类C3的样例集合…到属于Cn的样例集合分别组合到一起成为一组配对;再将属于C2的样例集合分别与属于C3的、属于C4的…属于Cn的分别组合配对,以此类推。这样下来类C1所在的配对组合有N-1个,类C2所在的并且不包含C1的配对组合有N-2个…这样Cn所在并且前Cn-1都不在的配对组合有0个。根据数列求和公式我们可知总共有N(N-1)/2个配对组合。
第二步:训练分类器。把每个配对组合中的两个类别分别作为正例和反例,训练出一个二分类学习器。这样我们总共能得到N(N-1)/2个分类器。这样对于每个配对组合,为其定制的分类器都能准确的输出其是正例还是反例。
第三步:测试。让这些分类器排排坐,拿到新样本后(我们并不知道这个样本是什么类别的),同时提交给所有分类器。图解流程是这样的:

瓜书学习笔记-多分类学习啰嗦版_第2张图片

图片来自周志华《机器学习》

让每个分类器都说出自己心目中的类别,当然,每个分类器只能从自己对应的那个配对组合里二选一。 这样我们就得到了一堆类别,最后看哪个类别数量最多,我们就认为这个新样本是哪个类别的。 在弄清楚了OvO的原理后,OvR的原理也可以类推了.

你可能感兴趣的:(学习笔记,机器学习,西瓜书,个人理解)