主动学习相关论文个人心得体会(一):主动学习算法综述

写在前面:
本人是从事与AI算法研究的研一学生,前段时间,我的导师叫我开始看看有关主动学习的文章,于是我的五一假期就这样泡汤了(其实因为疫情我在家已经浪了快一百天了,嘻嘻嘻,五一假期对我来说可有可无,哈哈哈)]
言归正传,还是来说说主动学习吧!
第一篇文章还是先说说自己对主动学习的理解吧,具体的以后再说,就这么愉快的决定了!!!
正文:
主动学习,顾名思义,就是该算法能够主动的进行学习(小白听了是不是感觉很神奇,可是专业人士听了可能会认为有点故弄玄虚,哪有什么主动学习,还不是人为干预的结果);专业人士果然一针见血,能够深入问题的本质。没错,说到底,主动学习也是人造的,没有人为干预只是一堆稀奇古怪的公式及定理。只有人们合理地运用,才能发挥其最大的效果。
之前看到有人提出这样的主动学习模型:
主动学习模型:A=(C,Q,S,L,U),其中 C 为一组或者一个分类器,L是用于训练已标注的样本。Q 是查询函数,用于从未标注样本池U中查询信息量大的信息,S是督导者,可以为U中样本标注正确的标签。学习者通过少量初始标记样本L开始学习,通过一定的查询函数Q选择出一个或一批最有用的样本,并向督导者询问标签,然后利用获得的新知识来训练分类器和进行下一轮查询。主动学习相关论文个人心得体会(一):主动学习算法综述_第1张图片
我刚开始接触主动学习地时候,感觉还是有点懵逼,不知道里面的学习模型和专家为何物,经过细品,终于明白一二;为此,我重新画了个流程图,大致如下:
主动学习相关论文个人心得体会(一):主动学习算法综述_第2张图片
算法步骤如下:
1.根据某一选取规则对数据进行挑选,挑选出的数据样本作为数据池样本
2.将数据池样本送至专家处进行标记
3.将专家标集的数据池样本用分类器进行分类
4.判断当前分类效果是否满足要求,如不满足,重复步骤2、3。
5.当分类器能够得到满足要求的分类效果时,将原始数据集中的剩余样本用训练好的分类器进行分类。

Tips:
1.前面所提出的主动学习模型:A=(C,Q,S,L,U),C是指的分类器(可以是常见的SVM,ELM等),S专家也是指的分类器,Q是某一样例选取函数,算法通过该函数对数据池样本进行挑选。
2.目前算法主要优化方向是:在选取函数Q和分类器C进行优化。
3.如有不对的地方,欢迎各位大佬批评指正。大家相互成长,感激不尽。

你可能感兴趣的:(主动学习相关论文个人心得体会(一):主动学习算法综述)