多示例学习---001(多示例学习和多标签学习)

文章目录

  • 学前娱乐
  • 引入
  • 多示例学习
    • 重点1
    • 重点2
  • 多标签学习

学前娱乐

姐夫荣升部门经理,公司为他配了个年轻漂亮的女秘书。
姐姐听说后,满脸醋意地向姐夫求证。姐夫轻描淡写地说:“她什么都不懂,就像个洋娃娃似的。
小外甥女听到了,陡生兴趣,忙跑过来问:“爸爸,你让那个洋娃娃躺下时,她会不会闭上眼睛?

段子来源

引入

   想必,进来的同学们都是开始接触多示例学习的同伙(手动滑稽),作为一个小白,我接下来将从多示例学习的角度和多标签学习的一个角度来分析,关于多示例的一些概念。(有啥不对的地方,希望大家指正!)

多示例学习

   学习多示例学习之前,需要了解一些基础知识,有监督学习,无监督学习,半监督学习;有些同学习惯把多示例学习分为这三种学习的一种,我的理解是,多示例学习,它可以参合这三种学习一起学习。这里我就不具体阐述什么是监督学习了,有兴趣的东西也可以去查阅一下其它资料,后续我也会给出这三种监督学习的知识点。

重点1

   好了,说了那么多,现在进入到多示例学习的环节。在这之前,我们先了解两个多示例中最基础的两个概念:包 (bag)和实例 (instance)。每个 X i X_i Xi 由多个实例 x i x_i xi 组成,实例是一个向量;这样说可能就十分抽象了,比如说像我这个小白,就不能够很直观的感受什么是包和实例,那么,我们用下面的图来做出进一步的阐述:这几张图是一些老虎的图:
  
  
多示例学习---001(多示例学习和多标签学习)_第1张图片

图1:

   我们把每一张图看作是一个包,那么实例又是什么呢?我们看第三张图,里面有老虎,有树,有草,我们就把图中这三个部分看作为三个实例,所以,我们的包中就有了三个实例,每一个实例的属性又是怎么样的呢?我们给出下面这样的一个数据:

在这里插入图片描述

图2:

   这是一个包中的实例表示:行数表示的实例数,包中一共有7个实例,每一个实例是一个向量,那么向量的每一个数据表示的是什么呢?我们知道,对于每一个对象,比如说老虎,都有,毛发的长短,颜色的深浅,眼睛的瞳色,耳朵的大小等等,这些都是他们的一些特征,由这些特征,我们就可以组成一个新的向量,我们用这个向量来表示这个老虎的对象,这就是图2中数据的来由。
   但是,在实际生活中,我们要处理的图不是单独的一张,而是成百上千的图,所以,这就是多示例中 的来源。下图我给出处理过的一些老虎的数据集:

多示例学习---001(多示例学习和多标签学习)_第2张图片

图3:
  图3 中的每一行数据表示一个包(也就是一张图),没一行展开之后,就是图2这样的一些实例的集合 。然后我们会给一个包(图)来打上一个标签,这个标签代表什么呢?在多示例学习中,我们这样认为,如果一个包里面存在至少一个被分类器判定为+的实例,则该包为正包,如果包中一个+的实例都没有,那么就为负包。这个标签,就代表这个包是否属于正包,是正包就打上1,负包就为0 (也可以是-1)。有同学可能会问,什么是正的实例呢?我们这样理解,我们把老虎这样的一个实例认定为正实例,如果一个包中有这么一个实例(包),那么这个包就是正包。

重点2

   那么有同学可能会问了,我们学了这么一个多示例,有什么用呢?我们在生活中,可能会对一些东西来分类(很重要呢),我们多示例学习就是,先对一些已知数据进行处理(建立一个模型),然后用这个模型对未知数据进行处理;
   举个例子,我们用老虎的图片来进行训练,训练出一个模型,后面来了一张新的图片,我们首先不知道它是不是属于老虎这一类的图片,那么我们就需要用这个模型来对它进行一个预测,然后给它一个标签。
  简单的来说,多示例就是这么一个过程:
  1)先用已知的数据来训练一个模型;
  2)然后用这个模型来对未知的一些数据进行一个预测。

多标签学习

  由于本人是学习多示例的小白,可能对多标签学习的认识不是很清楚,希望大佬们指教。。。
后面持续更新。。。

你可能感兴趣的:(论文阅读,机器学习)