MIL多示例学习的理解

多示例学习:包(bags) 和 示例 (instance)

包是由多个示例组成的。
举个例子,在图像分类中,一张图片就是一个包,图片分割出的patches就是示例。
在多示例学习中,包带有类别标签示例不带类别标签,最终的目的是给出对新的包的类别预测

多示例学习是弱监督学习中的一个有效方法。用于训练分类器的instance是没有类别标记的,但是bags却是有类别标记的,这一点与以往所有框架均不甚相同。
MIL多示例学习的理解_第1张图片

(1)我们就拿图像分类举个例子:图像分类是基于图像内容来确定图像目标的类别。
例如:一张图片上存在"sand"、“water"等各种示例,我们研究的目标是"beach”。在多示例学习中,一张图像作为一个"包":X={X1,X2,X3, …, Xn}。Xi是特征向量(也就是我们所说的示例),是从图像中对应的第i个区域中提取出来的,总共存在N个示例区域。那么,"包"中当且仅当"sand"和"water"都存在时,此时"包"才会作上"beach"标签。
显然,利用这种方法来研究图像分类就考虑到了图像中元素之间关系,相比单示例方法在某些情况下得出的分类效果更好。

(2)问题的实际应用:做检测问题,标记训练图片样本的时候需要给出一个矩形框指明目标的位置,有可能标的不够准确,导致不同的样本之间对不齐,这时候可以将标记的矩形框做一些局部扰动得到一些新的矩形框,将它们一起看成一个bag,其中总有一个是最佳的正样本,也就是标记为正。而取一张没有目标的图片,作为负样本包,无论在里面怎么截取图片,都是负样本。

  • 参考链接:https://baike.baidu.com/item/多示例学习/6801797?fr=aladdin
  • 参考链接:https://www.cnblogs.com/rong86/p/6071748.html

你可能感兴趣的:(深度学习)