Scalable Algorithms for Multi-Instance Learning

Scalable Algorithms for Multi-Instance Learning

多示例学习的可扩展算法

时间:2022/12/6

文章目录

  • Scalable Algorithms for Multi-Instance Learning
    • bib
    • 主要贡献
    • 主要内容
      • 一、miVLAD
        • 1.主要思想
        • 2.算法伪代码

bib

@article{wei2016scalable,
  title={Scalable algorithms for multi-instance learning},
  author={Wei, Xiu-Shen and Wu, Jianxin and Zhou, Zhi-Hua},
  journal={IEEE transactions on neural networks and learning systems},
  volume={28},
  number={4},
  pages={975--987},
  year={2016},
  publisher={IEEE}
}

主要贡献

为了解决大规模的MIL问题,提出了基于局部聚合描述子表示向量的MIL和基于Fisher向量表示的miFV两种高效可扩展的MIL算法。

miVLAD和miFV由于映射步骤的计算成本低,线性分类器的可扩展性强,能够高效、有效地处理大规模MIL数据。实验表明,miVLAD和miFV不仅与最先进的MIL算法具有相当的准确率,而且速度快了数百倍。

可以将新的miVLAD和miFV表示视为多视图数据,这在大多数情况下提高了准确率。

主要内容

VLAD表示和FV表示是计算机视觉中的两种方法。给定一幅图像和一组从该图像中提取的描述符(向量)(例如,SIFT), VLAD或FV将它们编码为高维向量,这就是新的图像级签名。

一、miVLAD

1.主要思想

首先从整个训练集实例空间中寻找K个向量,即“描述符”。文章所采用的方法是对训练实例空间进行K-means聚类,选取K个簇中心来作为描述符即 C = { c 1 , . . . c k , . . . , c K } C=\{c_1,...c_k,...,c_K\} C={c1,...ck,...,cK},这里作者将 C C C称作codebook,即“密码本”。如同传统密码学中的加解密的依据,这里也将这个 C C C作为之后编码的基础依据。而由于每一个聚类中心 c i c_i ci都是隶属于一个簇,则在这个簇内的实例 x i j x_{ij} xij(第i个包的第j个实例)都是隶属于这个簇中心 c i c_i ci,则记录每个实例与其簇中心/描述符的对应关系 c k = N N ( x i j ) c_k=NN(x_{ij}) ck=NN(xij)

之后通过如算法2所示映射函数将一个包 X i X_i Xi转换成一个向量 v i v_i vi,具体来说则是通过如下公式进行差值计算:

v i k l = ∑ x i j ∈ Ω x i j l − c k l (1) v_{ikl}=\sum_{x_{ij}\in\Omega}x_{ijl}-c_{kl} \tag{1} vikl=xijΩxijlckl(1)

Ω = { x i j ∣ N N ( x i j ) = c k } \Omega=\{x_{ij}|NN(x_{ij})=c_k\} Ω={xijNN(xij)=ck} ,这里 v i v_i vi的维度为D=K x d。 v i k l v_{ikl} vikl表示 v i v_i vi的第k个分量的第 l l l个属性, x i j l x_{ijl} xijl c k l c_{kl} ckl分别表示实例 x i j x_{ij} xij及其对应质心 c k c_k ck的第 l l l个属性。其中,vi中的每个元素都是$v_{il}\leftarrow sign(v_{il}) \sqrt{|v_{il}|} 。 然 后 , 将 新 的 特 征 向 量 v i 通 过 。然后,将新的特征向量vi通过 viv_i←v_i /{||v_i||}^2$ 归一化。最终包便转换成特征向量。

之后便使用转换后的向量来训练单实例分类器得到模型M()。预测时便先将待预测的包通过算法2的映射函数转换成特征向量,之后使用训练好的模型来预测。

2.算法伪代码

Scalable Algorithms for Multi-Instance Learning_第1张图片
Scalable Algorithms for Multi-Instance Learning_第2张图片

你可能感兴趣的:(多示例学习,算法,聚类)