论文阅读笔记4:DenseVLAD

论文题目:DenseVLAD:All about VLAD

团队:牛津视觉组2013年发表于CVPR

解决的问题:在给定查询图像的情况下进行大规模对象实例检索。本文的重点是超大规模的检索,由于存储要求,需要非常紧凑的图像描述符,并且在运行时无法直接访问有关原始SIFT描述符的信息。

创新点:1.词典自适应: 假定由一个数据集聚类得到一个词典,当前有一个新的数据集。词典自适应是如何利用已有的词典,描述新的数据集。本文的词典自适应目的是根据新的数据集的SIFT特征更新已有的词典,包括两个步骤。 (1)为新数据集的每张影像提取SIFT特征,将各个SIFT特征映射到单词上;(2)经过上步,每个单词都可能会被赋予一定数量的SIFT的特征,利用各个单词所拥有的SIFT特征求均值,得到更新后的单词。

2. 归一化(Intra-normalization):包括两步归一化。(1)首先为每个单词的残差做归一化;(2)将第一步得到的归一化向量串在一起再用得到新的归一化向量。

3.Multi-VLAD:将同一张图像用多个VLAD表示。

新概念:VLAD:一种用来描述图片整体特征的向量表示方法。

另外值得看的链接:

长期视觉定位与重定位先进方案综述:https://zhuanlan.zhihu.com/p/544955782

你可能感兴趣的:(论文阅读,人工智能,计算机视觉)