images are intrinsically hierarchical: In Figure 1a the salad and spoons are inside the salad bowl, which in turn stands on the table
将各个区域归成一组有多种原因
比如说上图,我们可以通过颜色区分两只猫,而不能通过纹理区分
而上图的变色龙,我们可以通过纹理区别,而不能通过颜色区分
图上中,车的轮子跟车相比,颜色和纹理都不相同,但是他们确是一类
aim to combine the best of the intuitions of seg- mentation and exhaustive search and propose a data-driven selec- tive search
aim to combine the best of the intuitions of seg- mentation and exhaustive search and propose a data-driven selec- tive search
Inspired by exhaustive search, we aim to capture all possible object locations. Therefore, instead of using a single sampling technique, we aim to diversify the sampling techniques to account for as many image conditions as possible >>
Specifically, we use a data-driven grouping- based strategy where we increase diversity by using a variety of complementary grouping criteria and a variety of complementary colour spaces with different invariance properties
有哪些好的分割和合并策略 ?
select search算法的时间复杂度如何?
我们能不能将select search算法应用到更power到目标检测分类器中
the visual search space is huge, making an exhaustive search computationally expensive
Hence most of these sliding window techniques use a coarse search grid and fixed aspect ratios
为了体现diversification,所以作者提出了多种策略。
其中最重要的是要计算相似度,如下;
在计算颜色相似度的时候,对每个颜色通道使用25个bin的直方图进行统计,如果有k个通道,则最终得出的颜色向量长度即为25xK。计算过程如上
纹理相似度的计算,计算region的梯度直方图,每个颜色通道分10个bin,如果有K的通道,则最终纹理向量长度为10xK
大小相似度的计算,提出这个相似度主要是为了可以让小的区域优先被合并,而较大的区域尽量不被合并
这个是用来计算覆盖相似度的,BB是可以覆盖两个region最小的矩形框的大小
如果两个区域是相互包含的,那么这个相似度最终计算出来的结果是比较大的,如果两个区域相距较远,那么最终计算结果就会比较小
对上文提到的四种相似度计算法进行加权求和
算法步骤如上。
作者在该部分,主要是要评测了三个方面的内容。
(1) 一、评测了多种strategy下,selective search算法运行的效果
(2) 二、评测了该算法location的质量好坏
(3) 三、评测了将该算法用于目标检测获得的效果
作者为了评估location的好坏,提出了两个指标
ABO的计算也很简单,就是物体c所有覆盖率之和除以物体C真正的面积
Overlap这个指标就是检测两个region相互覆盖的比例,其计算方式很简单,就是region1 并上 region2的面积 除以region1和region2的面积之和
这部分主要是评估了单一策略对算法的影响
论文为了多样化策略,提供了三种方法,第一种就是改变颜色空间,第二种就是改变相似度计算方式,但三种就是改变过分割算法的参数
(1) In this paper we propose three diversification strategies to obtain good quality object hypotheses: varying the colour space, vary- ing the similarity measures, and varying the thresholds to obtain the starting regions
上图即为实验结果。 图片左部是改变相似度计算方法对MABO的影响,可以看出使用texture相似度效果是最差的。 图片右上部指的是颜色空间对MABO算法的影响,其中HSV效果是最好的,RGB效果也还行。 图片的右下部是过分割算法参数对MABO的影响,可以看到50是最好的
这部分主要评估了分割多种策略组合时对算法MABO和算法运行时间的影响
上图为实验结果,可以看出结合的策略越少,窗口数目就越少,运行时间也越少
但是随着结合策略数目的增多,运行时间也越来越长,窗口数目也越来越多了
以下为三种常用的selective-search算法
(i) Single Strategy:HSV颜色空间、四种相似度、k=100 >>
(ii) Fast Startegy:HSV、Lab颜色空间,CTSF、TSF两种相似度计算,k=50、100 >>
(iii) Quality Strategy:HSV、Lab、rgI三种颜色空间;H、I 两种颜色通道;CTSF、TSF、F、S四种计算相似度策略;k=50、100、150、300 >>
(a) As shown in Table 5, our “Fast” and “Quality” selective search methods yield a close to optimal recall of 98% and 99% respec- tively. In terms of MABO, we achieve 0.804 and 0.879 respec- tively. To appreciate what a Best Overlap of 0.879 means, Figure 5 shows for bike, cow, and person an example location which has an overlap score between 0.874 and 0.884. This illustrates that our selective search yields high quality object locations
-上图显示了窗口数量对recall和MABO的影响,可以看出,SSF综合效果是最好的。
上图是select-search算法(第二列)、算法4(第三列)、算法9(第四列)对图像的影响
第一张图片,除了select search算法,其他算法分割的结果都不太好,这是因为selective search算法有fill相似度的加持
In the first image, the other methods have problems keeping the white label of the bottle and the book apart. In our case, one of our strategies ignores colour while the “fill” similarity (Eq. 5) helps grouping the bottle and label together >>
第二张图片是一个在黑夜中拍摄的小轿车,可以看到,select-search算法分割的效果最好,这是因为有colour的加持,因为lab颜色空间对光线不敏感
The second image is an example of a dark image on which our algo- rithm has generally strong results due to using a variety of colour spaces >>
第三张图片是一个猫在睡瞌睡,select-saerch算法效果没有4和9号
our method sometimes generates segments with an irregular border, which is illustrated by the third image of a cat
第四张图片,因为环境因素,三种算法效果除了9,另外2种都比较好
The final image shows a very difficult example, for which only [4] provides an accurate segment >>
上图可以看到,selective—search 运行速度与其他算法相比是快的多。