在目标检测时,为了定位到目标的具体位置,通常会把图像分成许多子块,然后把子块作为输入,送到目标识别的模型中。selective search就是一种选择子块的启发式方法。
输入一张图片,首先通过图像分割的方法获得很多小的区域,然后对这些小的区域不断进行合并,一直到无法合并为止。此时这些原始的小区域和合并得到的区域的就是我们得到的bounding box.
步骤:
算法分为如下几个大步:
**1:**首先预操作生成原始的区域集R(利用felzenszwalb算法)
2. 计算区域集R里每个相邻区域的相似度S={s1,s2,…}
3. 找出相似度最高的两个区域,将其合并为新集,添加进R
4. 从S中移除所有与第3步中有关的子集
5. 计算新集与所有子集的相似度
6.跳至第三步,不断循环,合并,直至S为空(到不能再合并时为止)
源码:
import skimage.data
import selectivesearch
img = skimage.data.astronaut()
img_lbl, regions = selectivesearch.selective_search(img, scale=500, sigma=0.9, min_size=10)
regions[:10]
=>
[{‘labels’: [0.0], ‘rect’: (0, 0, 15, 24), ‘size’: 260},
{‘labels’: [1.0], ‘rect’: (13, 0, 1, 12), ‘size’: 23},
{‘labels’: [2.0], ‘rect’: (0, 15, 15, 11), ‘size’: 30},
{‘labels’: [3.0], ‘rect’: (15, 14, 0, 0), ‘size’: 1},
{‘labels’: [4.0], ‘rect’: (0, 0, 61, 153), ‘size’: 4927},
{‘labels’: [5.0], ‘rect’: (0, 12, 61, 142), ‘size’: 177},
{‘labels’: [6.0], ‘rect’: (7, 54, 6, 17), ‘size’: 8},
{‘labels’: [7.0], ‘rect’: (28, 50, 18, 32), ‘size’: 22},
{‘labels’: [8.0], ‘rect’: (2, 99, 7, 24), ‘size’: 24},
{‘labels’: [9.0], ‘rect’: (14, 118, 79, 117), ‘size’: 4008}]