关于BOW详细介绍

这篇文章属于小笔记类型奥~~

1 特征提取

使用SIFT或者SURF生成图像特征的描述子

2 构建词典(Vocabulary)

通过上一步所有特征的提取,我们需要得到所有训练图片的所有描述子,对所有的这些描述子,使用聚类的方法得到n个聚类中心(可以理解为眼睛、鼻子、草地、人这样的类别,当然只是用于理解),这样,每个描述子都会有他所属的类别了(也就是聚类中心类别)。这n个类别组成我们的词典。


关于BOW详细介绍_第1张图片
K-means聚类

3 特征直方图构成

我们上面得到的是我们要构建的直方图的横坐标,就是他的类别。纵坐标表示的是该类出现的频次。直方图横坐标的顺序可以按照字典中单词的顺序排列,一旦确定下来了,就不再改变了。

4 表示图片

输入一张新的图片的时候,我们计算新的描述子与每个聚类中心(词典里面包含的类别)的相似性,得到新的这张图片的所有描述子的所属类别。然后,根据这些描述子的类别出现的频次,构建特征直方图。

关于BOW详细介绍_第2张图片
一张人脸的特征直方图

为了简化表示,我们假设聚类中心只有四个,实际上数量多会比较好,这张人脸的bow描述子就是【12,105,85,12】串联表示。

你可能感兴趣的:(关于BOW详细介绍)