BoW(Bag-of-Features)特征袋对图像进行分类的理解

特征袋的思想

BoW(Bag-of-Features)[1]算法是由Csurka等在2004年提出并应用于图像处理领域的,该算法广泛应用于目标识别和图像检索。算法主要思想借鉴了文本检索的思想。在检索文本的过程中,文本由一系列的基本单元组成,这个单元通常是单词;同理,一副图像也可以看成是由一系列的基本单元组成,这些图像中的基本单元称为视觉单词(visual words)。
如图1所示
BoW(Bag-of-Features)特征袋对图像进行分类的理解_第1张图片

特征袋分类的思考

对于一个的静态手势,可以看作是由多个视觉单词组成。例如需要对1、 2这两个不同的静态手势进行分类。那么首先需要知道1这个手势是由哪些单词组成,2这个手势由哪些单词组成,而这些单词用的是英文单词还是中文单词,这就需要构建视觉词典。构建完视觉词典后我们就开始对1这个这手势进行查字典,设字典只有26个字母,手势1一查1个O、1个N、一个E。手势2一查1个T、1个W、1个O。好的,现在我有两个类在这了。假如你搞一个手势和1比较相似的手势,我就按字母个数分布与哪个相似这个标准来分类判断。比如搞个手势由1个O、1个N、一个T组成,你看,有两个单词和1完全吻合,一个单词和2完全吻合,那肯定和1比较像。我就判断这个手势是手势1。

[1] Csurka G, Dance C, Fan L, et al. Visual categorization with bags of keypoints[C]//Workshop on statistical learning in computer vision, ECCV. 2004, 1(1-22): 1-2.

你可能感兴趣的:(图像处理,图像处理)