图像检索5:BoW(词袋模型)+python代码实现

BoW(词袋模型)+python代码实现

 

文章是参考整理得来,大家可以去文章最后的参考文献中去查看原文!

文档主要分以下几部分内容:

      1.SIFT
      2.BOW
      3.VLAD(未包含,请直接在下面的资源链接中获取)

 

实验需要安装 Python 2.7,推荐安装anaconda (python的科学计算发行版,包含很多的常用的库,不需要自己在一一去下载安装,很实用)。

实验过程

 

1.下载数据库:

ukbench数据库链接http://vis.uky.edu/~stewe/ukbench/

数据库含有2550x4张图片,每4张为一组,总共2550组,每张图片的尺寸为640x480。

下载之后,把图片放在 X:\bow\dataset\train  文件夹下面。(X是自己的盘符,下面语句 X 是同样的含义)

 

2.提取特征:

window平台:

CMD命令窗口输入一下命令,进=进入数据库和.py文件所在目录,运行蓝色命令行。

X:

cd bow

dir

python findFeatures.py -t dataset/train/

结果会保存为bof.pkl文件。

说明:

 这一步提取特征很慢,而且需要很强悍的电脑才行。。。。你可以只用数据库中的前500张图片(其他的删掉)来测试玩玩就行了,跑整个数据库的话,普通电脑肯定是跑不动的。。。。如果电脑太渣,直接使用我下面上传的bof.pkl,里面提取的是数据库前50张图片特征,你可以直接进行第三步测试查询,仍然需要用CMD进入到bow文件夹下,再使用下面的查询代码语句。

 

3. 查询:

CMD命令窗口输入


python search.py -i dataset/train/ukbenchxxxxx.jpg

ukbenchxxxxx.jpg是文件名,自己更改为想要查询的图片名就可以了,比如

python search.py -i dataset/train/ukbench00001.jpg

下面是效果图:

图像检索5:BoW(词袋模型)+python代码实现_第1张图片

 

注:最后倒数第2个链接为原作者文章和代码链接,也可以从下面我提供的代码链接来下载使用。

 

 

文档资源获取链接:

BOW文档资源

1.http://download.csdn.net/detail/lilai619/8865417(PPT)

2.http://wenku.baidu.com/view/6950c49d866fb84ae45c8daa(PPT)

 

BOW代码资源

1.http://download.csdn.net/detail/lilai619/8918851(Python代码)

 

VLAD文档资源

1.http://download.csdn.net/detail/lilai619/8918427(VLAD论文)

2.http://download.csdn.net/detail/lilai619/8918445(VLAD原作者的PPT)

 

参考文献:

1.http://blog.csdn.net/abcjennifer/article/details/7639681(SIFT博客)

2.http://blog.csdn.net/zddblog/article/details/7521424(SIFT博客)

3.http://blog.csdn.net/willard_yuan/article/details/46519105(bow+python博客)

4.http://blog.csdn.net/breeze5428/article/details/36441179(VLAD博客)

 

部分文档预览:

 图像检索5:BoW(词袋模型)+python代码实现_第2张图片

图像检索5:BoW(词袋模型)+python代码实现_第3张图片

图像检索5:BoW(词袋模型)+python代码实现_第4张图片

图像检索5:BoW(词袋模型)+python代码实现_第5张图片

 

图像检索5:BoW(词袋模型)+python代码实现_第6张图片

图像检索5:BoW(词袋模型)+python代码实现_第7张图片

 

 

 

你可能感兴趣的:(图像检索)