针对数据集,调用PCV下imagesearch中的文件vocabulary.py,创建一个词汇类,以及在训练图像数据集上训练出一个词汇。train()函数是从文件中读取特征然后将所有特征并在一起,以便进行K-means聚类。根据SIFT特征提取结果,采用k-means算法产生“视觉词典. (visual vocabulary)”。
针对数据库中每张图片的特征集,根据视觉词典进行量化 以及TF-IDF解算。每张图片转化成特征向量。
根据IDF原理,计算每个视觉单词的权
对于输入的检索图像(非数据库中图片),计算SIFT特征,并根据TF-IDF转化成频率直方图/特征向量(步骤1,5)
建立索引,在索引前要建立一个数据库来保存之前生成的视觉单词形成的频率直方图/特征向量,构造检索图像特征到数据库图像的倒排表,快速索引相关候选匹配图像集。这里使用了SQlite作为数据库。
加入图像建立图像数据库,实现方法为在pcv包的imagesearch.py 文件里的add_to_index()方法,此方法主要是获取一幅带有特征描述子的图像,投影到词汇上添加进数据库中。
针对候选匹配图像集与检索图像进行直方图特征匹配。
(1)提取sift特征,用于建立BOW模型,将数据保存到vocabulary.pkl文件中,在图像的数据集中生成vocabulary.pkl文件:
# -*- coding: utf-8 -*-
import pickle
from PCV.imagesearch import vocabulary
from PCV.tools.imtools import get_imlist
from PCV.localdescriptors import sift
#获取图像列表
imlist = get_imlist('D:/CVphoto/05241/')
nbr_images = len(imlist)
#获取特征列表
featlist = [imlist[i][:-3]+'sift' for i in range(nbr_images)]
#提取文件夹下图像的sift特征
for i in range(nbr_images):
sift.process_image(imlist[i], featlist[i])
#生成词汇
voc = vocabulary.Vocabulary('ukbenchtest')
voc.train(featlist,888, 10)
#保存词汇
# saving vocabulary
with open('D:/CVphoto/05241/vocabulary.pkl', 'wb') as f:
pickle.dump(voc, f)
print ('vocabulary is:', voc.name, voc.nbr_words)
(2)将得到的数据模型放入数据库文件testImaAdd.db中:
# -*- coding: utf-8 -*-
import pickle
from PCV.imagesearch import imagesearch
from PCV.localdescriptors import sift
from sqlite3 import dbapi2 as sqlite
from PCV.tools.imtools import get_imlist
#获取图像列表
imlist = get_imlist("D:/CVphoto/05241/")
nbr_images = len(imlist)
#获取特征列表
featlist = [imlist[i][:-3]+'sift' for i in range(nbr_images)]
# load vocabulary
#载入词汇
with open('D:/CVphoto/05241/vocabulary.pkl', 'rb') as f:
voc = pickle.load(f)
#创建索引
indx = imagesearch.Indexer('testImaAdd.db',voc)
indx.create_tables()
# go through all images, project features on vocabulary and insert
#遍历所有的图像,并将它们的特征投影到词汇上
for i in range(nbr_images)[:888]:
locs,descr = sift.read_features_from_file(featlist[i])
indx.add_to_index(imlist[i],descr)
# commit to database
#提交到数据库
indx.db_commit()
con = sqlite.connect('testImaAdd.db')
print (con.execute('select count (filename) from imlist').fetchone())
print (con.execute('select * from imlist').fetchone())
(3)检索图像:
# -*- coding: utf-8 -*-
import pickle
from PCV.localdescriptors import sift
from PCV.imagesearch import imagesearch
from PCV.geometry import homography
from PCV.tools.imtools import get_imlist
# load image list and vocabulary
#载入图像列表
imlist = get_imlist('D:/CVphoto/05242/')
nbr_images = len(imlist)
#载入特征列表
featlist = [imlist[i][:-3]+'sift' for i in range(nbr_images)]
#载入词汇
with open('D:/CVphoto/05242/vocabulary.pkl', 'rb') as f:
voc = pickle.load(f)
src = imagesearch.Searcher('testImaAdd.db',voc)
# index of query image and number of results to return
#查询图像索引和查询返回的图像数
q_ind = 0
nbr_results = 20
# regular query
# 常规查询(按欧式距离对结果排序)
res_reg = [w[1] for w in src.query(imlist[q_ind])[:nbr_results]]
print ('top matches (regular):', res_reg)
# load image features for query image
#载入查询图像特征
q_locs,q_descr = sift.read_features_from_file(featlist[q_ind])
fp = homography.make_homog(q_locs[:,:2].T)
# RANSAC model for homography fitting
#用单应性进行拟合建立RANSAC模型
model = homography.RansacModel()
rank = {}
# load image features for result
#载入候选图像的特征
for ndx in res_reg[1:]:
locs,descr = sift.read_features_from_file(featlist[ndx]) # because 'ndx' is a rowid of the DB that starts at 1
# get matches
matches = sift.match(q_descr,descr)
ind = matches.nonzero()[0]
ind2 = matches[ind]
tp = homography.make_homog(locs[:,:2].T)
# compute homography, count inliers. if not enough matches return empty list
try:
H,inliers = homography.H_from_ransac(fp[:,ind],tp[:,ind2],model,match_theshold=4)
except:
inliers = []
# store inlier count
rank[ndx] = len(inliers)
# sort dictionary to get the most inliers first
sorted_rank = sorted(rank.items(), key=lambda t: t[1], reverse=True)
res_geom = [res_reg[0]]+[s[0] for s in sorted_rank]
print ('top matches (homography):', res_geom)
# 显示查询结果
imagesearch.plot_results(src,res_reg[:8]) #常规查询
imagesearch.plot_results(src,res_geom[:8]) #重排后的结果
(1) 当实验数据集中图片尺寸为 4000 ∗ 3000 4000*3000 4000∗3000时,生成的.sift文件如下:
(3)图像检索结果:
(4)建立RANSAC模型后:
(5)图像展示
问题:
1.图片像素太高会运行很久
2.图片像素太高会导致显示的图片“高糊”
1.运行时出现错误:
ImportError: No module named pysqlite2
原因:缺少pysqlite文件
下载文件地址:
https://www.lfd.uci.edu/~gohlke/pythonlibs/#pyopengl
我的是python2.7的版本,所以下载的是:
2.在显示图像时会报很多超时的错误,虽然不影响结果,但是也没有找到解决办法。
3.如果对多个数据集进行了检索,再次运行代码产生的数据库文件不会覆盖之前的数据库,会出现数据库已经存在的情况,这时如果直接对数据库文件i进行删除会比较困难,可以重命名建立新的数据库文件。