图像识别相关

可以归结为基于内容的图片搜索或图像配准问题,取决于对应用场景的要求;如果要求用户将拍摄内容规范地(不存在旋转偏移等)规定于固定范围,如识别二维码时的取景方框,那么解决该问题可视为基于内容的图片搜索,相对容易些;若不做如此要求,用户可任意角度拍摄任意部分,则归为图像配准问题,或者图像近似拷贝(Near-Duplicate Image Detection);为适应一般的应用场景,你提到的应用归为第二类。

大体思路是:
1、图像特征提取(全局特征或局部特征,特定算法将图片表示为一些向量);
2、特征度量(通过度量特征的相似程度判定图片的相似程序,如欧氏距离、余弦距离、汉明距离等)
3、大规模高维数据检索算法(BTree,LSH,...);

难点:
考虑到用户拍摄的图片相对于样本图片,存在光照、尺度、角度、视角、模糊或噪声、遮挡等的变化,解决该问题所用到的图像特征在理想情况下是要保持这些不变性的;同样考虑到应用的实时性及数据的海量性,快速的牲提取及检索方法也是重点;

你提到的感知哈希算法是一种图像特征,为全局特征,不具备那些不变性,其是二值特征,可用汉明距离度量;总的来讲,用这个图像特征算法是不能解决这个应用问题;
要尝试解决这个问题,大概需要了解如下内容:
1、具备一定不变性的图像特征提取:
A、自动化所樊彬老师的《局部图像特征描述概述》 blog.youtueye.com/work/ 可让你快速了解现有图像局部特征;详细了解SIFT、SURF;
B、开源项目 code.google.com/p/find- 可让你快速了解OpenCV中各图像局部特征算法的使用;
2、特征度量:
从K近邻算法、距离度量谈到KD树、SIFT+BBF算法 这里让你快速了解常用特征度量方法,还用SIFT做检索的例子;
3、大规模高维数据检索算法:
最近邻搜索 最近邻搜索:Nearest Neighbor Search
位置敏感哈希:Locality Sensitive Hashing 位置敏感哈希:Locality Sensitive Hashing

你可能感兴趣的:(图像识别相关)