学习图像处理与模式识别一点体会

最近一直研究图像处理与模式识别的问题,通过同高手的交流,结合牛人的指点,现把自己的感受和体会跟大家分享,尤其是目标检测与识别这一块,如有不对的地方,希望高手指点一下!

 

如果有读关于目标检测和识别西文文献比较多的朋友,一定能够发现大多数的文献检测和识别的目标都是如下两类:人脸、汽车。但是对于类内差异较大的物体类,研究其检测与识别的文献并不多见。由此,引发了我的几点思考,和诸位共享。
首先:人脸是一类类内差异很小的目标,什么叫类内差异呢?我们可以这样理解:就是说它的configuration是不变的。不管是什么人种,都是两眼一鼻一嘴构成,因此对他的检测,采用模板匹配、Hmm、 基于Fragment的方法都可以达到较好的效果。然而,我们会发现,对人脸的识别研究的方法就寥寥可数了。人脸对于识别来说,他的类内差异就是相当大。目前在工程上最为有效的方法就是模板匹配,图像中的人脸和人脸库中的图像一一匹配,相似度最大的即为该人。同样,汽车也是一类类内差异不大的物体,它的显著且不变性特征就是车轮。车身可能万变,但车轮都如出一辙。因此,在图像中若能较好的检测出车轮,也就能检测到车辆了。


其次:为什么研究其他类目标的文献并不多见呢?难度大。难度大的原因就是要找出恒一不变的特征很难。比如:刚性物体——水杯。水杯的种类万千,要找出他们的共性不容易。柔性物体之类的则更加了。比如:检测树。


最后:给出我的一点研究启发:

          第一,在研究课题之前,一定要选择好研究的图像目标。其实也可以是大家都在研究的一类物体,并不需要标新立异,当然如果你有针对这类目标的好的检测方法,那也是惟愿如此。

         第二,并不一定要求你的方法放之四海皆准,只需要对某一类目标有效果,你同样可以发高水平的文章。

         第三,多尝试从数学的角度去理解图像的机理,从美术家的角度去理解图像的构造。

 

你可能感兴趣的:(图像处理,模式识别)