人脸识别---排序测度特征(Ordinal Measures)

Abstract—本文主要讲解下排序测度在人脸识别中特征提取的过程。
      下面来看一张图(图1)来描述排序测度特征.


图1 虹膜排序测度的提取,最后用了hamming距离来比对数据库的模板。这是提取虹膜特征的一个方法。

      从图1可以看出,主流的提取特征的方法都是使用水平朝向的、中等尺度的、单峰形状为低通滤波器的算子来提取近邻图像区域之间的排序测度特征。但是这些方法忽略了虹膜图像中非近邻的排序测
度特征,而非近邻的OM 比相邻的OM 具有更好的分类能力和鲁棒性。基于非邻域比对编码的图像表达方法最先是由Balas 和Sinha 提出[1]。非邻域比对编码也非常适合于人脸。
      为了提取多个图像区域之间的排序测度特征,可以用“多极子滤波器”(Dissociated Multi-Pole,DMP),它的定义如下:

f(x,y)=mi=1fi(x+xi,y+yi)m+ni=m+1fi(x+xi,y+yi)

      式中 mi=1fi(x+xi,y+yi)(i=1,2,...,m+n) 都是低通滤波器,例如 Guassian 滤波器、
盒状滤波器等,每个 mi=1fi(x+xi,y+yi) 称为一个“极”,(x_i,y_i) 表明这个低通滤波器在空间的位置。 f(x,y) 的系数和为零,确保 OM 完全随机,具有相等的概率
为0或1。例如基于Gaussian 函数的多极子滤波器的定义如下:

DMP=N+i=1Ci+2πδ+iexp[(Xu+i)22δ+2i]Nj=1Cj2πδjexp[(Xuj)22δ2j]

      式中 μ+i δ+i 分别表示正峰 Gaussian 滤波器的中值和标准差, N+ 代表正峰个数, μj δj 分别表示负峰Gaussian 滤波器的中值和标准差, N 代表负峰个数, Cj Cj 分别代表滤波器中正峰和负峰的个数。为了让每个排序测度特征的信息熵极大化,需要满足:

N+i=1Ci+=Nj=1Cj

      和偶极子滤波器不同的是,多极子滤波器(见图2)可能由更多的峰组成,每个峰的形状可能不同,相互位置也可以根据识别的需求而定。


图2 各种类型的多极子滤波器

下面介绍下利用多极子滤波器提取人脸的OM特征的过程
      提取OM之前先提取了Gabor特征,Gabor特征如上节所讲。图3是原图和某一尺度某一方向的Gabor特征图。


图3 原图和Gabor特征图

      图4是多极子滤波器二维图

人脸识别---排序测度特征(Ordinal Measures)_第1张图片
图4 多极子滤波器二维图

      这8个极子对Gabor特征图进行滤波可以得到图5


图5 Gabor-OM特征

对于每一个极子,40个Gabor滤波器滤波结果如图6所示。


图6 每一个极子滤波40个Gabor得到的特征图。

在y方向对分别取块权重,Gabor一共有8个方向,从第一个方向到最后的方向权重分别为128,64,32,16,8,4,2,1相加得到最后的Gabor-OM特征。
得到特征图进行分块直方图统计,每一小块按照64bins进行统计。然后把8极子40个Gabor滤波器的直方图串联起来,假设一共有64小块。就有64个直方图。

人脸识别---排序测度特征(Ordinal Measures)_第2张图片
图7 人脸图像Gabor-OM直方图特征

从特征的提取来看,Gabor-OM特征提取速度慢。通过与高维LBP的对比实验,Gabor-OM特征比高维LBP特性识别效果略差。
[1] B. Balas and P. Sinha, “Dissociated Dipoles: Image Representation via Non-local
Comparisons”, CBCL Paper #229/AI Memo #2003-018, Massachusetts Institute of
Technology, Cambridge, MA, 2003.

人脸识别---排序测度特征(Ordinal Measures)_第3张图片

你可能感兴趣的:(脸部识别)