引言0.3 人脸图像的质量

今天我们探讨关于图像质量的概念。我们将根据即将颁布的《安全防范系统 人脸识别应用技术规范 第2部分:人脸图像数据技术要求》来探讨有关的内容。

谈到图像质量,我们需要考虑三个层面的内容,分别是图像的获取、图像的内容描述和图像的存储交换格式。鉴于我们将着眼点放在人脸识别,所以我们只讨论人脸图像;如前所述,我们还将人脸图像局限在静态的平面图像(由于近红外和可见光的图像从获取、内容描述和存储交换格式上并没有二致,因此这里不做区分)。

人脸图像的获取,市面上已经有了很多种设备和软件系统。比如摄像机、数码相机、扫描仪以及输出为图像的各种信道等,都可以认为是图像的获取设备。我们在前面谈到,图像的获取本身就是一个将人脸本身信息的一次映射过程,很显然,这种映射是非全通的,也就是说,存在着这样那样的失真,或称为信息损失。如果我们把图像的获取过程看成为一个通信系统,其输入是完整的全息人脸信息,其输出则是一张数字/模拟图像,那么获取设备本身就是一个信道。这个信道有其容量和信噪比(关于信道容量和信噪比的概念应该在《通信系统》的相关课程中学习)。理想状态下的图像获取设备应该是一个全通系统,但是由于信道容量和信噪比的存在,这个全通系统实际上又可以理解为一个滤波器(关于滤波器的概念请在《数字信号处理》的相关课程中学习)。那么,我们为了获取一张适合进行人脸识别的人脸图像,我们就要考虑这个滤波器是否保留了足够的让我们进行识别的人脸特征信息。很显然,我们获取的人脸图像中保存的人脸特征信息越丰富,我们理论上可以获得的人脸识别效果就越好。因此,在分辨率相同的情况下,全息图像的信息量大于三维扫描仪获得的3D图像大于二维平面图像;在基本成像原理相同的情况下,高分辨率图像的信息量大于低分辨率图像。

我们继续考虑人脸图像所需要承载的信息,经验表明,从正面识别一个人比从非正面识别一个人会更加容易,所以在进行图像获取的时候,我们需要考虑人脸的各种角度。另外,人的表情、姿态和饰物等因素以及获取图像时的光照条件都会影响我们识别的效果。因此,我们会要求图像的获取对象在上述因素中有着一个相对较好的表现。

我们对图像获取的认识,将直接引申到对图像内容的描述。这里只探讨静止的二维平面数字图像。当我们拿到一副图像的时候,我们会关注数字图像的存储格式(jpg还是bmp)尺寸(图像的长和宽),分辨率(单位距离的像素点数)等。这些是图像质量的第一部分内容。然后我们需要关注图像的里面的人。一副图像中可能会存在多个人脸,那么我们对质量的描述只针对某一个我们所关注的人脸,而忽视其他的人脸。人脸在图像中所处的位置,是我们截取目标人的基本区域。惯例,我们会根据图像中人的眼睛位置来确定人脸区域。当然,不排除还有其他的确定区域的方法。但无论如何,我们需要确定人脸的从头顶到下颌底部、从左耳边缘到右耳边缘的关注区域,这个区域我们称之为脸部区域。

确定图像脸部区域之后,我们开始关注图像中的人的特征,其中包括性别、肤色、眼睛颜色、特殊特征等代表这个人的个性特征。这些特征是可以作为我们识别的信息的。而诸如图像的色彩空间、采集设备类型、拍摄时间、人脸的表情、姿态、对象的年龄等特征则代表这张图像在获取时的一些信息,并不能作为识别的信息。通过对识别信息和非识别信息的描述,我们对用于识别的图像提出了要求。如,用于作为图像数据库的人脸图像中两眼距离不低于60像素。如,表情要求自然,两眼自然张开。如,用于描述姿态的偏转角不超过±100俯仰角不超过±100倾斜角不超过±100。如,佩戴饰物不得遮挡眼睛和脸部区域。如,眼睛的瞳孔和虹膜可见。禁止戴墨镜、眼镜框不得遮挡眼睛,镜片不反光。如,脸部区域完整、轮廓清晰、人脸长宽比例不失真,光线均匀且无阴影

3

为了将前述的描述信息进行表达,我们设计了一个存储人脸图像的数据存储交换格式。详细内容能够参见《安全防范系统 人脸识别应用技术规范 第2部分:人脸图像数据技术要求》,图3给出了这个数据存储交换格式的每部分内容。

你可能感兴趣的:(人脸识别)