Context Based Face Spoofing Detection Using Active Near-Infrared Images(论文翻译)活体检测相关

 摘要 - 在本文中,借助可控的有源近红外(NIR)光,我们构建了近红外差分(NIRD)图像。基于反射模型,NIRD图像被认为包含具有和不具有活动NIR光的图像之间的光照差异。基于NIRD图像的两个主要特征被用于进行欺骗检测。首先,在大多数情况下,在人脸周围存在明显的欺骗性媒体,它们以与脸部区域几乎相同的方式反射入射光。我们分析面部和非面部区域之间的像素一致性,并使用上下文线索来区分欺骗图像。然后,仅利用从面部区域提取的照明特征来检测故意裁剪的媒体的欺骗攻击。合并这两个功能,我们提出了一个面部欺骗检测系统。在对具有不同欺骗介质的自收集数据集的几个实验中,我们证明了所提出方法的优异结果和鲁棒性。


I. INTRODUCTION

  人脸识别系统广泛用于各种应用中。 其中一个主要问题是现有系统容易受到面部欺骗攻击。 为了防御由照片,视频或3D面具进行的欺骗攻击,面部欺骗检测近年来受到越来越多的关注。 已经提出了许多反欺骗方法。
  大多数面部反欺骗技术利用可见光(VIS)图像,并且根据所采用的特征,它们可大致分为三大类。第一类提取纹理信息。已经提出了许多方法来分析反射率[1],[2],[3],功率谱[4],图像条带效应[5],多尺度特征[6],[7],模糊[2], [7]和其他纹理线索[8],[9]。它们可以获得令人满意的效果,但高质量的照片可能会欺骗这种功能。第二类使用运动信息。基于运动的方法主要处理人体生理反应或人体反应运动,如眨眼[5],[10],人体运动[5]和头部旋转[11]。它们使用跨帧的相对功能,但容易受到重放攻击。第三类方法利用其他图像线索,如3D深度,多模态知识[12]和几个特征的混合模型[5],[11],[13]。
  然而,大多数现有方法主要关注VIS光谱的面部纹理和运动分析,其对光照的变化敏感。虽然近红外(NIR)光谱的人脸识别[14],[15]已经讨论过很多,而且有几个数据集[15]关注VIS和NIR图像,但只有少数面部欺骗检测方法涉及红外图片。 Kim等人。[1]利用VIR和VIS照明之间的反射率差异并分离蒙面假面。Sun等人。 [12]分析了热IR(TIR)和VIS光谱面之间的相关性,以提高活体检测能力。众所周知,红外成分也存在于一些光源中,如阳光;有时候,当捕获近红外图像时,人们必须努力在受控照明下尽量减少环境照明[14],这是不方便的。即使对于室内应用,各种光线条件也可以使用不同的欺骗介质彻底改变NIR图像的外观。
  此外,上下文信息在以前的作品中只引起了一些关注,潘等人。 [10]比较参考场景图像和输入场景图像之间的差异,并检查背景场景是否突然改变。然而,有时难以获得参考场景图像,并且该方法仅适用于固定相机。严等人。 [5]表明,面部和背景的运动对假面部照片具有高度一致性,而对于真实面部照片则低。 Anjos等。 [13]使用运动方向测量面部和背景之间的运动相关性。 Yan和Anjos都只测量脸部和背景之间的整体运动,这些方法可能会被故意录制的视频所欺骗。此外,基于运动的方法可能花费相对长的时间来捕获输入图像序列。 Komulainen等。 [8]检测上身和显示介质的存在以进行欺骗检测。该方法是有效的,但是它不能用于边界在图像之外的大型欺骗介质,或者描述符无法检测到的具有奇怪大小的欺骗介质。
 在本文中,我们提出了一种使用有源近红外光的新型欺骗检测解决方案。我们有三个主要贡献如下:

 (1)有源近红外灯用于从正面照射面部。使用NIR代替VIS图像可以避免诸如相机饱和之类的现象,其克服了不受控制的照明变化并且提供用于反射分析的合适图像。通过打开和关闭有源近红外光,我们构建了近红外差分(NIRD)图像,以表示具有活动近红外照明的人脸图像。
 (2)鉴于大多数欺骗攻击需要显示媒体,并且一些非面部区域由欺骗媒体显示,我们在NIRD图像的基础上利用来自面部和非面部区域的像素强度的一致性。与基于背景一致性的其他方法相比,我们提出的方法不依赖于运动分析或参考场景图像;而且,人类不需要遵循其他指示。
Context Based Face Spoofing Detection Using Active Near-Infrared Images(论文翻译)活体检测相关_第1张图片
图1.基于NIRD图像的建议的面部欺骗检测算法。
 (3)对于故意裁剪的媒体,我们采用光照纹理分析来区分这种欺骗面。附加照明功能为我们的欺骗检测系统增添了强大功能。


II. SYSTEM OVERVIEW

  我们使用分辨率为1280×720的近红外光谱相机来拍摄图像。在相机上,我们安装了一个中心波长为850 nm的有源近红外发光二极管(LED),以提供正面照明。 LED光源的功率有限,但在室内使用时,相机面距离为30至80厘米时,它足够强大,可提供清晰的近红外人像图像。我们提出的方法的一般框架如图1所示。
  对于输入NIR图像,首先,我们使用来自OpenCV库的Viola-Jones面部检测器来定位面部区域。在大多数情况下,原始近红外图像通常太暗,而带有附加光的近红外图像太亮。异常情况可能会损害现有人脸检测器的准确性,因此我们采用简化的自动曝光校正[16]对输入图像进行预处理,其中我们对暗图像采用伽马压缩,对明亮图像采用伽马扩展。在检测到面部区域之后,根据眼睛位置对图像进行归一化。
  采用第III节中提出的方法,我们可以从标准化的图像中获得NIRD图像。利用面部检测器定义的面部区域和适当的比例尺寸,我们采用椭圆形掩模来获得面部区域。在椭圆形掩模之外选择非面部区域。
  接下来,我们使用来自NIRD图像的上下文线索和照明纹理。 对于前者,我们尝试利用面部和非面部区域之间的像素强度相关性并提出一致性测量。该特征用于检测非面部区域是否与面部区域共享相同的照明条件。 对于后者,为了确保我们提出的方法足够强大以检测中等裁剪或其他欺骗攻击,我们仅分析来自NIRD图像中的面部区域的纹理信息。
  最后,我们构建了基于这两个特征的融合描述符,并在融合模型上评估支持向量机(SVM)算法,以做出最终决策。


III. MODELING OF NIRD IMAGES

A.反射分析

 在我们的例子中,我们在实验中对光源做了几个假设:

 (a)有一个普通荧光灯作为人类附近的主要光源,表示为I1
 (b)人体前方有一个活跃的近红外光,光线可能会长距离急剧衰减,表示为I2
 (c)来自其他远程光源的照明组件,包括计算机屏幕和自然光,表示为环境照明1a

  根据朗伯(Lambertian)反射模型[17],光反射率可以分解为漫反射和镜面反射。换句话说,面部图像I的位置x处的强度在理论上被描述为 I ( x ) = I a + ∑ i f i ( d ) ∗ ( I i , d ( x ) + I i , s ( x ) ) I(x)=I_a +\sum_if_i(d)*(I_{i,d}(x)+I_{i,s}(x)) I(x)=Ia+ifi(d)(Ii,d(x)+Ii,s(x)),其中漫射第i个光的镜面反射分别表示为 I i , d I_{i,d} Ii,d I i , s I_{i,s} Ii,s f i ( d ) f_i(d) fi(d)是距离d处的光衰减函数。根据假设,近红外光 f 2 ( d ) f_2(d) f2(d)的衰减函数迅速下降。
  我们依次捕获两种图像:没有NIR照明的原始NIR图像(表示为NIR图像)和具有活动NIR照明的图像(表示为NIRL图像)。对于前者,图像强度由 I a I_a Ia, I 1 , d I_{1,d} I1,d I 1 , s I_{1,s} I1,s组成,对于后者,它们还具有 I 2 , d I_{2,d} I2,d I 2 , s I_{2,s} I2,s分量,如公式(1)所示:
   I = I a + f ( d 1 ) ∗ ( I 1 , d + I 1 , s ) I=I_a+f(d_1)*(I_{1,d}+I_{1,s}) I=Ia+f(d1)(I1,d+I1,s),
   I ( L ) = I a + f ( d 1 ) ⋅ ( I 1 , d + I 1 , s ) + f ( d 2 ) ⋅ ( I 2 , d + I 2 , s ) I(L) = Ia + f(d1) · (I1,d + I1,s) + f(d2) · (I2,d + I2,s) I(L)=Ia+f(d1)(I1,d+I1,s)+f(d2)(I2,d+I2,s) (1)
  在准备实验数据时,我们试图缩短打开和关闭活动NIR灯之间的时间。可以假设人头部姿势在该过程中没有太大变化,这使得荧光灯 I 1 I_1 I1的漫反射和镜面反射保持几乎相同。未改变的头部姿势也导致光衰减值不变。此外,环境照明 I a I_a Ia与有源NIR光无关并且可以被视为常数。
  通过利用第II部分中的方法生成的归一化面部图像,我们可以确保尽可能精确的像素对应。 另一方面,近红外照明也使我们的方法更具说服力,将在第III-B节详细检查。
  通过从公式(1)中的 I ( L ) I^{(L)} I(L)减去 I I I,可以适当地计算有源NIR光的影响。 因此,我们可以通过以下方式计算近红外差分(NIRD)图像:
   I ( N I R D ) = I ( L ) − I = f ( d 2 ) ∗ ( I 2 , d + I 2 , s ) I^{(NIRD)}=I^{(L)}−I=f(d_2)*(I_{2,d}+I_{2,s}) I(NIRD)=I(L)I=f(d2)(I2,d+I2,s) (2)
Context Based Face Spoofing Detection Using Active Near-Infrared Images(论文翻译)活体检测相关_第2张图片
图2.该图说明了图像和直方图。 第1,第3,第5,第7列分别显示NIRL,NIRD,VISL,VISD图像,偶数列显示相应的直方图。 前两行是真面,最后两行是欺骗面。

B.主动近红外与VIS图像

  在[14]中已经有报道称,即使在左侧或右侧有可见光灯,使用近红外成像系统也可以大大减少可见环境照明造成的影响。 NIR光谱可以使图像成为良好的照明条件,其中图像具有合适的像素强度,即良好的对比度和不饱和。在本文中,我们使用来自正面方向的有源NIR光来克服可能的不受控制的光照变化,因为不饱和图像像素对于我们的算法和NIRD图像是至关重要的,这将在后面示出。
  根据我们的假设,光源 I 1 I_1 I1是典型的“冷白”荧光灯,其中含有大量可见光线成分,只有少量近红外成分[18]。对于VIS图像,所有像素的强度可以高于NIR图像中的强度。在许多情况下,当打开附加光(我们假设中的 I 2 I_2 I2)时,VIS像素强度通常是饱和的。换句话说,输入强度信号强度超过相机传感器的极限,这会导致相机饱和和晕染[19]。因此,对于VIS图像,公式(2)可能不再正确,并且由 I 2 I_2 I2产生的光照差异无法正确分离。另一方面,假设 I 1 I_1 I1的红外分量相对较低,则NIR图像更可能是不饱和的并且具有良好的像素对比度。
  为了验证这些分析,除了NIR和NIRL图像外,我们捕获可见光图像(表示为VIS图像)和带有附加光的VIS图像(表示为VISL图像)。两种光谱的光照图像和差分图像,以及相应的直方图如图2所示。
可以清楚地注意到,一些像素强度在VISL图像中接近最大值; 相反,NIRL图像通常是不饱和的。此外,VIS差分图像中的大多数像素强度明显低于NIR差分图像中的像素强度。 这种现象之前只是验证了我们的分析。NIR图像对于我们提出的算法是必不可少的。 使用VIS光谱图像的详细结果显示在V-C部分。
Context Based Face Spoofing Detection Using Active Near-Infrared Images(论文翻译)活体检测相关_第3张图片
图3.面部和非面部区域的示例及其相应的直方图。 前两行显示真面目,最后两行显示欺骗面。 第二列和第四列是第一列和第三列的直方图。


IV. FUSION FEATURE

A.背景线索

  由于欺骗攻击需要显示介质,因此在欺骗媒体中实际显示的面部周围存在一些“背景”像素。它们不属于真实背景,与脸部区域相比,我们将它们称为欺骗图像中的非脸部区域。在真实图像中,非面像素属于背景。
  对于背景中的像素,距离比面部区域的距离长得多;光衰减函数可能会迅速减少,因此我们认为像素强度远小于面部区域的像素强度。换句话说,由于有效的NIR光,背景中的像素不会遭受很大的变化。在欺骗图像中,一些非面部区域具有与面部区域类似的反射外观,尤其是当它们彼此靠近时。但在真实图像中,非面部像素与面部区域中的像素完全不同。
最重要的是,我们利用面部和非面部区域之间不同的像素强度分布。不同区域中像素之间的相关性非常强大,即使背景场景与照片或照片组合放置在靠近相机的位置,像素强度属性的一致性仍然保持在欺骗图像中。我们使用熵一致性来获取欺骗线索。如果面部和非面部的像素具有高一致性,我们认为输入面是假的;否则,如果一致性较低,可能表面周围没有欺骗介质,表明输入面可能是真实的。
  计算面部和非面部区域的直方图。对于像素数可能不相等,将两个直方图归一化以确保每个直方图的L1标准化等于1.它们如图3所示 ,分别表示为Hface和Hnonface。图3表明真实面的形状不是理想的椭圆,我们使用相对较大的椭圆掩模。因此,我们的椭圆面区域可能包含一些属于非面部区域的像素。它不是我们一致性计算的好信号。为了解决这个问题,我们通过从Hface中减去Hnonface来构造第三个直方图Hdif:
   H d i f f ( i ) = m a x ( H f a c e ( i ) − H n o n f a c e ( i ) , 0 ) H_{diff}(i)=max(H_{face}(i)−H_{nonface}(i),0) Hdiff(i)=max(Hface(i)Hnonface(i),0) (3)
  其中i是所有强度值的元素,H(i)是强度i的直方图值。
  现在我们定义一个三维上下文一致性特征作为三个直方图的三个熵的串联: H d i f f H_{diff} Hdiff H f a c e H_{face} Hface H n o n f a c e H_{nonface} Hnonface
  直方图H的熵被定义为熵 ( H ) = ∑ ( H ( i ) . ∗ l o g H ( i ) ) (H)=\sum(H(i).* logH(i)) (H)=(H(i).logH(i)),并且零值的熵被定义为0。
  有时,大衣领,长发,帽子等装饰可能会严重影响非面部区域的直方图。它们具有与真实面部大致相同的距离,并且它们可以像欺骗介质剂量一样反射活动光,这可能使我们提出的方法混淆。幸运的是,这些面部周围的干扰并不像欺骗媒体那样均匀,并且它通常不会在所有方向上围绕人脸。
  为了解决这样的问题,我们使用基于部件的模型并沿水平和垂直方向平分分割整个图像。因此,图像被分解为四个区域。然后,我们在每个部分中单独提取上下文一致性功能。分解的一个主要缺点是整个图像携带的一些辨别信息可能在该过程中被分散和丢失。因此,我们还将整个人脸图像作为一个重要部分,并从中获得相同的特征。
这样,总共有五个部分,包括四个分割区域和一个整体图像,其中单独提取上下文一致性特征。最后,将这些特征连接在一起作为输入NIRD面部图像的上下文线索。
B.照明纹理
  提议的上下文线索是健壮的,其中隐藏欺骗媒体并且不能直接检测边界。 但是如果故意裁剪介质并且只剩下面部区域,或者在所有方向上都存在真面孔,那么上下文线索可能无法按预期工作。 因此,需要另一个功能来辅助,这应该仅从面部区域提取以处理麻烦的情况。 本节将介绍照明纹理。
  假设面部和相机之间的距离相对长于真实面部和翘曲图像的深度,则面部区域中所有像素的衰减值保持大致相同或者它们缓慢且平滑地变化。 衰减值被认为是一个常数,公式(2)可以简化为:
I ( N I R D ) ( x ) = k d ∗ ω d ( x ) ∗ E + k s ∗ ω s ( x ) ∗ E I^{(NIRD)}(x) = k_d*ω_d(x)*E+k_s*ω_s(x)*E I(NIRD)(x)=kdωd(x)E+ksωs(x)E (4)
  在式(4)中,E是光强度,并且认为在所有像素处都是恒定的。 ω d ( x ) ω_d(x) ωd(x) ω s ( x ) ωs(x) ωs(x)是几何因子。 k d k_d kd k s k_s ks分别是漫反射和镜面反射分量的加权因子,它们包含常数参数,如衰减值和材料参数。材料参数与材料,像素位置和入射光的角度有关,但对于不透明材料和正面照明,它们通常也被重新定义为常数[3],[17]。基于NIRD图像,我们简要分析了真实面部和本文研究的三种欺骗介质的反射率差异:

 1)真面目:通常,镜面高光位于几个特定位置周围,如鼻尖,脸颊,前额和眼镜。几何因素非常复杂,因此漫反射因地区而异,并且NIRD图像上可能存在阴影。
 2)普通A4纸上打印的照片:镜面反射很弱,镜面高光很少。据报道,印刷过程可能会降低图像对比度[19]。即使他们是
翘曲,表面法线是平滑的,因此它们可以获得逐渐变化的漫反射。
 3)印在树脂涂层(RC)纸上的照片:它们具有光滑和高度抛光的表面,并且可能存在更多的镜面反射分量。此外,RC纸上的光泽油墨层使得表面在NIR光谱中散射很多并增强漫反射。
 4)平板电脑屏幕上显示的照片:屏幕无法弯曲且没有几何失真,因此所有像素的表面法线都相似。镜面反射通常因屏幕而出现。它本身会发光,漫反射组件可能会受到影响。

  如上所述,真实和欺骗面之间的漫反射和镜面反射分量存在差异。镜面反射可以仅在小区域中贡献大的像素强度并且提高整个图像的偏差,而漫反射可以大规模地增大像素强度并且减少一些边缘信息。因此,差异将导致NIRD面部区域中的各种像素强度显着,并且与真实的相比,欺骗图像可能显示出非常不同的强度分布。
  已经探索了许多统计数据[2]以进行欺骗检测,并且它们已经显示出优异的结果。在本文中,在收集面部区域中的像素之后,使用三个统计数字来表示强度分布:i)面部区域像素的平均强度μ,ii)标准偏差σ,以及iii)偏斜度γ。这三个图包含照明纹理的统计分布,形成面部区域的三维纹理线索。


V. EXPERIMENT

A.数据集概述

  由于所提方法的特点,很难将其应用于当前流行的数据集。在本文中,我们在不同的欺骗媒体上使用了几个自我收集的反欺骗数据集来验证我们提出的方法。 NIR图像和NIRL图像是在关闭和打开有源NIR灯的情况下依次拍摄的。对于真面目,数据集中的所有人都可以自由地改变他们的头部姿势。如果一些受试者戴眼镜,我们会将他们的照片与眼镜一起用作攻击图像。
  我们使用三种方法进行欺骗攻击:在树脂涂层(RC)纸上打印的高质量彩色照片,在A4纸上打印的照片和在平板电脑屏幕上显示的照片。在所有印刷的欺骗攻击中,允许照片自由变形。为了证明我们提出的算法中有源近红外图像的好处,除了NIR和NIRL图像,我们还使用相同的欺骗媒体捕获VIS和VISL图像。
Context Based Face Spoofing Detection Using Active Near-Infrared Images(论文翻译)活体检测相关_第4张图片
图4. NIRD图像数据集中的一些样本。 从上到下的图像分别是真面孔,A4纸张照片,RC纸张照片和平板电脑屏幕照片。 第一和第三列是NIR图像,第二和第四列是NIRL图像。
表一
我们的数据库中的图像对数

真实人脸 A4打印人脸 人脸照片 屏幕中人脸
NIR 1099 1092 375 796
VIS 1106 1140 426 791

  有30个受试者参与,共有13650个图像(6825对),总共检测到面部区域,如表I所示。面部无法定位的图像被丢弃,并且NIR图像和RC欺骗的情况经常出现图片。由于空间限制,未示出正常的可见光图像,并且图4中示出了近红外光谱的一些灰度图像。

B.基线方法

  据我们所知,没有关于处理差异图像以进行欺骗检测的算法。我们对收集的图像进行一些基于纹理的方法作为比较。
  根据最近的研究[20],虽然基于LBP的方法相对较长时间被提出,但它们在面部欺骗检测方面仍然是强大的局部纹理描述符,如CoA-LBP,并且大多数都具有公共访问代码[20]。这使得比较更容易,更有说服力。此外,多尺度局部二值模式(MsLBP)和相关方法在以前的工作中备受关注[6] [7],我们结合MsLBP [6]和多色空间[9]作为一种基线方法,在我们的数据集中比单独使用CoA-LBP更好。此外,李等人。 [4]还提出了一种基于熵使用功率谱的方法,并选择它作为另一种基线方法。

C.结果和分析

  在本节中,应用十五倍交叉验证SVM分类器,其中来自二十六个受试者的图像作为训练集,来自其他四个受试者的图像作为测试集,用于评估所提出的方法和基线方法。平均半错误率(HTER)和平均等错误率(EER)用于评估性能。
  在三种欺骗媒体(A4,RC和平板电脑欺骗)上检查每种方法,并且我们还在所有三种媒体的图像上测试每种方法。 NIR光谱的数值结果如表II所示。如前所述,为了验证使用NIR图像的结构,对VIS图像进行相同的实验,结果如表III所示。
表二
在NIR DATASET上比较EER(%)和HTER(%)的比较

A4打印人脸ERR A4打印人脸HTER 人脸照片ERR 人脸照片HTER 屏幕中人脸ERR 屏幕中人脸HTER 总计ERR 总计HTER
Proposed 1.08 3.31 0.25 5.49 0.11 0.25 1.20 2.96
MsLBP[6] 1.36 3.72 0.33 4.84 0.29 0.95 3.04 6.87
Entropy[4] 6.13 11.93 4.81 8.92 2.62 5.96 4.76 10.23

在表II中,我们注意到当欺骗所有欺骗媒体的图像混合在一起时,各种纹理特征可能使最终分类器混淆,导致相对差的性能。它发生在两种基线方法中,但我们提出的方法受此影响较小。
一个原因可能是我们在收集图像时采用了几种隐藏显示媒体和愚弄[8]中提到的系统的方法,例如将背景场景组合成欺骗性照片并使照片靠近传感器。
表三
在VIS DATASET上比较EER(%)和HTER(%)的比较

A4打印人脸ERR A4打印人脸HTER 人脸照片ERR 人脸照片HTER 屏幕中人脸ERR 屏幕中人脸HTER 总计ERR 总计HTER
Proposed 4.81 13.23 0.29 17.70 0.08 0.52 4.01 10.07
MsLBP[6] 0.82 3.59 6.16 9.87 0.10 0.61 1.99 5.04
Entropy[4] 6.96 18.13 22.28 16.63 5.03 11.45 8.52 16.03

通过适当的相机聚焦,从欺骗面部捕获的图像在视觉上看起来与真实的图像类似,这在一定程度上欺骗了现有的方法,例如MsLBP和功率谱的熵。幸运的是,即使媒体被隐藏或裁剪,欺骗面仍然依赖于欺骗媒体,并且反射信息与真实面部不同,尤其是在NIRD图像中。我们采用反射一致性和照明线索进行欺骗检测,并且在所有欺骗媒体的NIR图像上表现出色。
对于两种光谱的所有三种欺骗介质,一些结果似乎是规则的。以片剂欺骗图像为例,对于给定的光谱,ERR和HTER值对于每种方法总是最小的。它与片剂本身的性质有关。平板电脑屏幕发出VIS照明,而不是NIR照明。平板电脑屏幕显示的图像可能不会受到附加活动光的影响。除了由屏幕引起的明显亮点外,其他部分都有类似的外观,因为平坦和未扭曲的屏幕。这些客观原因使得更容易区分平板电脑欺骗面。
Context Based Face Spoofing Detection Using Active Near-Infrared Images(论文翻译)活体检测相关_第5张图片
图5.四次实验获得的结果。
比较表II和表III中VIS和NIR光谱的结果,所提出的方法表现完全不同。如前所述,近红外光谱的结果远优于VIS光谱。对于功率谱熵[4],同样的事情发生,并且大多数数值结果随着VIS图像迅速恶化。在处理具有无约束VIS照明的彩色图像时,基于熵的方法太脆弱了。有趣的是,结果显示MsLBP [6]在VIS图像方面优于其他两种方法,在NIR图像上甚至优于MsLBP。 VIS图像不会使MsLBP恶化,而是使该方法受益。这可以解释为MsLBP仅关注不同尺度上的输入图像的纹理,其依赖于图像强度。它不关心反射率分量。虽然近红外图像在大多数时间是灰度级并且非常暗,但是NIR不能提供足够的强度信息,例如作为VIS光谱的颜色纹理。
如前所述,将我们的方法与近红外光谱的MsLBP进行比较似乎是不公平的,因此我们使用VIS光谱的MsLBP代替。图5显示了四种实验设置的结果:提出的两种光谱方法,VIS光谱的MsLBP和NIR光谱的熵。在这些实验中使用不同欺骗介质的所有欺骗图像。值得注意的是,所提出的方法在单通道灰度NIR图像的EER为1.2%时实现了完美的性能,其优于具有彩色VIS图像的基线方法MsLBP,并且在功率谱上使用熵优于基线方法。此外,近红外差分图像的使用有益于我们提出的方法。


VI. CONCLUSION

提出了一种基于主动近红外图像的新型解决方案,用于人脸欺骗检测。 与大多数现有的欺骗检测技术不同,采用近红外光谱并分析差分图像。 在面部和非面部区域之间计算上下文一致性以检测欺骗媒体的存在。 照明纹理用于处理极端情况,例如裁剪的欺骗媒体。 实验结果证明了不同欺骗媒体的有希望的结果和鲁棒性。未来的工作将旨在使用图像空间信息来提高性能。

REFERENCES
[1] Y. Kim, J. Na, S. Yoon, and J. Yi, “Masked fake face detection using radiance measurements,” JOSA A, vol. 26, no. 4, pp. 760–766, 2009.
[2] D. Wen, H. Han, and A. K. Jain, “Face spoof detection with image distortion analysis,” Information Forensics and Security, IEEE Transactions on, vol. 10, no. 4, pp. 746–761, 2015.
[3] X. Tan, Y. Li, J. Liu, and L. Jiang, “Face liveness detection from a single image with sparse low rank bilinear discriminative model,” in Computer Vision–ECCV 2010. Springer, 2010, pp. 504–517.
[4] T.-W. Lee, G.-H. Ju, H.-S. Liu, and Y.-S. Wu, “Liveness detection using frequency entropy of image sequences,” in Acoustics, Speech and Signal Processing (ICASSP), 2013 IEEE International Conference on. IEEE, 2013, pp. 2367–2370.
[5] J. Yan, Z. Zhang, Z. Lei, D. Yi, and S. Z. Li, “Face liveness detection by exploring multiple scenic clues,” in Control Automation Robotics & Vision (ICARCV), 2012 12th International Conference on. IEEE, 2012,pp. 188–193.
[6] J. Yang, Z. Lei, S. Liao, and S. Z. Li, “Face liveness detection with component dependent descriptor,” in Biometrics (ICB), 2013 International Conference on. IEEE, 2013, pp. 1–6.
[7] S. R. Arashloo, J. Kittler, and W. Christmas, “Face spoofing detection based on multiple descriptor fusion using multiscale dynamic binarized statistical image features,” Information Forensics and Security, IEEE Transactions on, vol. 10, no. 11, pp. 2396–2407, 2015.
[8] J. Komulainen, A. Hadid, and M. Pietikainen, “Context based face antispoofing,” in Biometrics: Theory, Applications and Systems (BTAS), 2013 IEEE Sixth International Conference on. IEEE, 2013, pp. 1–8.
[9] Z. Boulkenafet, J. Komulainen, and A. Hadid, “face anti-spoofing based on color texture analysis,” in Image Processing (ICIP), 2015 IEEE International Conference on. IEEE, 2015, pp. 2636–2640.
[10] G. Pan, L. Sun, Z. Wu, and Y. Wang, “Monocular camera-based face liveness detection by combining eyeblink and scene context,” Telecommunication Systems, vol. 47, no. 3-4, pp. 215–225, 2011.
[11] J. Komulainen, A. Hadid, M. Pietikainen, A. Anjos, and S. Marcel, “Complementary countermeasures for detecting scenic face spoofing attacks,” in Biometrics (ICB), 2013 International Conference on. IEEE, 2013, pp. 1–7.
[12] L. Sun, W. Huang, and M. Wu, “Tir/vis correlation for liveness detection in face recognition,” in Computer Analysis of Images and Patterns, 2011, pp. 114–121.
[13] A. Anjos, M. M. Chakka, and S. Marcel, “Motion-based counter-measures to photo attacks in face recognition,” Biometrics, IET, vol. 3, no. 3, pp. 147–158, 2014.
[14] S. Z. Li, S. R. Chu, S. Liao, and L. Zhang, “Illumination invariant face recognition using near-infrared images,” Pattern Analysis and Machine Intelligence, IEEE Transactions on, vol. 29, no. 4, pp. 627–639, 2007.
[15] R. S. Ghiass, O. Arandjelovic, A. Bendada, and X. Maldague, “In- ´ frared face recognition: A comprehensive review of methodologies and databases,” Pattern Recognition, vol. 47, no. 9, pp. 2807–2824, 2014.
[16] L. Yuan and J. Sun, “Automatic exposure correction of consumer photographs,” in European Conference on Computer Vision. Springer, 2012, pp. 771–785.
[17] R. Basri and D. W. Jacobs, “Lambertian reflectance and linear subspaces,” Pattern Analysis and Machine Intelligence, IEEE Transactions on, vol. 25, no. 2, pp. 218–233, 2003.
[18] C. A. Parker and W. Rees, “Correction of fluorescence spectra and measurement of fluorescence quantum efficiency,” Analyst, vol. 85, no. 1013, pp. 587–600, 1960.
[19] O. Bimber and D. Iwai, “Superimposing dynamic range,” in ACM Transactions on Graphics (TOG), vol. 27, no. 5. ACM, 2008, p. 150.
[20] D. Gragnaniello, G. Poggi, C. Sansone, and L. Verdoliva, “An investigation of local descriptors for biometric spoofing detection,” IEEE Transactions on Information Forensics and Security, vol. 10, no. 4, pp. 849–863, 2015.

你可能感兴趣的:(论文翻译,人脸检测,活体检测,论文翻译)