深度学习在人脸识别领域的应用(2)

         Deep Convolutional Network Cascade for Facial Point Detection

       本文是CVPR2013汤晓欧课题组的最新工作,利用级联深度卷积网络进行面部特征点定位。

1. Deep Covolutional Network

        Deep Covolutional Network深度卷积神经网络,正是我们所熟悉的CNN(Covolutioanl neural network),CNN在上了世纪末年就已经成型[1],现如今深度学习如日中天,加个Deep顿时就高端起来了大笑

     深度学习在人脸识别领域的应用(2)_第1张图片

           Figure.1 给出了Deep CNN的结构图,Deep CNN通过多层的卷积结构来提取层次特征(Hierarchical Feature),并通过max-pooling层下采样获取不变性,最后通过最上层一个全连接的MLP(hidden layer + logistic regression)[2]来实现分类。


2. Cascaded Convolutional Network

     深度学习在人脸识别领域的应用(2)_第2张图片

          图2是整个系统的结构图,“Cascaded"就体现在这样的一个层次结构上,F1、EN1和NM1首先是一层粗的定位,后面再通过更加精细LE21等第二层检测器以及LE31等第三层检测器实现更为精细的位置修正。图中的黄色区域是每层检测器的扫描区域。注意第一层卷积网络的标识为Deep CNN,这表示第一层网络所采用的是Figure.1所示的深度结构。注意,LE21和LE22都是用来预测左眼中心的位置,区别在于扫描区域

3. 实现细节

     Level 1-3的网络结构见下表:

     深度学习在人脸识别领域的应用(2)_第3张图片

      注意Level2-3所采用的网络结构均为S2。

      下表则给出了的Level 2-3各个卷积网络的扫描区域。

      深度学习在人脸识别领域的应用(2)_第4张图片

       从Table2可以清晰的看出LE21和LE22在扫描区域上的区别。

4. 实验

     Figure.4比较了多种网络结构,Figure.5显示了多层级联结构的优势。:

      深度学习在人脸识别领域的应用(2)_第5张图片

         

            深度学习在人脸识别领域的应用(2)_第6张图片

       Figure.6 在BioID和LFPW两个库上将本文方法与state-of-the-art方法进行了比较。可见本文方法的性能相比传统方法有较大提升(50% Accuracy improvement)。

      Figure.8给出了一些检测结果,本文作者用C++实现了该方法,检测速度为0.12second/per image,相当于8frames/s,客观的说,这个速度不算快,但是检测精度的确非常给力。

     深度学习在人脸识别领域的应用(2)_第7张图片

     

参考文献

[1] LeNet-5

[2] Multilayer Perceptron




      

你可能感兴趣的:(深度学习在人脸识别领域的应用(2))