Learning Hierarchical Representations for Face Verification with Convolutional Deep Belief Networks
话说这深度学习如火如荼的,在imageNet上斩获无数,在人脸识别这个领域,深度学习也不甘示弱,本系列将介绍人脸识别领域应用深度学习的工作。
这是CVPR2012的一篇工作,利用CDBN来做层次特征学习,来处理unrestricted face verification问题。由于人脸的特殊性,CDBN除了直接在灰度图像上训练,同时在LBP图像上训练(取了59维的 Uniform LBP Feature),按文中观点,CDBN可以用来提取local feature中的高阶统计信息。另外一方面,人脸被划分为若干相互重叠的块,每个块只和部分隐结点发生关联,CRBM的建模如下:
最后输出的特征进一步用CSML进行测度学习,过程依旧是先做PCA,再学测度。
实验部分在LFW数据集上进行,文章在不同网络架构下比较了random filter和基于CDBN模型的learned filter,得出结论是learned filter比random filter对网络架构鲁棒性更强,性能普遍更优。
重头戏是LFW View2上的确认实验,注意CDBN网络的参数是在View1上调出来滴。实验结果如下:
Table 1中,在Kyoto这个自然图像数据集上训练的CRBM model放在人脸上也不错。另外一个费解的地方就是,多层的CRBM提升不大,Kyoto数据集上,2层CRBM的性能甚至比一层的还要低。深度学习的拥护者普遍认为,不充分的深度是有害的。单个数据源性能最高的是Kyoto,同时使用LBP和pixel训练CRBM,Accuracy达到了86.60%,居然比人脸数据训练出的模型还高。
Table2就有些惨不忍睹了,虽然说Hand-crafted那个87.18%的性能是融合多个描述子出来的,本文工作中的86.88%也是用的SVM融合,这个CDBN和hand-crafted孰优孰劣,至少从目前这个工作中,我们得不出结论。要知道Sun Jian CVPR2013的最新工作Blessing of Dimensionality: High-dimensional Feature and Its Efficient Compression for Face Verification,利用稠密采样的多尺度LBP特征在LFW数据集上已经到达了95%的逆天性能。