人脸特征点检测
人脸面部特征点检测方法研究主要包括
(1)基于形状模型结合分类器的检测方法
(2)基于全局到局部回归模型的检测方法。
随着技术的发展提出了一些新方法如基于ASM和肤色模型的疲劳驾驶检测方法,采用GBPI图像描述及级联拟合算法,马尔科夫随机场及连续隐变量模型,高斯混合模型的人脸特征监测方法等。
自然条件下的人脸特征点检测挑战有:成像条件的多变性导致人脸外观变化存在非线性,给局部建模带来困难;和图像中可能存在与特征点处局部外观相似的点,产生误检测。面部关键特征精确定位与跟踪是基于驾驶员行为特征的检测方法中的难点。如眨眼频率检测,头部位置检测,视线方向检测,嘴部状态检测。目前眼睛的检测与定位算法主要有两种研究途径:基于图像处理的被动方法和基于近红外照明的主动方法。
————————————————————————————————————————————————————————
感受野的计算有卷积逆过程的意思
感受野:在卷积神经网络CNN中,决定某一层输出结果中一个元素所对应的输入层的区域大小,被称作感受野receptive field。我们看这段定义非常简单,用数学的语言就是感受野是CNN中的某一层输出结果的一个元素对应输入层的一个映射。再通俗点的解释是,feature map上的一个点对应输入图上的区域。注意这里是输入图,不是原始图。
——————————————————————————————————————————————————
权值共享就是说,给一张输入图片,用一个卷积核去扫这张图,卷积核里面的数就叫权重,这张图每个位置是被同样的卷积核扫的,所以权重是一样的,也就是共享。
————————————————————————————————————————————————————
支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类(binary classification)的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解的最大边距超平面(maximum-margin hyperplane) [1-3] 。
SVM使用铰链损失函数(hinge loss)计算经验风险(empirical risk)并在求解系统中加入了正则化项以优化结构风险(structural risk),是一个具有稀疏性和稳健性的分类器 [2] 。SVM可以通过核方法(kernel method)进行非线性分类,是常见的核学习(kernel learning)方法之一
——————————————————————————————————————————————————————
分类的概念是在已有数据的基础上学会一个分类函数或构造出一个分类模型(分类器),该函数或模型能够把数据库中的数据纪录映射到给定类别中的某一个,从而可以应用于数据预测。包含决策树、逻辑回归、朴素贝叶斯、神经网络等算法。
输入变量与输出变量均为连续变量的预测问题是回归问题;
输出变量为有限个离散变量的预测问题成为分类问题。
——————————————————————————————————————————————————————
卷积神经网络(CNN)的基本结构是输入层、卷积层(conv)、子采样层(pooling)、全连接层、输出层(分类器)。 卷积层和子采样层可以有若干个,全连接层相当于 MLP(多层感知机)中的隐含层 HiddenLayer。输出层即分类器,一般采用 softmax 回归。在 CNN 的一个卷积层中,通常包含若干个特征平面(featureMap),每个特征平面由一些矩形排列的的神经元组成,同一特征平面的神经元共享权值,这里共享的权值就是卷积核。卷积核一般以随机小数矩阵的形式初始化,在网络的训练过程中卷积核将学习得到合理的权值。共享权值(卷积核)带来的直接好处是减少网络各层之间的连接,同时又降低了过拟合的风险。子采样也叫做池化(pooling),通常有均值子采样(mean pooling)和最大值子采样(max pooling)两种形式。子采样可以看作一种特殊的卷积过程。卷积和子采样大大简化了模型复杂度,减少了模型的参数。CNN 是 DNN 的一种,与 CNN 相比,深度神经网络中网络有多个隐藏层
softmax其实是Logistic的推广到多类别分类应用中,不是建立多个二分类分类器来实现多类别分类。softmax分类器的思想很简单,对于一个新的样本,softmax回归模型对于每一类都先计算出一个分数,然后通过softmax函数得出一个概率值,根据最终的概率值来确定属于哪一类。
————————————————————————————————————————————————————
脸部关键点检测
(1)分类查找窗口:为每一个关键点训练一个被称为component detector的分类器,是基于局部信息的。
找到多个类似脸部关键点的候选区域或找到的候选区域不合适,一个优化方法是加入形状约束。
(2)直接预测关键点位置(或形状参数)
Deep Convolutional Network Cascade for Facial Point Detection
caffe 全 称 为 Convolutional Architecture for Fast Feature Embedding
级联回归器的方法,用三级卷积网络检测脸部关键点。
卷积网络在第一级就做出了准确的脸部关键点的初试位置估计。有效地避免局部最小值问题。卷积网络把整张脸作为输入,最好地利用了上下文信息,并在深度构架的高层提取了全局的高级特征,剩余的两级卷积网络用于提纯初始估计。这两级的卷积网络是浅层的,它们的任务是低层的且他们的输入被限制在一个小的初始点的小局部区域。