AGES算法---learning from Facial Aging Pattern for Automatic Age Estimation

AGES算法---learning from Facial Aging Pattern for Automatic Age Estimation
   最近开始读了几篇paper,然后做了下笔记。暑假是实习内容就是实现这个算法,所以先了解了下,发现需要掌握的知识还是很多啊!

《learning from Facial Aging Pattern for Automatic Age Estimation》
《Automatic Age Estimation Based on Facial Aging Patterns

笔记如下:
基于年龄格局自动年龄估计
1. 自动年龄估计面临的主要难题就是年龄相对于其他面部因素的特殊性:
1. 老化的过程不可控。导致样本数据收集很费力
2. 独特的年龄格局。每一个人的的基因,健康情况,生活方式都不同,造成年龄格局不同。
3. 年龄格局是时间的函数。老化的过程必须按照时间顺序,某时刻的脸部状态能够影响到后面的年龄的面部表情,但是不能影响到年轻时刻的。
2.试验中,数据的采集使用FG-NET Aging Database。该数据库的有个缺点就是绝大多数图像只是表示很少的年龄,造成数据不完整。所以年龄算法必须要能够适用于处理不完整数据。
3.每个人独有的特征也需要考虑进去,还有,每个分级都需要排列成次序,因为是按照时间顺序来的。
4.AGES算法。(AGing pattErn Subspace)取代传统的使用使用独立的每一张人脸图片来采样,把每一个年龄格局作为一个样本(这样的好处是将个人的特征和实践概念结合起来,让学习的任务从image-class编程了从image序列-class序列,从而基于了不完整数据)。为了解决这个问题,一个迭代学习算法被发明。
5.最早的一个年龄估计算法是Lanitis提出,在他们的工作中,年龄格局是有一个二次函数(称作年龄函数)来决定的。
Age = f(b);
其中b是那个脸部图像的特征向量。而这个函数是根据不同的人来训练得到合适的(这其中有4种方式来决定这个函数,而WPS算法是最好的。但是WPS算法包含了很多其他因素,包括健康情况,天气……而这些情况很难得到),所以,后来使用WAS算法被拿来使用(因为它不需要涉及到这些因素)。
WAS:年龄函数是由带权的已知年龄函数来求得的,而权值是由Mahalanobis距离决定(Mahalanobis距离是从测试图像到训练图像)
其后,有很多算法对WAS算法进行改进,其中最优的方法是AAS。
上面的这些基于年龄函数的年龄估计方法有缺陷,造成估计的精度不能进一步提高。主要问题是:1。年龄函数的公式固定(而事实上是没有这种关系的,二次函数关系)2。时间特征不能很好的反应(任何的变化都会反映到其它图像上)3。某个人年龄格局的学习单纯的由这个人的面部表情(而实际上不同的人之间有某种共同的特性)4。新年龄函数仅仅是由原函数线性组合,而不是有一个确定的模型阐述
6.年龄格局。
年龄格局定义:它是一串按照时间排序的个人图像序列。
假设灰度图像时由二维矩阵I表示(I表示像素(x,y)处的光强),那么年龄格局就可以由三位矩阵表示p(x,y,t)(其中t表示时间)
在年龄格局被进一步处理前,所包含的图像要先被转化成特征向量(论文【7】中有办法,采用Apperance Model)。
1   2   3   4   5   6   7
m   m  B1   m  B2   m   m

特征向量(AM抽取)b有n维(因为图像转换之后的特征向量假设是n维的),而p表示的是年龄的个数,就是上面的编号1,2……7。那么每一年龄模式可以表示成n * p维表示。为何?因为实际上可以看成时一个向量(xxxxxxx | xxxxxx),前面的一部分就是那个向量b,它有n维,也就是n位,而后面的部分就是p,对应的用p位表示,比如0就表示未000……00,1就表示000……01,…………
经过这个之后就可以表示对应的向量x(年龄格局)。
这个就得到了采样样本!
7.剩下的问题就是,1。从image-class变成了从image序列-class序列,2。处理不完整数据样本。
8.AGES算法
1.前面已经采样得到Aging Pattern,现在就是要建模(Modelling),采用办法就是PCA方法来构建子空间(资料【10】中有介绍)。
具体办法就是:
1. 计算子空间投影(Projection):
Y = WT(x−u)
u:u是x的平均向量
W:x的协方差矩阵的特征向量 WT是W的转置矩阵
算法具体步骤:
1.输入一个向量组D = {x1,x2,x3……xn},有n个,然后每一个xi都可以表示为{xia,xim},前面一个表示有用数据,后面那个表示丢失的特性。一旦确定了变换矩阵W确定了,那么xk的重构x′k就可以求出来
x′k = u + W * yk
然后对应的重构差异值:
ε= 1nΣ(xk−x′k)Tn1(xk−x′k)
现在的问题是:要找到最好的一个W使得ε是最小的。
那么接下来的任务是如何实现呢?首先,置初值(xim由平均的uim决定),每一次迭代中,都可以计算出来Wi来,但是,由于x中含有很多丢失信息,所以不能直接用公式Y = WT(x−u)来求出投影y。使用变形公式:
Wiak∗yk =xia − uiak
那么现在的算法是:首先初始化,设置每一个然xim为uim,循环次数 i设置为0,然后,使用上面表格的算法,得到W0,再在给定的次数Υ和精度要求θ条件下多次循环迭代,先利用
Wiak∗yk =xia − uiak
计算yk,然后利用x′k = u + W * yk 得到重构的x′k,然后将得到的重构值赋值给xk,在利用PCA更新D,重新计算Wi,然后得到ui+1,在继续下次循环。
上述的结果能得到W,u
下面就是测试程序(如何得到年龄):
得到了所需要的参数之后,就可以输入一个参数,得到年龄。
具体方法是:
1. 由于一个给定的图样不知道年龄,所以在每一个pattern的有效字段中都放入该图像(也就是假设这个图像的年龄分别是1,2,…………n),然后分别计算yk,然后计算出ε最后比较得到最小的ε,对应的那个位置就是age。
2.
上图中就是将这个test image放入每一个的位置0,1,…………p-1,然后都经过投影,然后重构后得到ε,找到最小的,就是得到年龄。
年龄段估计的方法和上面的那个基本原理一样,只不过是在计算出来一个年龄之后,由于我们要的是年龄段,所以就除以段的间距,然后取整加1就是所需要的。
比如:年龄段的分类:0~4,4~8 …………

我的疑问:
通过阅读几次这个论文,对于这个算法我大概了它的基本流程。但是还是有一些疑问:
1. 每一个xi都可以表示为{xia,xim},但是这个里面的有用信息部分和无用信息部分到底是哪些部分呢?因为前面的采样过程中已
经知道, xi是两部分组成,前面是图像信息,后面是position,就是年龄。那么这里我们说的有用信息是指前面的那个图像信息,丢失信息是那个年龄吗?(我觉得很多地方都是需要这个有用信息和丢失信息的,特别是估算部分)
2. 形成xi的时候,需要把一个图像转换成特征向量(feature vector),这个在文献【7】有介绍,就是Apperance Model,这个目前还没有搞懂,刚刚下了篇论文:
《Statistical Models of Face Images – Improving Specificity》
好像是这个参考资料,准备下一步继续看下去。
3.还有很多细节没有弄清楚。

你可能感兴趣的:(AGES算法---learning from Facial Aging Pattern for Automatic Age Estimation)