SSR-Net软阶段回归网络的年龄预测

SSR-Net: A Compact Soft Stagewise Regression Network for Age Estimation

创新点:阶段回归与动态范围

DEX方法

DEX方法,将整个年龄的回归问题分解为分类问题。将整个年龄区间 Y = [0; V ] 分解为s个不相交的子区间,每一个子区间的宽度为w,W=v/s,那么第i个子区间ui=i*(V/s)。最终预测的年龄为每一个区间的概率和,即

                                  SSR-Net软阶段回归网络的年龄预测_第1张图片

为了使得模型更加精确,DEX方法设置每一个bin的宽度为1岁,也就是对于 Y = [0::100],一共有101个bin。本质就是在0-100之间的101类分类后,对于得到的分数(softmax)和对应的label(0-100)相乘,并将最终结果求和,得到最终识别的年龄。但是这样参数量比较大。 

SSR-Net软阶段回归网络的年龄预测_第2张图片

网络为VGG16,预先在ImageNet上进行分类训练,然后在IMDB-WIKI数据集上进行微调。

单独回归器训练的时候,将VGG16最后一层神经元改为1个,从而获得回归年龄。

单独分类器训练的时候,最后一层神经元数目改为101进行分类,从而获得每个类别的概率。 最终通过将分类器各个类别概率与对应的年龄相乘,得到网络预测的年龄:

                                                      

阶段回归 

本文基于DEX方法的基础上,提出了阶段回归方法。 假设年龄一共0-90岁,区间宽度为10,那么DEX方法的全连接层就需要9个神经元 (0 ∼ 10,10 ∼ 20,20 ∼ 30,30 ∼ 40,40 ∼ 50,50 ∼ 60,60 ∼ 70,70 ∼ 80,80 ∼ 90)。而采用多stage策略后,第一个stage只需要3个神经元 (0 ∼ 30,30 ∼ 60,60 ∼ 90),第二个stage在第一个stage的基础上,也只需要3个神经元,因为第一层的3个stage共用第二层的3个神经元,即第二层的stage在第一层stage的基础上,只需要区分(小,中,大)就可以实现0-90岁的分类了。2个stage加起来,只需要6个神经元就可以达到。SSR-Net采用由粗到精的策略,分多个阶段进行多类分类。每个阶段只负责细化前一阶段的决策,以便更准确地估计年龄。因此,每个阶段执行的任务类很少,需要的神经元也很少,这大大减少了模型的大小。 SSR-Net通过允许根据输入的人脸图像进行移动和缩放,为每个年龄类分配一个动态范围。

SSR-Net软阶段回归网络的年龄预测_第3张图片

阶段回归的优点是每个阶段的类的数量很少,导致更少的参数和更紧凑的模型。
假设我们想估算0 ~ 90岁范围内的年龄(V =90),分成三个阶段(K = 3),每个阶段有三个小区间(s1 = s2 = s3=3) 。

 

SSR-Net软阶段回归网络的年龄预测_第4张图片

动态范围

将年龄区间统一划分为不重叠的区间,在处理年龄组模糊性和年龄连续性上缺乏灵活性。在粗粒度上,问题甚至更严重。我们通过为每个区间引入一个动态范围来解决这个问题;也就是说,我们允许每个区间根据输入图像进行移动和缩放。 

SSR-Net网络结构 

SSR-Net软阶段回归网络的年龄预测_第5张图片

 Soft Stagewise Regression           SSR-Net软阶段回归网络的年龄预测_第6张图片

 

你可能感兴趣的:(Age,estimation,深度学习,机器学习,回归)