DeepPrior++: Improving Fast and Accurate 3D Hand Pose Estimation总结

文章链接

摘要

​ 在DeepPrior上做了改进:1. 基础网络结构换成ResNet;2. 改进手部定位网络; 3. 数据增强

关键

  1. 训练数据增强

    1. 旋转

    2. 放缩

    3. 平移

    4. Online Augmentation

      在训练时对输入图片做上述(旋转,缩放,平移)操作,保证每个epoch模型看到的都是不完全相同的输入。这能很好的提升鲁棒性。

    5. 更加鲁棒的先验

      使用增强的数据PCA初始化瓶颈层

  2. 手部定位网络

    DeepPrior默认手部即距离摄像头最近的物体,从而截取出手部区域。本文在DeepPrior基础上,应用CNN回归预测中指的掌指关节点用于修正边界框。

  1. 基础网络结构

​ 取消平均池化,加入两个全连接层

结果

​ 相较于DeepPrior有不错改善

你可能感兴趣的:(DeepPrior++: Improving Fast and Accurate 3D Hand Pose Estimation总结)