AlphaPose论文阅读:Regional Multi-person Pose Estimation

最近在阅读上交卢教授的关于行人骨架检测的一篇开源工作,特写此博以做备注。
名称:RMPE Regional Multi-person Pose Estimation
使用框架:Pytorch
论文地址:https://arxiv.org/abs/1612.00137
开源地址:https://github.com/MVIG-SJTU/AlphaPose/tree/pytorch

模型组成

Single-person Pose Estimator (SPPE)单个行人姿势预测会受到行人检测结果的影响。检测框的微小偏移就可能会造成姿势预测的极大偏差。该论文针对这个主要问题提出了AlphaPose。模型共由以下三部分组成:
1.Symmetric Spatial Transformer Network (SSTN)
2.Parametric Pose Non-Maximum-Suppression (NMS)
3.Pose-Guided Proposals Generator (PGPG)
AlphaPose论文阅读:Regional Multi-person Pose Estimation_第1张图片

模型细节

AlphaPose遵循两步姿势预测架构,模型旨在在行人检测框不准确的情况下依然能够准确的检测出行人的姿势。为了对比自身模型,部署了基于Faster-RCNN检测模型+SPPE Stacked Hourglass model模型的架构。对比SPPE,AlphaPose提出SSTN用于提高单个行人检测的质量,促进SPPE模块骨架检测效率。

RMPE模型流程

首先用人体检测器得到 human bounding boxes, 可以用 SSD 或 Faster R-CNN。然后将这些人体矩形框输入 “Symmetric STN + SPPE” 模块,自动输出 pose proposals,对这些 pose proposals 用parametric Pose NMS 微调得到最终的人体姿态估计。在训练阶段,我们引入 “Parallel SPPE” 来避免局部最小值,提升 SSTN性能。The Parallel SPPE acts as an extra regularizer during the training phase为了增强已有的训练样本,我们设计了 pose-guided proposals generator (PGPG)。
AlphaPose论文阅读:Regional Multi-person Pose Estimation_第2张图片

未完待续~

你可能感兴趣的:(行人关键点检测)