人体姿态估计(人体关键点检测)分类与经典方法分析(附GitHub地址)

人体姿态估计(Human Pose Estimation)也称为人体关键点检测(Human Keypoints Detection)。对于人体姿态估计的研究,大致可做如下分类。

1. RGB vs RGBD

后者多一项Depth信息,常用于3D人体姿态估计的研究。

2. 2D Human Pose Estimation vs 3D Human Pose Estimation

3. Singe Person vs Multiple Persons

4. Image vs. Video

对于Video,除了人体姿态估计算法外,要增加对于关键点的Tracking(追踪)的研究。

5. Top-down vs. Bottom-up

以上为深度学习方法中两个主要的研究思路。

Top-down首先利用目标检测算法检测出单个人,然后对proposal进行关键点的检测。这种方法一般具有较高的准确率但是处理速度较低。代表性的方法有:

(1) Stacked Hourglass Network(半壁江山)

Github: https://github.com/Naman-ntc/Pytorch-Human-Pose-Estimation (Pytorch)

https://github.com/wbenbihi/hourglasstensorlfow (Tensorflow)

(2) Convolutional Pose Machine

Github: https://github.com/timctho/convolutional-pose-machines-tensorflow (Tensorflow)

https://github.com/JindongJiang/WeightedLoss_Convolutional_Pose_Machines_PyTorch (Pytroch)

(3) Cascaded Pyramid Network

Github: https://github.com/chenyilun95/tf-cpn

(4) Simple Baseline (proposed by MSRA)

Github: https://github.com/Microsoft/human-pose-estimation.pytorch

(5) Multi-Stage Pose Network (MSPN,由Face++提出,2018年coco 关键点检测冠军)。The code will be released.

Bottom-up首先检测出测试图像中所有的关键点信息,然后分配给单个的人,这种方法一般准确率较差,但处理速度较快。代表性的方法有:

(6)HighResolution Net (HRNet,CVPR 2019/Proposed by MSRA&USTC)

Github: https://github.com/leoxiaobin/deep-high-resolution-net.pytorch 

(1) CMU的Realtime Multi-Person Pose Estimation。

Github:https://github.com/ZheC/Realtime_Multi-Person_Pose_Estimation

(2) Newell(Hourglass的作者)的Associative embedding: End-to-end learning for joint detection and grouping.

Github:https://github.com/princeton-vl/pose-ae-train

6. Single Stage vs. Multiple Stages, 多阶段还是单阶段。这个分类在MSPN论文讲解的很清楚,后续我会总结并补充。

7.Multi-scale Feature Extraction,多尺度特征提取是所有方法中都要实现的一个过程,原因就在于不同尺度的图像对于不同关键点的检测效果是不同的。例如,在更低尺度的图像中,具有更丰富的语义信息,对头部等关键点的检测效果较好,在更高尺度的图像中,空间纹理信息更加丰富,对于检测踝关节等部位关键点的效果较好。因此,在所有人体关键点检测算法中,必不可少的一个过程就是多尺度特征的提取。

今天就先写在这里,后续我会继续补充文章内容,对具体算法进行分析,还会对多阶段特征提取过程中常用的中继监督方法进行分析。

你可能感兴趣的:(Human,Pose,Estimation,Deep,Learning,Human,Pose,Estimation)