提高关键点预测精度的小技巧

在人体姿态估计(human pose estimation)和人脸对齐(face alignment)领域。很多文章中,在测试(testing)的时候,我们都会选择使用原图产生的heatmap和 翻转后图片(flipped image) 产生的heatmap求平均。
很多人不理解这个小技巧,在github上看到有人提到这个问题。
我理解的是因为预测是的不稳定造成的,同样的一个点,翻转后预测的点,再翻转回来就相当于原图的heatmap了, 他的位置和直接拿原图预测的点可能不在同一个位置。这样取平均可以折中一下,使得预测的结果更加平稳。
这样的提升一般都会很明显。
很多文章也用到了这个小技巧,
Cascaded Pyramid Network(CPN)
Self Adversarial Training for Human Pose Estimation
Deep High-Resolution Representation Learning for Human Pose Estimation
论文原话摘抄:
To stabilize the predictions, we evaluate both the original image and its flipped version, and average their output heatmaps.(《Self Adversarial Training for Human Pose Estimation》)

你可能感兴趣的:(人体姿态,human,pose,estimation,人脸对齐,技巧)