2021-03-14

A simple yet effective baseline for 3d human pose estimation论文的思路讲解(如果有不正确的的地方,请及时指出)

原文:A simple yet effective baseline for 3d human pose estimation

收录:ICCV2017

代码:tensorflow

本文章主要是对论文的整个问题解决思路进行一个解析,不是对论文的翻译。

非常有幸能读到这篇经典论文,并且对它进行一个分析。

主要是从以下几个方面进行分析

一:问题的提出

尽管目前3D姿态估计表现非常出色,但是给定一张图片来预测出三维关节点的坐标,通常不容易理解,是哪一个过程出现了问题,导致回归的结果不是很优秀(图片-2D pose 还是2D-3D姿态回归,论文针对的是分阶段方法。3D人体姿态估计的解决方法可以看 Vegetaberd的这篇文章)。

论文是针对2D-3D姿态估计这个阶段进行分析。

二:解决方法:

在图片-2D pose这个阶段,论文主要是说了两种方式,第一种: 利用3D关节点真实的位置,根据相机的参数来得出2D关节点的位置(代码中写的非常清晰);第二种:利用当前最优秀的2D 关节点检测器来得出2D节点坐标。

论文提出了一个简易的神经网络的模型,来处理2D到3D姿态回归的问题,

网络的模型非常简单 就用图片先粘贴一下,下次文章一定用自己写出来的(加鸡腿鼓励一下自己

2021-03-14_第1张图片

网络的模型非常简单了,具体就不介绍了,有深度学习基础的同学,应该能看明白。

实验结果显示,使用第一种方法,错误率比现有的技术水平低了30%,使用第二种方法,正确率也是略优于目前最好的方法。

三:创新点:

假设了2D-3D这个阶段是3D人体姿态回归的主要问题,提出了简易的神经网络的模型。结果取得了很好的效果,证明这一假设是正确的。

四:改进点提出:

2D人体姿态估计这个方面可以加强,提高准确率;

网络中没有增加图片的信息内容,可以考虑增加图片的内容信息来提高准确率;

可以考虑增加网络的复杂度,来提高准确率;

你可能感兴趣的:(笔记,IT人员,深度学习,tensorflow,神经网络,机器学习)