一写在前面

未经允许，不得转载，谢谢~~~

这篇论文主要完成了对手和手中的物体同时进行重建，并贡献了一个对应的ObMan数据集。

二简单介绍

先看一下效果图吧

主要用处：

同时恢复人和手中物体的3D形状对以下方向都有重要意义：

本文主要贡献：

从整体上来看分成上下两路：

将MAMO hand model变成一个可微分的网络层；
hand encoder得到一个特征向量，经过全卷积层得到beta和pose，其中pose表示手关节点等信息，beta表示不同人手的变换特性（例如胖瘦）
MAMO接受beta和pose的输入，能够得到对应手的顶点信息vertices和关节点信息joints
在原MONO16个关节点joints 的基础上，本文又加了5个表示手指头位置的关节点，共21个构成最终关节点J
所以这部分的loss函数：
Vhand对应vertices, J对应joints,这两项都是用预测到点与gt的点之间的L2距离计算loss;
最后一项对应beta，是希望约束beta的变换不要太大。

用AtlasNet网络作为物体预测网络，接受物体点云+图像特征的输入，输出新的坐标位置。
AltasNet用Chamfer loss来进行网络的训练。
除了Chamfer loss，文章还提出了额外的loss来是得mesh的生成效果更好。
L_E表示对于边的长度与平均边长相差很大的惩罚；
L_L表示鼓励物体的曲率接近球体的曲率；
物体模型的loss函数：
Vobj表示物体主要的Chamfer loss。
除了物体模型本身的loss之外，我们上面提到为了结合手和物体，还预测了一个Trans和Scale，对应的也有两个loss， L_T 和 L_S。具体的计算方法都是与gt的T和S的L2距离。
所示这部分的loss函数：

展示一下，毕竟一个数据集的贡献程度有的时候可能比论文的方法要来的重要。

文章中的一些补充材料：

MAMO: J. Romero, D. Tzionas, and M. J. Black. Embodied hands: Modeling and capturing hands and bodies together. ACM Transactions on Graphics, (Proc. SIGGRAPH Asia), 36(6), 2017. 1, 3, 5
AtlasNet: T. Groueix, M. Fisher, V. G. Kim, B. Russell, and M. Aubry. AtlasNet: A papier-mˆach´e approach to learning 3D surface generation. In CVPR, 2018. 2, 3, 4, 6

关于整体思路：

三维重建方向的论文看了应该有挺多篇了，但是一直没有真正上手，确实需要反思一下这个过程中存在的畏难情绪。希望这个暑假可以做出一点相关方向的东西。