论文名称:A Point Set Generation Network for 3D Object Reconstruction from a Single Image
论文作者:Haoqiang Fan, Hao Su, Leonidas Guibas
发行时间:Submitted on 2 Dec 2016 (v1), last revised 7 Dec 2016 (v2)
论文地址:https://arxiv.org/abs/1612.00603
代码开源:无
本文为了讨论需要提出一种衡量预测的 point cloud 和 GT 之间的损失函数, 该损失函数需要满足如下特性:
于是提出如下两个衡量指标 Chamfer distance (CD) 和 Earth Mover’s distance (EMD).
首先定义 S 1 , S 2 ⊆ R 3 S_1,S_2 \subseteq \mathbb{R}^3 S1,S2⊆R3 之间的 CD: d C D ( S 1 , S 2 ) = ∑ x ∈ S 1 m i n y ∈ S 2 ∥ x − y ∥ 2 2 + ∑ y ∈ S 2 m i n x ∈ S 1 ∥ x − y ∥ 2 2 d_{CD}(S_1,S_2)=\sum_{x \in S_1} \underset{y \in S_2}{\rm min}\left \| x-y \right \|^2_2 + \sum_{y \in S_2} \underset{x \in S_1}{\rm min}\left \| x-y \right \|^2_2 dCD(S1,S2)=x∈S1∑y∈S2min∥x−y∥22+y∈S2∑x∈S1min∥x−y∥22
其中, d C D d_{CD} dCD 表示两点集之间的"距离"函数, ∥ x − y ∥ 2 = ( ∣ x 1 − y 1 ∣ 2 + ∣ x 2 − y 2 ∣ 2 + . . . + ∣ x n − y n ∣ 2 ) \left \| x-y \right \|_2=(|x_1-y_1|^2+|x_2-y_2|^2+...+|x_n-y_n|^2) ∥x−y∥2=(∣x1−y1∣2+∣x2−y2∣2+...+∣xn−yn∣2).
而这个 d C D d_{CD} dCD表示的意思是: 对每个 S 1 S_1 S1内的点,分别求出其到 S 2 S_2 S2的最小距离,再平方求和,然后再对 S 2 S_2 S2做对称的操作.
显然, CD是一个连续可微的连续的方法, 其中每个点之间是独立的, 所以很容易分布计算, 经过实验, CD 产生一个合理的高质量结果.
CD算法会在另一个集合中找到最近的点,并将其距离的平方求和,其特点是能更好的保存物体的详细形状,详见–倒角距离。
首先定义 S 1 , S 2 ⊆ R 3 S_1,S_2 \subseteq \mathbb{R}^3 S1,S2⊆R3 且满足大小满足 s = ∣ S 1 ∣ = ∣ S 2 ∣ s=|S_1|=|S_2| s=∣S1∣=∣S2∣之间的 EMD: d E M D ( S 1 , S 2 ) = m i n ϕ : S 1 → S 2 ∑ x ∈ S 1 ∥ x − ϕ ( x ) ∥ 2 d_{ EMD}(S_1,S_2)=\underset{\phi:S_1 \to S_2}{\rm min} \sum_{x \in S_1} \left \| x-\phi(x) \right \|_2 dEMD(S1,S2)=ϕ:S1→S2minx∈S1∑∥x−ϕ(x)∥2 其中, ϕ : S 1 → S 2 \phi:S_1 \to S_2 ϕ:S1→S2 表示双射.
这个 d E M D d_{EMD} dEMD表示: 两个大小为 n n n的点集间连 n n n条线,找到使线段长的平方之和的最小值, 所谓 ϕ \phi ϕ就是那个对应关系(连线方法)
该方法可解决优化问题(指派问题). 其对于除了0子集对以外的所有子集对都满足 双射 ϕ \phi ϕ 在不断逼近极小值时仍然是唯一且不变的, 其几乎处处可微. 但是实践中该方法的计算资源消耗过大, 故不采取精确计算(近似计算)
EMD算法可以用来测量两个分布之间的距离,能产生相较于CD算法更紧凑的结果,但有时会过度收缩局部结构,详见—EMD距离。