Dex-Net 1.0 论文翻译

一 、概述

DEX-NET1.0(Dex-Net),一种新的数据集和相关算法,以研究大数据和云计算对鲁棒抓握规划的扩展效应。该算法使用具有相关奖励的多臂老虎机模型来利用当前包含超过10,000个独立3D物体模型和250万个平行颚爪抓取方式的不断增长的数据集中的先验抓取方式和3D物体模型。每个抓取方式包括在物体和夹持器姿态和摩擦不确定性下的力闭合概率的估计。 Dex-Net 1.0使用多视图卷积神经网络(MV-CNN),一种用于3D物体分类的新的深度学习方法,作为物体之间相似度的度量。并使用Google Cloud Platform,可同时运行多达1,500个虚拟机,减少实验运行时间三个数量级。实验表明,1,先验数据可以加速鲁棒抓取规划,平均达到2倍。2,抓取规划的质量随着数据集中类似物体的数量增加而增加。3,我们还研究系统对不同相似性和不同姿态和摩擦不确定度水平的敏感度。


Dex-Net 1.0 论文翻译_第1张图片
如图1(左)所示:一次抓取方式表示为 g=(x,v),其中x为3D空间中的爪子形心的表示,v为进近方向。
物体参数化表示:使用一个有符号的距离函数(SDF)f 作为物体的标准模型。其中单位为米,物体内部表示为负数,表面表示为0,外部表示为正数。
其中物体姿态和抓钩姿态的为0均值的高斯分布模型。摩擦系数为均值为 u 的高斯分布。
如图1(右)所示:每次接触会有两个接触点 C1,C2 设抓钩间距为w。
论文中采用 闭合力的概率(PF),或抵抗任意方向上外力和扭矩的能力,作为质量度量。
对一个物体的Ng个候选抓取规划进行最多T次采样,通过多臂老虎机算法寻找一个拥有最大化 PF 的抓取规划 g*。


13,252 3D mesh models
8,987 from the SHREC 2014 challenge dataset ,
2,539 from ModelNet40 ,
1,371 from 3DNet ,
129 from the KIT object database,
120 from BigBIRD,
80 from the Yale-CMU-Berkeley dataset ,
26 from the AmazonPicking Challenge scans
首先为每个物体生成Ng个抓取方式,然后使用Smith 论文里的2D算法集中其中对称的样本。
1)首先通过对S均匀采样产生一个接触点C1 ,然后随机抽取方向这里写图片描述,最后计算接触点C2这里写图片描述这里写图片描述,这便生成了一个抓取方式 这里写图片描述。(其中S是物体模型表面的点集)
3)使用Monte-Carlo integration [20]论文方法来评估PF(g)。
Dex-Net 1.0 论文翻译_第2张图片


Dex-Net 1.0 论文翻译_第3张图片
5、将每个物体的这里写图片描述表示输入到MV-CNN中,通过物体之间的欧几里得距离这里写图片描述 来测物体Oi与物体Oj之间的相似度。
试验采用SHREC2014中的6000个3D模型的渲染图象训练MV-CNN ,并使用SHREC2014挑战数据集测试,得到了86.7%的准确率。


1)首先采用 三-2中方法生成一组候选抓取方式Γ,并使用DEX-NET数据集为每一个抓取方式预测一个置信分布。
2)使用Thompson Sampling 选择一个候选抓取规划运行多臂老虎机模型,对被选出的抓取规划 g 采样物体姿态,摩擦系数等高斯分布变量计算相应的 F , 根据 F 更新相应抓取规划的置信分布参数 。(迭代 “步骤2 ” T次)
定义这里写图片描述作为候选抓取方式集中每一个候选抓取方式的force clourse 的评估。
因为这里写图片描述是未知的,该算法在伯努利参数这里写图片描述上保持后验Beta置信分布,即通过每一个新的对 F的观察,为真实的PF分配越来越高的概率。
使用Continuous Correlated Beta Processes (CCBPs),为不同物体抓取方式之间的相关性进行建模,这使得我们可以利用DEX-NET中的先验抓取方式和物体数据。
Dex-Net 1.0 论文翻译_第4张图片


我们使用论文[11]中内核函数(如下)测量的候选抓取方式集中每一个抓取方式与DEX-NET1.0数据集 D 中所有抓取方式和物体的相似度,为候选抓取方式集中每一个抓取方式形成一个置信分布。
Dex-Net 1.0 论文翻译_第5张图片
其中这里写图片描述是Beta分布中的先验参数,Ns是DEX-NET 1.0数据库中每一个抓取方式被用来评估PF的采样次数。



