应用霍夫森林预测下一个最佳视角:Recovering 6D Object Pose and Predicting Next-Best-View in the Crowd—2016(笔记)

应用霍夫森林预测下一个最佳视角:Recovering 6D Object Pose and Predicting Next-Best-View in the Crowd—2016(笔记)

恢复6D物体姿态,在复杂环境预测下一个最佳视角

文章利用霍夫森林作为潜在分类器实现6D目标检测,以不确定性(熵)减少的方式,将姿态估计问题转换为最佳视角问题,最后以假设检验和联合配准(joint registration and hypotheses verification)进行姿态优化。应用霍夫森林预测下一个最佳视角:Recovering 6D Object Pose and Predicting Next-Best-View in the Crowd—2016(笔记)_第1张图片
关键点匹配、模板匹配、基于小块或像素的特征,以及随机森林分类器等方法,依赖人工设计特征。

点对点方法[10,26]形成另一个代表性类别,其中强调构建点对特征以基于点云构建对象模型。

文章选择多视角匹配预测法,核心在于寻找最佳视角 (熵减少)

2016最先进的霍夫森林特征在文献中,一些最新的6D物体检测方法使用霍夫森林作为其潜在的分类器。

摘要

  1. 文章提出基于单一镜头的6D物体姿态估计和基于霍夫森林的次最佳视图预测的完整框架,霍夫森林是联合执行分类和回归的最先进的物体姿态估计器。
  2. 我们不是使用手动设计的特征,而是a)使用稀疏自动编码器提出从深度不变的补丁中学习的无监督特征,并且b)提供对各种最新特征的广泛评估。
  3. 此外,利用在霍夫森林的叶节点中执行的聚类,我们学会估计其他视图中不确定性的减少,从而制定选择下一个最佳视图的问题。
  4. 为了进一步改进姿态估计,我们提出了一种改进的联合配准和假设验证模块作为拒绝错误检测的最终改进步骤。

引言

  1. 上述观察促使我们基于Hough Forests(一种随机森林的变体,共同执行分类和回归)以单一方式引入基于单镜头的6D物体姿态估计和下一个最佳视图预测的完整框架[31]。
  2. 我们采用了基于补丁的方法,但与[14,31,5]相反,我们使用深度稀疏自动编码器以无监督的方式学习特征。学习的特征被馈送到霍夫森林[12],以使用6D霍夫投票确定对象类别和姿势。
  3. 为了估计下一个最佳视图,我们利用Hough Forests的能力来计算叶节点处的假设熵,即不确定性。使用此属性,我们可以通过对象 - 姿势 - 叶子映射基于当前视图假设来预测下一个最佳视点。我们还考虑了在下一个最佳视图估计期间可能从其他视图中出现的各种遮挡。
  4. 最后,为了进一步减少误报,我们引入了一个受[1]启发的改进的联合优化步骤。据我们所知,在基于补丁的推理策略中,没有其他框架联合处理特征学习,分类,回归和聚类(用于下一个最佳视图)。

主要贡献

  1. 完整的6 DoF对象检测框架,包括:a)基于稀疏自动编码器的架构,用于无监督特征学习; b)用于姿态估计的6D Hough投票方案; c)基于Hough Forests的新型主动视觉技术,用于估计下一个最佳视角。
  2. 对几个公共数据集的功能和检测方法进行广泛评估。
  3. 一个新的RGB-D图像数据集反映了两种使用场景,一种代表家庭环境,另一种是工业环境中的二次拾取场景。我们提供对象的3D模型,据我们所知,我们提供了第一个完全注释的拾取数据集。

6DoF目标姿势和Next最佳视图估计框架

  1. 我们的物体检测和姿态估计框架包括两个主要部分:a)基于单一镜头的6D物体检测和b)次最佳视图估计。
  2. 在第一部分中,我们渲染训练对象并提取深度不变的RGB-D补丁,作为稀疏自动编码器的输入,该稀疏自动编码器以无监督的方式学习特征向量。使用此特征表示,我们训练霍夫森林以根据类和6D姿势(平移和旋转)识别对象patch。给定测试图像,来自场景的patch通过自动编码器,然后是霍夫森林,其中叶节点在6D霍夫空间中投票以指示对象的存在。这个空间的模式代表了我们最好的目标假设。
  3. 第二部分,次最佳视图估计,基于先前训练的森林。使用叶节点中的训练样本分布,我们能够确定当前假设的不确定性,即熵,并且当使用姿势到叶映射将相机移动到另一个视点时进一步估计熵的减少。
    应用霍夫森林预测下一个最佳视角:Recovering 6D Object Pose and Predicting Next-Best-View in the Crowd—2016(笔记)_第2张图片

你可能感兴趣的:(姿态估计,计算机视觉,霍夫森林,下一个最佳视角)