文献阅读——Unsupervised Feature Learning for 3D Scene Labeling

机器人自动化领域顶级会议ICRA 2014上的一篇关于Kinect点云标注的文章。文章要解决的问题依然是当前带有人工标注信息的3D点云训练集的匮乏。就标注算法框架而言,本文无太大新意,采用的依然是常见的MRF模型。与之前所看到的关于点云标注的文章不同之处在于,本文作者提取了RGBD图像上的特征和3D点云特征。之所以文章标题带有“Unsupervised Feature Learning”字眼,主要是因为本文的特征学习采用的是sparse coding算法。本文引用了HMP3D,一种分层的sparse coding 算法,学习点云特征。特征学习的框架为sparse coding+CNN,感兴趣的话可以看下Andrew Ng近几年发的一些论文。


本文学习特征时所用的3D数据来自网上的在线3D models,如google warehouse 3d model,主要为感兴趣物体的CAD模型。HMP3D技术同不少文章中用到的sparse coding方法类似。在第一层,先以小的尺度提取块特征,此时用到的特征为底层特征(如法向量、颜色信息等),学习到M个单词的字典,然后再coding每个块得到M长的特征向量,为增强特征的判别性,用3D spatial pyramid max pooling提取3个level 的特征并作L2归一化;在第二层,做法类似第一层,但是以更大的尺度提取块特征,此时用到的特征为中层特征,即每个块关于第一层字典的sparse codes,然后再学习字典,再coding,用3D spatial pyramid max pooling提取3个level 的特征并作L2归一化。最后将两侧特征串在一起形成整个物体的3D特征。

你可能感兴趣的:(max,coding,spatial,标注,pyramid,sparse,点云)