RGB-D图像识别中的HHA是什么?

深度信息表示:
深度信息在室内场景识别中十分重要,可以显著提高认知水平.一种最简单的方法是把Kinect获得深度的深度图线性重定标到0-255,在输入层中增加一个通道。另一种方法是使用三个通道对深度图重新编码,这三个通道分别是水平视差、高于地面的高度和像素的局部表面与推断重力方向的倾角,
这种编码方式称为HHA。然后把HHA编码得到的3个通道数据线性重定标到0-255,转化为RGB图像。

HHA:

horizontal disparity, height above ground, and the angle the pixel’s local surface normal makes with the inferred gravity direction. 

Gupta[1] 等人提出。所谓HHA即将深度图像转换为三种不同的通道(水平差异,对地高度以及表面法向量的角度)。这种方法取得了非常不错的效果,但是 HHA 编码方法只是在强调每个通道数据之间的互补信息而忽略了各个通道的独立成分,具有一定局限性。

生成HHA的代码见以下网址(需要已生成的HHA图像可以留言):

https://github.com/s-gupta/rcnn-depth

参考文章:

http://www.doc88.com/p-4853561203615.html

https://blog.csdn.net/willwinston/article/details/78723507

你可能感兴趣的:(RGB-D图像识别中的HHA是什么?)