【DeepLearning】论文笔记《Learning Hierarchical Features for Scene Labeling》

Farabet C, Couprie C, Najman L, et al. 

[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2013, 35(8):1915-1929.

研究对象: scene parsing

主要内容:设计实现了一个针对单个像素分类的效果更好的scene parsing system ,它包括了能够较好提取数据集特征的【a multi-scale convolutional network】多尺度卷积网络、通过三种分割方式【超级像素、超级像素+CRF(条件随机场)、纯度标准多级分割】对多尺度卷积网络进行监督学习  两部分。

系统是一个具备自主监督学习的卷积网络:

①多尺度卷积网络通过输入较大的背景窗,使用拉普拉斯金字塔得出不同尺度的副本,再将多个副本输入卷积网络,多个单个网络通过共享权重组合成多层网络

②通过分割出的大区域,限制多尺度卷积网络对各个像素分类,对卷积网络的学习进行监督。

根据实验结果,在三个dataset中,系统对于两个取得了record,对其中一个取得了 near-record,成绩喜人。

研究背景:

针对像素的分类,单独看像素周围的小区域可能很难标记。像素的类别可能取决于相对短距离的其他像素的信息,比如人的五官和四肢像素的分类。像素的类别也可能依赖于远程信息,比如无法通过短距离像素判断一个灰色像素属于道路、人行道、灰色小汽车、建筑物 还是 天空。由此可知,只有显示出足够的周围环境,才能让卷积网络的学习得到监督,从而做出明智的决定。



你可能感兴趣的:(【DeepLearning】论文笔记《Learning Hierarchical Features for Scene Labeling》)