Shallow and Deep Convolutional Networks for Saliency Prediction

CVPR 2016
Shallow and Deep Convolutional Networks for Saliency Prediction
CNN网络 用于 显著性预测

开源代码 : https://github.com/imatge-upc/saliency-2016-cvpr

本文针对显著性预测问题,提出了两个CNN网络,一个小的模型,一个较深的模型。

视觉显著性指智能算法通过模拟人的视觉特点,标注出图片中的显著区域(算法认为的人类感兴趣的区域)。如下图所示:
Shallow and Deep Convolutional Networks for Saliency Prediction_第1张图片

当前CNN网络在计算机视觉各个领域大行其道,很自然的想将其应用于显著性检测,但是与图像分类问题相比较,显著性检测问题有其独特性:
1)大量训练数据问题,显著性检测训练数据的标记更繁琐。所幸最近有两个相关的数据库被公布。解决了训练数据问题
2)显著性检测问题需要输出每个像素的saliency score。也就是说我们CNN网络最后的输出和原始图像尺寸一样大小。

3 Shallow Convnet

Shallow and Deep Convolutional Networks for Saliency Prediction_第2张图片

这里我们采用了各种策略防止模型过拟合。

4 Deep Convnet

Shallow and Deep Convolutional Networks for Saliency Prediction_第3张图片

这里一共10层,前三层网络使用 VGG预训练的参数。
这里我们经过各种尝试发现:
1)加入更多网络层可以提高精度
2)每个网络层使用更多的特征maps 同样提高精度
3) 使用 dropout 正定没有显著提高精度,但是增加了训练时间。

最终的网络设计主要受一下因素影响: 输入图像尺寸,网络层数, GPU内存。

Shallow and Deep Convolutional Networks for Saliency Prediction_第4张图片

Shallow and Deep Convolutional Networks for Saliency Prediction_第5张图片

Shallow and Deep Convolutional Networks for Saliency Prediction_第6张图片

Shallow and Deep Convolutional Networks for Saliency Prediction_第7张图片

你可能感兴趣的:(ZJ,CVPR,2016,深度学习)