url:https://arxiv.org/abs/1411.5878
1.显著性检测的用途:根据显著性特征(空间域、频域等
),快速有效地提取场景中有用的区域(目标区域等)进行进一步分析(显著性目标检测),如object proposal generation, generic scene segmentation, saliency for fixation prediction.
2.显著性检测的过程:1)检测明显物体;2)分割该物体准确区域。
3.显著性检测的评价指标:1)良好的检测:丢失真实的显着区域并错误地将背景标记为显着区域的可能性要小;2)高分辨率:显着图应具有高分辨率或全分辨率,以准确地定位显着对象并保留原始图像信息;3)计算效率:作为其他复杂过程的前端,这些模型应快速检测出显着区域
回归本文目的:显着物体检测模型通常旨在仅检测场景中最显着的物体,并分割这些物体,另一方面,是对人类注意点的预测。这两种方法,共同的地方是输出一个显著图,图中数值越高,受关注程度越高。
第一波显著性模型:
基于中心周围机制的自下而上注意的心理学理论
L. Itti, C. Koch, and E. Niebur, “A model of saliency-based visual attention for rapid scene analysis,” IEEE TPAMI, no. 11,
pp. 1254–1259, 1998.
第二波:
显著性检测问题定义为二值分割问题。
T. Liu, J. Sun, N. Zheng, X. Tang, and H.-Y. Shum, “Learning to detect a salient object,” in CVPR, 2007, pp. 1–8.
T. Liu, Z. Yuan, J. Sun, J. Wang, N. Zheng, X. Tang, and H.-Y. Shum, “Learning to detect a salient object,” IEEE TPAMI,
vol. 33, no. 2, pp. 353–367, 2011.
R. Achanta, F. Estrada, P. Wils, and S. S ¨ usstrunk, “Salient region detection and segmentation,” in Comp. Vis. Sys., 2008.
第三波:
基于卷积神经网络
J. Long, E. Shelhamer, and T. Darrell, “Fully convolutionalnetworks for semantic segmentation,” in CVPR, 2015, pp.
3431–3440.
逐像素中心环绕对比度
缺点:高对比度的边缘通常会突出而不是突出物体、突出物体的边界无法很好地保留
加入先验条件,颜色先验区域、中心先验等,多种先验条件融合,使其能适应更复杂的环境
低秩为背景,可用PCA提取分量占比大的认为是背景。
利用区域对比突出显著性
外在提示可以从训练图像,相似图像,视频序列,一组包含公共显着物体的输入图像,深度图或光场图像的标注信息中得出。
相似的图像可以很好地逼近背景区域,而显着区域可能无法很好地近似。
用边框信息来定位或分割显著目标。
显著目标转化为是否存在显著目标的二值分类问题。
s =wTf
有监督式vs无监督式
CNN-based -MLPs with two layers
FCN-based 全卷积网络考虑像素级别的操作来克服由全连接层所引起的问题,例如在显着对象边界附近的模糊性和不准确的预测。
FCN-based 利用深层信息和浅层信息(语义信息和细节信息)
倾向于FCN-based模型
对象检测和识别[181]-[187],图像和视频压缩[188],[189],视频摘要[190]-[192],照片拼贴/媒体重新定位/裁剪/缩略图钉钉[ 175],[193],[194],图像质量评估[195]-[197],图像分割[198]-[201],基于内容的图像检索和图像收集浏览[178],[202]-[ 204],图像编辑和操作[41],[176],[179],[180],视觉跟踪[205]-[211],对象发现[212],[213]和人机交互[214] ],[215]。
MSRA-A and MSRA-B
ASD [37] and DUT-OMRON [97]
显著图的二值化:有以下2种:
1.
2.GrabCut-like algorith
5种常用指标
1)Precision-recall (PR).
2)F-measure
3) Receiver operating characteristics (ROC) curve
4)Arear under ROC curve (AUC).
5)Mean absolute error (MAE).
(Some remaining questions include: how many (salient)
objects are necessary to represent a scene? does map
smoothing affect the scores and model ranking? how is
salient object detection different from other fields? what is
the best way to tackle the center bias in model evaluation?
and what is the remaining gap between models and humans?)
Don’t ask what segments can do for you, ask what you can do for the segments.
— Jitendra Malik.