视觉显著性检测(Visual saliency detection)指通过智能算法模拟人的视觉特点,提取图像中的显著区域(即人类感兴趣的区域)。
视觉注意机制(Visual Attention Mechanism,VA),即面对一个场景时,人类自动地对感兴趣区域进行处理而选择性地忽略不感兴趣区域,这些人们感兴趣区域被称之为显著性区域。如图所示,当看到这幅图像时,图中的四个人最能引起人的注意。
人类视觉注意机制有两种策略:
利用图像的颜色、亮度、对比度、边缘等特征表示,判断目标区域和它周围像素的差异,进而计算图像区域的显著性。
把方向,颜色,亮度等特征进行了融合,通过融合特征的对比度得到了一张灰度图,灰度图中的灰度值代表像素点属于显著区域的概率。
无论是基于局部对比度还是基于全局对比度,基于对比度的方法仍然有缺陷,如显著区域内部会发生衰减
研究图像中的背景应该具有怎样的性质。如果能清楚的知道背景的性质,就可以得到图像中的背景,近而找到前景。
有效编码假设,该假设可以有效的消除了输入中的冗余。有效编码假设认为,图像可以被分解为两个部分,一个部分是新颖的,另一个部分是已知的。
受到有效编码假设的启发,认为图像显著区域检测问题中可以把显著区域视为新颖的部分,背景部分可以视为已知的部分。求出图像对数谱和幅度谱并除去幅度谱的冗余分量,利用原图像和冗余谱得到图像显著区域的残差谱。
研究者们希望把尽可能多的显著区域检测的先验加入到显著性检测算法中,认为显著区域检测方法分为基于全局的方法和基于局部的方法。但是这两种方法都存在缺陷。人类视觉系统皮层在观察物体时是先中心后周围的。同时人类对于局部的,对比度比较高的区域比较敏感。提出了一种结合全局与局部特征的显著区域检测方法[
由人的“认知因素” 决定, 从高层视觉信息入手,比如知识、预期和当前的目标.对图像的特定特征来计算图像区域的显著性。监控任务下, 场景中的人体能引起注意。
近年来研究者们在特征综合理论和Guided search等注意的心理学模型基础上, 提出了大量的可计算的注意力选择模型,以用于模拟人类的视觉注意机制。这些模型包括: 基于认知、贝叶斯、决策论、信息论、图模型、频域分析、基于模式分类、基于CNN的等人视觉注意模型。
几乎所有模型都直接或间接地受认知模型启发而来,其一大特点是与心理学和神经学相结合。Itti模型(使用三个特征通道:颜色、属性、方向)是这一类模型的代表,也是后来很多衍生模型的基础
本质是最大化来自所处视觉环境的信息,其中最有影响力的模型是AIM模型。
典型模型有:基于图论的视觉显著性(Graph-based Visual Saliency , GBVS)模型等
在G 上定义一个马尔科夫链,当一个节点与其邻域节点特征差异性较大时,那么将在这个节点上停留更长时间,基于停留时间可以计算出A中每个节点的响应值。
基于频谱分析的显著性模型,形式简洁,易于解释和实现,并且在注意焦点预测和显著区域检测方面取得了很大的成功,但其生物合理性不是非常清楚。经典模型有:频谱残差的显著性检测模型(纯数学计算方法)。
https://www.cnblogs.com/ariel-dreamland/p/8919541.html
https://blog.csdn.net/tyq101010/article/details/48626995
超分割是指根据一定的规则把图像分成若干个小块。后续的算法通常会对超像素而不是像素点进行操作。
https://blog.csdn.net/zhj_matlab/article/details/52986700
(1) 精确召回(PR)。首先将显著图S转化为二进制掩码M,然后通过将M与地面真值G进行比较来计算Precission和Recall:
(2) F值:通常Precission和Recall都不能完全评估显著图的质量,为此提出F值作为Precission和Recall的非负权重的集权跳河平均:
(3) ROC(Receiver Operating Characteristic)曲线:是以假正率(FP_rate)和假负率(TP_rate)为轴的曲线
(4)ROC曲线下面积(AUC):AUC越大性能越好
https://blog.csdn.net/l1l2l3q1q2q3/article/details/70056132?utm_medium=distribute.pc_relevant.none-task-blog-baidujs-2
https://blog.csdn.net/cai13160674275/article/details/72991049?utm_medium=distribute.pc_relevant.none-task-blog-baidujs-2
https://blog.csdn.net/tyq101010/article/details/48626955?utm_medium=distribute.pc_relevant.none-task-blog-baidujs-1
https://www.cnblogs.com/CCBB/archive/2011/05/19/2051442.html
https://blog.csdn.net/gbyy42299/article/details/79427457
https://mmcheng.net/bing/
BING: Binarized Normed Gradients for Objectness Estimation at 300fps