2018 VALSE 视觉盛宴-总结笔记

Pixel Level Image Understanding

Question:1 get ride of user annotation process ;2 learn from web.

category-agnostic cues:1 显著性检测; 2 边缘检测; 3 over-segmentation,无语义标签,类似超像素,将图像分成多个区域,区域数目不固定。

(关于 Deep embedding learning 

《Deep Embedding Learning for Efficient Image Segmentation》



plug-in思想。将超像素特征表示通过卷积学习出来,然后计算距离,合并近距离超像素。)

key-words----web search-----low level cues-------NFM-----training(相关论文《Learning

Semantic Segmentation from Web Searches》)

解决人工标注数据难获得的一个思路。更接近于人的行为,即通过‘网上搜索相关资料归纳总结’并变成自己的知识。

一个挑战就是噪声抑制、显著区域的获取。比如对于人来说,不知道什么是狍子,上网搜索关键词“狍子”,百度会给出一系列图片,我们的关注点首先是占图片面积较大的动物。然后我们会根据经验排除背景区域。又通过大量数据的重复区域,判定什么是狍子。然后才会细致观察总结狍子长什么样子。

所以,对于显著区域获取:占面积较大,类别先验,背景先验,多张图片重复区域。

另外,一个启发,基于深度指导的显著区域获取。

关于弱监督,定位和语义分割

image level to pixel level 对抗擦除

《Object Region Mining with Adversarial Erasing: A Simple Classification to

Semantic Segmentation Approach》

循环擦除思想

王兴刚--弱监督,区域增长

种子通过学习得到

思考:1 分析图像的内在结构

           2 什么是一个物体?

董超 craft a toolchain

关于图像增强。由于同一张图像可能需要多个角度的增强:去噪,去模糊,对比度、饱和度调节等

通过设计一个工具箱,每次评估图像质量,根据图像质量自动选择 一种工具进行处理。

联合训练???

关于主动学习(Active Learning)

学习博客:https://www.jianshu.com/p/42801f031cfa

高新波--异质图像合成与识别

启发:画像追凶>>>根据画像合成照片再进行检索

一种监督方式:近邻重叠区域,差别越小越好



感悟关键词:显著性检测,特征表示,无人驾驶,视频理解

你可能感兴趣的:(2018 VALSE 视觉盛宴-总结笔记)