弱监督目标定位综述的理解《Weakly Supervised Object Locolization and Detection : A Survey》

弱监督目标定位综述的理解《Weakly Supervised Object Locolization and Detection : A Survey》

TPAMI最新发布了关于WSOD和WSOL的综述,分享一下阅读论文的一些收获。论文链接link

把论文读薄

作为一篇综述性质的期刊,内容是很丰富的,我们先整体的看一下这篇文章

  1. 文章分为九个部分,以总分总的形式讨论,1,2部分从现状挑战引出了对该领域的划分(3大类8小类),3,4,5部分着重讨论了这三类方法,6,7,8讨论了数据集,应用场景,未来方向,9进行了总结。
  2. 关键的对challenge进行概括时,作者是这样描述的:the learning frameworks not only need to address the typical issues, such as …, encountered in conventional fully supervised object localization and detection task, but also the learning under uncertainty challenges caused by the inconsistency between human annotations and real supervisory signals. 作者在这里总结出相比于监督学习,WSOL和WSOD关键问题在于标注与实际监督的inconsistency
  3. 在对该领域进行分类时,下图可以概括,作者的大类依据实现手段分成三大类,经典模型、基于现成深度模型、深度弱监督学习方法。子类按照各自模型特点进行细分。弱监督目标定位综述的理解《Weakly Supervised Object Locolization and Detection : A Survey》_第1张图片
  4. 第一大类,经典模型,其实就是传统弱监督定位方法,从引用的论文可以看出比较老了,集中在15年以前。一般使用手工特征和DPM检测器。
    弱监督目标定位综述的理解《Weakly Supervised Object Locolization and Detection : A Survey》_第2张图片
  5. 第二大类,现成的深度模型,是我们熟悉的一些网络框架,比如AlexNet,VGG的基础上进行弱监督的检测。从表格看出,论文集中在15-18年
  6. 第三大类,深度弱监督学习,设计用于弱监督定位检测的框架。可以看出这一类的论文比较新18-20的较多。从这里可以感觉出,不仅是方法的分类,也是不同研究潮流的时间划分。应该说,第三大类是被当下重点关注的。
  7. 数据集方面,WSOD常用VOC,WSOL常用ILSVRC和CUB
  8. 应用方面,作者提了四个应用,视频理解显然是应用较多达10篇,艺术图像分析3篇,医学影像9篇,远景图像分析(卫星,航拍)8篇。
  9. 未来方向中,作者认为Multi-Instance Learning, Multi-task learning,Robust Learning Theory,Reinforcement and Adversarial Learning, Prior-guided Deep MIL五个方向是解决方案。这一部分也是文中的重点,引用了很多的文献,工作量不小。不过很多未来方向到底哪个是最光明的呢,这是咱们读者需要思考的,也是切身关系到我们研究的。

重点解读Part1

未完待续

撤销:Ctrl/Command + Z
重做:Ctrl/Command + Y
加粗:Ctrl/Command + B
斜体:Ctrl/Command + I
标题:Ctrl/Command + Shift + H
无序列表:Ctrl/Command + Shift + U
有序列表:Ctrl/Command + Shift + O
检查列表:Ctrl/Command + Shift + C
插入代码:Ctrl/Command + Shift + K
插入链接:Ctrl/Command + Shift + L
插入图片:Ctrl/Command + Shift + G
查找:Ctrl/Command + F
替换:Ctrl/Command + G

合理的创建标题,有助于目录的生成

直接输入1次#,并按下space后,将生成1级标题。
输入2次#,并按下space后,将生成2级标题。
以此类推,我们支持6级标题。有助于使用TOC语法后生成一个完美的目录。

如何改变文本的样式

强调文本 强调文本

加粗文本 加粗文本

标记文本

删除文本

引用文本

H2O is是液体。

210 运算结果是 1024.

Alt

居中的图片: Alt

居中并且带尺寸的图片: Alt

当然,我们为了让用户更加便捷,我们增加了图片拖拽功能。

如何插入一段漂亮的代码片

去博客设置页面,选择一款你喜欢的代码片高亮样式,下面展示同样高亮的 代码片.

// An highlighted block
var foo = 'bar';

生成一个适合你的列表

  • 项目
    • 项目
      • 项目
  1. 项目1
  2. 项目2
  3. 项目3
  • 计划任务
  • 完成任务

创建一个表格

一个简单的表格是这么创建的:

项目 Value
电脑 $1600
手机 $12
导管 $1

设定内容居中、居左、居右

使用:---------:居中
使用:----------居左
使用----------:居右

第一列 第二列 第三列
第一列文本居中 第二列文本居右 第三列文本居左

SmartyPants

SmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如:

TYPE ASCII HTML
Single backticks 'Isn't this fun?' ‘Isn’t this fun?’
Quotes "Isn't this fun?" “Isn’t this fun?”
Dashes -- is en-dash, --- is em-dash – is en-dash, — is em-dash

创建一个自定义列表

Markdown
Text-to- HTML conversion tool
Authors
John
Luke

如何创建一个注脚

一个具有注脚的文本。1

注释也是必不可少的

Markdown将文本转换为 HTML

KaTeX数学公式

您可以使用渲染LaTeX数学表达式 KaTeX:

Gamma公式展示 Γ ( n ) = ( n − 1 ) ! ∀ n ∈ N \Gamma(n) = (n-1)!\quad\forall n\in\mathbb N Γ(n)=(n1)!nN 是通过欧拉积分

Γ ( z ) = ∫ 0 ∞ t z − 1 e − t d t   . \Gamma(z) = \int_0^\infty t^{z-1}e^{-t}dt\,. Γ(z)=0tz1etdt.

你可以找到更多关于的信息 LaTeX 数学表达式here.

新的甘特图功能,丰富你的文章

Mon 06 Mon 13 Mon 20 已完成 进行中 计划一 计划二 现有任务 Adding GANTT diagram functionality to mermaid
  • 关于 甘特图 语法,参考 这儿,

UML 图表

可以使用UML图表进行渲染。 Mermaid. 例如下面产生的一个序列图:

张三 李四 王五 你好!李四, 最近怎么样? 你最近怎么样,王五? 我很好,谢谢! 我很好,谢谢! 李四想了很长时间, 文字太长了 不适合放在一行. 打量着王五... 很好... 王五, 你怎么样? 张三 李四 王五

这将产生一个流程图。:

链接
长方形
圆角长方形
菱形
  • 关于 Mermaid 语法,参考 这儿,

FLowchart流程图

我们依旧会支持flowchart的流程图:

Created with Raphaël 2.2.0 开始 我的操作 确认? 结束 yes no
  • 关于 Flowchart流程图 语法,参考 这儿.

导出与导入

导出

如果你想尝试使用此编辑器, 你可以在此篇文章任意编辑。当你完成了一篇文章的写作, 在上方工具栏找到 文章导出 ,生成一个.md文件或者.html文件进行本地保存。

导入

如果你想加载一篇你写过的.md文件,在上方工具栏可以选择导入功能进行对应扩展名的文件导入,
继续你的创作。


  1. 注脚的解释 ↩︎

你可能感兴趣的:(论文阅读,深度学习,神经网络,机器学习,pytorch)