LIVE 预告 | 旷视王剑锋:全卷积网络,可以实现更好的端到端目标检测吗?


目标检测是计算机视觉领域的一个基础研究主题,它利用每张图像的预定义类标签来预测边界框。大多数主流检测器使用的是基于锚的标签分配和非极大值抑制(NMS)等手动设计。近来,很多研究者提出方法通过距离感知和基于分布的标签分类来消除预定义的锚框集。尽管这些方法取得了显著的进展和优越的性能,但抛弃手动设计的 NMS 后处理可能阻碍完全的端到端训练。

 

基于这些问题,研究人员相继提出了 Learnable NMS、Soft NMS 和 CenterNet 等,它们能够提升重复删除效果,但依然无法提供有效的端到端训练策略。之后,Facebook AI 研究者提出的 DETR 将 Transformer 用到了目标检测任务中,还取得了可以媲美 Faster R-CNN 的效果。但是,DETR 的训练时间却大大延长,在小目标上的性能也相对较低。

 

旷视科技研究院BaseDetection组研究员王剑锋和西安交通大学的研究者近期提出了一个新颖问题:全卷积网络是否可以实现良好的端到端目标检测效果?(End-to-End Object Detection with Fully Convolutional Network)并从标签分配和网络架构两个方面回答并验证了这一问题。智源社区特邀请王剑锋研究员就相关内容做报告分享,欢迎大家交流。

报告主题:标签分配与端到端目标检测

报告时间:2021年2月4日(周四)19:00~20:00

报告形式:线上(Zoom + 智源社区Hub直播)

报 告 人 :王剑锋

个人简介:王剑锋,旷视科技研究院BaseDetection组研究员,北京航空航天大学硕士,主要研究方向为计算机视觉中的目标检测。

报告摘要:

标签分配 (label assignment) 是目标检测 (object detection) 至关重要的一个环节,近两年得到了许多的关注与研究。本次报告将分为两个部分,首先试图从一个统一的视角归纳总结常见的几种标签分配策略;其次将讨论标签分配与近期获关注较多的端到端 (end-to-end) 检测的关系,并介绍我们最近在端到端检测上的工作。

报名方式

https://hub.baai.ac.cn/activity/details/130

观看方式:

Zoom观看

https://zoom.com.cn/j/6011507040(无密码)

智源社区Hub直播:(点击【阅读原文】或扫描下方二维码)

欢迎加入知源月旦 Transformer+X 研究组

你可能感兴趣的:(人工智能,深度学习,机器学习,算法,计算机视觉)