视频学习--《 图像语义分割前沿进展》

《 图像语义分割前沿进展》-程明明

视频链接

  • 图像语义分割技术面临的挑战:大小各异、形状复杂、环境多变、类别众多

  • 计算机视觉发展------多尺度视角

  • 相关论文

    • Res2Net:A New Multi-scale Backbone Architecture(分层递进残差网络)

      富尺度空间的深度神经网络通用架构

      视频学习--《 图像语义分割前沿进展》_第1张图片

      左图为经典的ResNet的结构,有一定的多尺度表达能力,但在一定程度上是不够的。右图在此结构上将输入分为四组,更好的提取不同尺度信息的能力。可以与其它结构相兼容:

      视频学习--《 图像语义分割前沿进展》_第2张图片

      应用:图像分类、物体检测、激活图预测、显著性检测、语义分割、实例分割、关键点估计、交互式分割、全景分割等

      人工设计vs.NAS:限定搜索空间、硬件适配难

    • Strip Pooling(带状池化)模块-----自适应池化

      视频学习--《 图像语义分割前沿进展》_第3张图片

      对于输入的feature做横向和竖向的strip pooling,经过复制得到和原图大小一样的特征表达,再做fusion,最后经过卷积、sigmoid得到output。一个方向上建立long range connection,同时在另一个方向上保持local context。

你可能感兴趣的:(视频学习--《 图像语义分割前沿进展》)