计算机视觉与深度学习第八章:视觉识别

本文按照北京邮电大学计算机学院鲁鹏老师的计算机视觉与深度学习课程按章节进行整理,需要的同学可借此系统学习该课程详尽知识~


第八章 视觉识别

  • 视觉识别任务分类
  • 语义分割
    • 语义分割定义
    • 语义分割思路
      • 1.滑动窗口
      • 2.全卷积
        • 全卷积优化
          • 1)反池化操作: Unpooling
          • 2)反池化操作: Max Unpooling
          • 3)转置卷积:Transpose Convolution
  • 目标检测
    • 目标检测定义
    • 目标检测类别
      • 1.单目标检测
      • 2.多目标检测
        • CNN
        • R-CNN
        • Fast R-CNN
        • Faster R-CNN
    • 目标检测总结
  • 实例分割
    • 实例分割定义
    • 实例分割思路
      • Mask R-CNN


视觉识别任务分类

计算机视觉与深度学习第八章:视觉识别_第1张图片
分类任务前面章节已有介绍,本节不再赘述。

语义分割

语义分割定义

计算机视觉与深度学习第八章:视觉识别_第2张图片

语义分割思路

1.滑动窗口

计算机视觉与深度学习第八章:视觉识别_第3张图片

2.全卷积

计算机视觉与深度学习第八章:视觉识别_第4张图片

全卷积优化

计算机视觉与深度学习第八章:视觉识别_第5张图片

1)反池化操作: Unpooling

计算机视觉与深度学习第八章:视觉识别_第6张图片

2)反池化操作: Max Unpooling

计算机视觉与深度学习第八章:视觉识别_第7张图片

3)转置卷积:Transpose Convolution

回顾卷积操作
计算机视觉与深度学习第八章:视觉识别_第8张图片
转置卷积操作
计算机视觉与深度学习第八章:视觉识别_第9张图片
重叠区域求和一维示例
计算机视觉与深度学习第八章:视觉识别_第10张图片

目标检测

目标检测定义

计算机视觉与深度学习第八章:视觉识别_第11张图片

目标检测类别

1.单目标检测

计算机视觉与深度学习第八章:视觉识别_第12张图片

2.多目标检测

计算机视觉与深度学习第八章:视觉识别_第13张图片

CNN

计算机视觉与深度学习第八章:视觉识别_第14张图片

R-CNN

计算机视觉与深度学习第八章:视觉识别_第15张图片

Fast R-CNN

计算机视觉与深度学习第八章:视觉识别_第16张图片
重点知识
区域裁剪:ROI Pool
计算机视觉与深度学习第八章:视觉识别_第17张图片
区域裁剪:ROI Align
计算机视觉与深度学习第八章:视觉识别_第18张图片

Faster R-CNN

计算机视觉与深度学习第八章:视觉识别_第19张图片
计算机视觉与深度学习第八章:视觉识别_第20张图片

重点知识
区域建议:Region Proposal Network
计算机视觉与深度学习第八章:视觉识别_第21张图片
计算机视觉与深度学习第八章:视觉识别_第22张图片
问题:是否必须采用两个阶段范式完成目标检测?

一阶段目标检测: YOLO / SSD / RetinaNet
计算机视觉与深度学习第八章:视觉识别_第23张图片

目标检测总结

计算机视觉与深度学习第八章:视觉识别_第24张图片
计算机视觉与深度学习第八章:视觉识别_第25张图片

实例分割

实例分割定义

计算机视觉与深度学习第八章:视觉识别_第26张图片

实例分割思路

Mask R-CNN

计算机视觉与深度学习第八章:视觉识别_第27张图片
计算机视觉与深度学习第八章:视觉识别_第28张图片

附:Open Source Frameworks

TensorFlow DetectionAPI:Faster RCNN, SSD, RFCN, Mask R-CNN

Caffe2 Detectron:Mask R-CNN, RetinaNet, Faster R-CNN, RPN, Fast R-CNN, R-FCN

你可能感兴趣的:(计算机视觉与深度学习之旅,计算机视觉,深度学习,cnn)