计算机视觉学习记录(九):目标检测(上)

文章目录

  • 1. 区域卷积神经网络R-CNN系列
    • 1.1 R-CNN
    • 1.2 SPP-NET
    • 1.3 Fast/faster R-CNN

1. 区域卷积神经网络R-CNN系列

1.1 R-CNN

  • 模型结构
    • 按分类问题对待
      • 模块一:提取物体区域(Region proposal),不同位置、不同尺寸、数量很多·;
      • 模块二:对区域进行分类识别(Classification),CNN分类器,计算量大;
        计算机视觉学习记录(九):目标检测(上)_第1张图片
        计算机视觉学习记录(九):目标检测(上)_第2张图片
        计算机视觉学习记录(九):目标检测(上)_第3张图片
        计算机视觉学习记录(九):目标检测(上)_第4张图片
        计算机视觉学习记录(九):目标检测(上)_第5张图片
        计算机视觉学习记录(九):目标检测(上)_第6张图片
        计算机视觉学习记录(九):目标检测(上)_第7张图片
        计算机视觉学习记录(九):目标检测(上)_第8张图片
        计算机视觉学习记录(九):目标检测(上)_第9张图片
        计算机视觉学习记录(九):目标检测(上)_第10张图片

1.2 SPP-NET

  • R-CNN速度慢的原因之一
    • 卷积特征重复计算量太大,每张图片的~2000区域都会计算CNN特征;
  • 两大改进
    • 直接输入整图,所有区域共享卷积计算;
    • 引入空间金字塔池化;
      计算机视觉学习记录(九):目标检测(上)_第11张图片
      计算机视觉学习记录(九):目标检测(上)_第12张图片
      计算机视觉学习记录(九):目标检测(上)_第13张图片
      计算机视觉学习记录(九):目标检测(上)_第14张图片
      计算机视觉学习记录(九):目标检测(上)_第15张图片
  • SPP-Net问题
    • 继承了R-CNN的剩余问题
      • 需要存储大量特征;
      • 复杂的多阶段训练;
      • 训练时间长
    • 带来了新问题
      • SPP层之前的所有卷积层参数不能FineTune;

1.3 Fast/faster R-CNN

  • 改进
    • 比R-CNN,SPP-Net更快的training/test;
    • 更高的mAP;
    • 实现end-to-end单阶段训练;
    • 所有层的参数都可以fine tune;
    • 不需要离线存储特征文件;
  • 在SPPNet基础上引入两个新技术
    • 感兴趣区域池化层;
    • 多任务损失函数;
      计算机视觉学习记录(九):目标检测(上)_第16张图片
      计算机视觉学习记录(九):目标检测(上)_第17张图片
      计算机视觉学习记录(九):目标检测(上)_第18张图片
      计算机视觉学习记录(九):目标检测(上)_第19张图片
      计算机视觉学习记录(九):目标检测(上)_第20张图片
      计算机视觉学习记录(九):目标检测(上)_第21张图片
      计算机视觉学习记录(九):目标检测(上)_第22张图片

你可能感兴趣的:(计算机视觉,目标检测,学习)