【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】4. 图像分割&目标检测

计算机视觉识别任务

1. 语义分割

  • 语义分割思路
    1)滑动窗口
    【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】4. 图像分割&目标检测_第1张图片
    但是这种方法效率太低了,重叠区域反复被计算
    2)全卷积
    【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】4. 图像分割&目标检测_第2张图片
    但是,如果处理过程中保持原始分辨率,对于显存的需求会非常庞大…
    解决方案
    【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】4. 图像分割&目标检测_第3张图片
    上采样?
    【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】4. 图像分割&目标检测_第4张图片
    第二种方法还原的位置可能不对,引入index pooling方法,如下
    【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】4. 图像分割&目标检测_第5张图片
    可学习的上采样:转置卷积
    【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】4. 图像分割&目标检测_第6张图片
    【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】4. 图像分割&目标检测_第7张图片
    例子
    【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】4. 图像分割&目标检测_第8张图片
    【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】4. 图像分割&目标检测_第9张图片
    左边下采样,右边上采样
    【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】4. 图像分割&目标检测_第10张图片

2. 目标检测

1)单目标(分类+定位)
【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】4. 图像分割&目标检测_第11张图片
2) 目标检测:多目标
【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】4. 图像分割&目标检测_第12张图片
CNN利用滑动窗口对图像中所有可能的区域进行分类,计算量巨大!!

后来改进,用区域建议Selective Search选取候选框

有了R - CNN
【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】4. 图像分割&目标检测_第13张图片
改进之后,有了Fast-RCNN

【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】4. 图像分割&目标检测_第14张图片
Fast-RCNN能实现端对端的网络,其中最主要的贡献就是在裁剪+缩放特征部分实现可导,ROI Pooling

你可能感兴趣的:(深度学习,计算机视觉,深度学习,音视频)