计算机视觉与深度学习第五章:图像基础操作

本文按照北京邮电大学计算机学院鲁鹏老师的计算机视觉与深度学习课程按章节进行整理,需要的同学可借此系统学习该课程详尽知识~


第五章 图像基础操作

  • 一、图像噪声
    • 噪声分类
  • 二、卷积
    • 卷积定义
    • 卷积性质
    • 卷积示例
    • 卷积去噪
      • 平均卷积核
      • 高斯卷积核
      • 中值滤波器
  • 三、边缘提取
    • 边缘检测
    • 噪声影响
      • 1.平滑
      • 2.高斯一阶偏导卷积核
    • Canny边缘检测器
      • 1.用高斯一阶偏导核卷积图像
      • 2.计算每个点的梯度幅值和方向
      • 3.非极大值抑制
      • 4.连接与阈值(滞后)
  • 四、纹理表示
    • 纹理类别
    • 基于卷积核组的纹理表示方法
  • 五、图像增强


一、图像噪声

噪声分类

计算机视觉与深度学习第五章:图像基础操作_第1张图片

二、卷积

卷积定义

计算机视觉与深度学习第五章:图像基础操作_第2张图片

卷积性质

计算机视觉与深度学习第五章:图像基础操作_第3张图片

卷积示例

计算机视觉与深度学习第五章:图像基础操作_第4张图片
锐化解释
计算机视觉与深度学习第五章:图像基础操作_第5张图片

卷积去噪

平均卷积核

计算机视觉与深度学习第五章:图像基础操作_第6张图片
平均卷积核存在的问题及解决方法
计算机视觉与深度学习第五章:图像基础操作_第7张图片

高斯卷积核

计算机视觉与深度学习第五章:图像基础操作_第8张图片

  • 如何设置卷积核尺寸?
    计算机视觉与深度学习第五章:图像基础操作_第9张图片
    大方差或者大尺寸卷积核平滑能力强
    小方差或者小尺寸卷积核平滑能力弱
    经验法则: 将卷积核的半窗宽度设置为 3,最终卷积模板尺寸为2 × 3 + 1

  • 如何设置高斯函数的标准差?
    标准差设置成1, 卷积模板宽度=2x3x1 + 1 = 7
    计算机视觉与深度学习第五章:图像基础操作_第10张图片

  • 高斯卷积核可分离性质:可分解为两个一维高斯的乘积
    计算机视觉与深度学习第五章:图像基础操作_第11张图片
    计算机视觉与深度学习第五章:图像基础操作_第12张图片

中值滤波器

计算机视觉与深度学习第五章:图像基础操作_第13张图片
计算机视觉与深度学习第五章:图像基础操作_第14张图片
总结:三种类型的噪声中,椒盐噪声、脉冲噪声建议使用中值滤波器,对于高斯噪声可以使用高斯卷积核来进行去噪。

三、边缘提取

  1. 为什么要研究边缘?
    编码图像中含有大量的语义与形状信息
    相对于像素表示,边缘表示显然更加紧凑
  2. 边缘的种类
    计算机视觉与深度学习第五章:图像基础操作_第15张图片
  3. 边缘检测目标
    计算机视觉与深度学习第五章:图像基础操作_第16张图片

边缘检测

检测图像中亮度明显而急剧变化的地方
计算机视觉与深度学习第五章:图像基础操作_第17张图片
图像求导                    图像偏导                    图像梯度
计算机视觉与深度学习第五章:图像基础操作_第18张图片

噪声影响

计算机视觉与深度学习第五章:图像基础操作_第19张图片

1.平滑

计算机视觉与深度学习第五章:图像基础操作_第20张图片

2.高斯一阶偏导卷积核

计算机视觉与深度学习第五章:图像基础操作_第21张图片
高斯核 vs高斯一阶偏导核
计算机视觉与深度学习第五章:图像基础操作_第22张图片

Canny边缘检测器

1.用高斯一阶偏导核卷积图像

2.计算每个点的梯度幅值和方向

计算机视觉与深度学习第五章:图像基础操作_第23张图片

3.非极大值抑制

计算机视觉与深度学习第五章:图像基础操作_第24张图片

4.连接与阈值(滞后)

计算机视觉与深度学习第五章:图像基础操作_第25张图片
双阈值

  1. 定义两个阈值:低和高
  2. 先使用高阈值开始边缘曲线,使用低阈值继续边缘曲线
    计算机视觉与深度学习第五章:图像基础操作_第26张图片

四、纹理表示

纹理类别

计算机视觉与深度学习第五章:图像基础操作_第27张图片

基于卷积核组的纹理表示方法

  1. 利用卷积核组提取图像中的纹理基
    计算机视觉与深度学习第五章:图像基础操作_第28张图片
  2. 利用卷积核组对图像进行卷积操作获得对应的特征响应图组
    计算机视觉与深度学习第五章:图像基础操作_第29张图片
  3. 利用特征响应图的某种统计信息来表示图像中的纹理。
    计算机视觉与深度学习第五章:图像基础操作_第30张图片
    当我们忽略基元位置,只关注出现了哪种基元对应的纹理以及基元出现的频率时,可以得到如下信息:
    计算机视觉与深度学习第五章:图像基础操作_第31张图片

卷积核组设计

  • 卷积核类型(边缘、条形以及点状)
  • 卷积核尺度(3-6个尺度)
  • 卷积核方向(6个角度)
    计算机视觉与深度学习第五章:图像基础操作_第32张图片

五、图像增强

数据增强:是从现有的训练样本中生成更多的训练数据,其方法是利用多种能够生成可信图像的随机变换来增加样本。
数据增强的目标:模型在训练时不会两次查看完全相同的图像。这让模型能够观察到数据的更多内容,从而具有更好的泛化能力。
计算机视觉与深度学习第五章:图像基础操作_第33张图片


你可能感兴趣的:(计算机视觉与深度学习之旅,计算机视觉,深度学习,图像处理)