论文准备

目录导航

  • 关键词
  • 论文准备
    • 1 图像滤波算法
      • 1.1 算法原理
      • 1.2 算法特点优势
      • 1.3 算法应用
      • 1.4 参考博客
    • 2 基于深度学习的语义分割算法
      • 2.1 算法原理
      • 2.2 算法特点优势
      • 2.3 算法应用
      • 2.4 参考博客
    • 3 边缘检测算法
      • 3.1 算法原理
      • 3.2 算法特点优势
      • 3.3 算法应用
      • 3.4 参考博客

关键词

机器人、算法、视觉、深度学习

论文准备

1 图像滤波算法

1.1 算法原理

  • 滤波算法,可以理解成一种过滤算法,就像我们筛选产品时,把次品去除掉,只留下合格的产品。而在图像处理中的滤波算法中,处理的对象是图像,除了去除掉图像中不想要的像素点的值(如去除噪声),还可以加强图像中我们需要研究一些内容(如边缘提取)。
  • 这里所讲的算法都是针对图像空间的滤波算法,其中模板,可以理解为图像形态学中的结构元素,是用来选取图像中的那些像素点被用来操作的。空间滤波根据其功能划分为平滑滤波和锐化滤波。平滑滤波:能减弱或者消除图像中高频率分量,但不影响低频率分量,在实际应用中可用来消除噪声。锐化滤波:与平滑滤波相反,能减弱或者消除图像中低频率分量,但不影响高频率分量,可使图像反差增加,边缘明显。实际应用可用于增强被模糊的细节或者目标的边缘。
    论文准备_第1张图片
  • 图像滤波可以通过公式:O(i,j)=∑m,nI(i+m,j+n)∗K(m,n);其中K为滤波器,在很多文献中也称之为核(kernel);其中又细分为:均值滤波、中值滤波、高斯滤波、双边滤波
  • 滤波器:
    论文准备_第2张图片

1.2 算法特点优势

  • 不同种滤波的优缺点:https://blog.csdn.net/sceart/article/details/54896657
  • matlab下不同滤波对比:https://blog.csdn.net/EbowTang/article/details/41081895?utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2aggregatepagefirst_rank_v2~rank_aggregation-7-41081895.pc_agg_rank_aggregation&utm_term=%E5%9B%BE%E5%83%8F%E6%BB%A4%E6%B3%A2%E7%AE%97%E6%B3%95%E5%AF%B9%E6%AF%94&spm=1000.2123.3001.4430

1.3 算法应用

  • 常见的应用包括去噪、图像增强、检测边缘、检测角点、模板匹配等。

1.4 参考博客

  • 空间增强滤波技术——https://blog.csdn.net/swj110119/article/details/51321109?utm_medium=distribute.pc_feed_404.none-task-blog-BlogCommendFromBaidu-3.nonecase&depth_1-utm_source=distribute.pc_feed_404.none-task-blog-BlogCommendFromBaidu-3.nonecas
  • 多种滤波——https://blog.csdn.net/jiang_ming_/article/details/82594261?utm_medium=distribute.pc_feed_404.none-task-blog-BlogCommendFromBaidu-2.nonecase&depth_1-utm_source=distribute.pc_feed_404.none-task-blog-BlogCommendFromBaidu-2.nonecas
  • C++实现——https://blog.csdn.net/HaisHa1/article/details/105799351?utm_medium=distribute.pc_feed_404.none-task-blog-BlogCommendFromBaidu-8.nonecase&depth_1-utm_source=distribute.pc_feed_404.none-task-blog-BlogCommendFromBaidu-8.nonecas
  • 滤波器和paddling——https://blog.csdn.net/blogshinelee/article/details/104256194?utm_medium=distribute.pc_feed_404.none-task-blog-BlogCommendFromBaidu-5.nonecase&depth_1-utm_source=distribute.pc_feed_404.none-task-blog-BlogCommendFromBaidu-5.nonecas

2 基于深度学习的语义分割算法

2.1 算法原理

  • 图像分割是许多视觉理解系统的重要组成部分。它包括将图像(或视频帧)分割成多个片段或对象。分割在医学图像分析(例如,肿瘤边界提取和组织体积测量),自主载体(例如,可导航表面和行人检测),视频监控,和增强现实起到了非常重要的作用。文献中已经开发了许多图像分割算法,从最早的方法,如阈值化、基于直方图的方法、区域划分、k-均值聚类、分水岭,到更先进的算法,如活动轮廓、基于Graph的分割、马尔可夫随机场和稀疏方法。然而,在过去的几年里,深度学习网络已经产生了新一代的图像分割模型,其性能得到了显著的提高——通常在流行的基准上达到了最高的准确率——这导致了许多人认为是该领域的范式转变。
  • 图像分割可以表述为带有语义标签的像素分类问题(语义分割)单个对象分割问题(实例分割)。语义分割对所有图像像素使用一组对象类别(如人、车、树、天空)进行像素级标记,因此通常比预测整个图像的单个标签的图像分类困难。实例分割通过检测和描绘图像中的每个感兴趣对象(例如,个体的分割),进一步扩展了语义分割的范围。
    论文准备_第3张图片
  • 编码器/解码器(encoder/decoder)结构,其中我们先对输入进行下采样(downsample),得到较低分辨率的特征映射,其学习到了如何高效地区分各个类,然后对这些特征进行上采样(upsample)以得到一个全分辨率分割图。论文准备_第4张图片
  • 转置卷积、全卷积网络、添加短路连接、高级的U-Net变体、空洞卷积…

2.2 算法特点优势

  • 缺点:在整个网络中维持图像原始维度计算成本很高(可以通过通过池化或跨步卷积(即压缩空间分辨率)周期性地对特征图进行下采样来减轻计算负载)
  • 语义分割面临语义和位置之间的内在矛盾:全局信息解决的是“是什么”问题,而局部信息解决的是“在哪里”的问题……结合细粒度层和粗粒度层使模型能在全局信息下做出局部预测。

2.3 算法应用

自动驾驶、影像诊断

2.4 参考博客

  • 卷积方法和损失函数
  • 更全的解读(写文时还看不懂)

3 边缘检测算法

3.1 算法原理

  • 边缘:指图像在某一局部强度剧烈变化的区域。强度变化一般有两种情况:阶跃变化、屋顶变化。
  • 边缘检测的任务:找到具有阶跃变化或者屋顶变化的像素点的集合。
  • 边缘检测基本原理:既然边缘是灰度变化最剧烈的位置,最直观的想法就是求微分
    对于第一种情况:一阶微分的峰值为边缘点,二阶微分的零点为边缘点。
    对于第二种情况:一阶微分的零点为边缘点,二阶微分的峰值为边缘点。
  • 也可用差分:使差分的方向和边缘的方向相垂直;一般可将边缘分为水平边缘、垂直边缘和对角线边缘;也有不同算子。
  • 边缘提取其实也是一种滤波,不同的算子有不同的提取效果。比较常用的方法有三种,Sobel算子,Laplacian算子,Canny算子。

3.2 算法特点优势

  • Sobel算子检测方法对灰度渐变和噪声较多的图像处理效果较好,但对边缘定位不是很准确,图像的边缘不止一个像素;当对精度要求不是很高时,是一种较为常用的边缘检测方法。
  • Canny方法不容易受噪声干扰,能够检测到真正的弱边缘。优点在于,使用两种不同的阈值分别检测强边缘和弱边缘,并且当弱边缘和强边缘相连时,才将弱边缘包含在输出图像中。
  • Laplacian算子法对噪声比较敏感,所以很少用该算子检测边缘,而是用来判断边缘像素视为与图像的明区还是暗区。拉普拉斯高斯算子是一种二阶导数算子,将在边缘处产生一个陡峭的零交叉, Laplacian算子是各向同性的,能对任何走向的界线和线条进行锐化,无方向性。这是拉普拉斯算子区别于其他算法的最大优点。

3.3 算法应用

3.4 参考博客

数学表示和算子
文字解释更多的算子介绍

你可能感兴趣的:(机器人)