边缘检测是图像处理和计算机视觉中的基本问题,边缘检测的目的是标识数字图像中亮度变化明显的点。图像属性中的显著变化通常反映了属性的重要事件和变化。
图像边缘检测大幅度地减少了数据量,并且剔除了可以认为不相关的信息,保留了图像重要的结构属性。边缘检测可以划分为两类∶ 基于搜索和基于零穿越。
基于搜索∶通过寻找图像一阶导数中的最大值来检测边界,然后利用计算结果估计边缘的局部方向,通常采用梯度的方向,并利用此方向找到局部梯度模的最大值,代表算法是Sobel算子和Scharr算子。
·基于零穿越∶通过寻找图像二阶导数零穿越来寻找边界,代表算法是Laplacian算子。
概述:
Sobel边缘检测算法比较简单,效率比canny边缘检测效率要高,但是边缘不如Canny检测的准确。Sobel算子是高斯平滑与微分操作的结合体,所以抗噪声能力强,用途较多。尤其是效率要求较高,而对细纹理不太关心的时候。
(注:如果 ksize=-1,使用3x3 的Scharr滤波器要 比3x3的Sobel滤波器的效果好(而且速度相同,所以在使用 3x3 滤波器时应该尽量使用Scharr 滤波器))
代码:
cv2.Sobel(src,ddepth,dx,dy,[dst,ksize,scale,delta,boderType])` # sobel算子
参数:
src:图像;
ddepth:图像的深度,-1表示采用的是与原图像相同的深度。目标图像的深度必须不小于原图像的深度;
dx,dy:表示的是求导的阶数,0表示这个方向上没有求导,一般为0、1、2(阶);
dst:输出图像;
ksize:是sobel算子的大小,必须为1、3、5、7。
Scale:是缩放导数的比例常数,默认情况下没有伸缩系数;
delta:是一个可选的增量,将会加到最终的dst中,同样,默认情况下没有额外的值加到dst中;
borderType:是判断图像边界的模式。这个参数默认值为cv2.BORDER_DEFAULT。
代码:
abs_x=cv2.convertScaleAbs(x) #转换`
参数:x:进行sobel操作后的图像
代码:
cv2.addWeighted(src1,alpha,src2,beta,gamma,dst,dtype)
参数:
src1:图像1
alpha:图像1 的权重(在0–1之间)
src2:图像2
beta:图像2 的权重
gamma:图1与图2作和后添加的数值。不要太大,不然图片一片白。总和等于255以上就是纯白色了。
dst:输出图片(无用)
(注:Sobel函数求完导数后会有负值,还有会大于255的值。而原图像是uint8,即8位无符号数,所以Sobel建立的图像位数不够,会有截断。因此要使用16位有符号的数据类型,即cv2.CV_16S。处理完图像后,再使用 cv2.convertScaleAbs()函数将其转回原来的uint8格式,否则图像无法显示。)
例子:
import cv2
from matplotlib import pyplot as plt
img = cv2.imread("2.jpg", 0)
x = cv2.Sobel(img, cv2.CV_64F, 1, 0) # sobel算子
y = cv2.Sobel(img, cv2.CV_64F, 0, 1)
absX = cv2.convertScaleAbs(x)
absY = cv2.convertScaleAbs(y) # 转回uint8
dst = cv2.addWeighted(absX, 0.5, absY, 0.5, 50) # 图像混合
plt.subplot(221), plt.imshow(img, 'gray')
plt.subplot(222), plt.imshow(absX, 'gray')
plt.subplot(223), plt.imshow(absY, 'gray')
plt.subplot(224), plt.imshow(dst, 'gray')
plt.show()
cv2.imwrite('dst.jpg',dst)
***定义***∶通过寻找图像二阶导数零穿越来寻找边界。
代码:
dst=cv2.Laplacian(src,ddepth,[dst,ksize,scale,delta,borderType])
参数:
src:图像;
ddepth:图像的深度,-1表示采用的是与原图像相同的深度。目标图像的深度必须不小于原图像的深度;
dx,dy:表示的是求导的阶数,0表示这个方向上没有求导,一般为0、1、2(阶);
dst:输出图像;
ksize:是算子的大小,必须为1、3、5、7。
Scale:是缩放导数的比例常数,默认情况下没有伸缩系数;
delta:是一个可选的增量,将会加到最终的dst中,同样,默认情况下没有额外的值加到dst中;
borderType:是判断图像边界的模式。这个参数默认值为cv2.BORDER_DEFAULT。
原理:
(1).噪声去除;
由于边缘检测很容易受到噪声影响,所以第一步是使用5x5的高斯滤波器去除噪声;
(2).计算图像梯度
对平滑后的图像使用Sobel算子计算水平方向和竖直方向的一阶导数(图像梯度)(Gx和Gy)。根据得到的这两幅梯度图(Gx和Gy)找到边界的梯度和方向,公式如下:
(注:梯度的方向一般总是与边界垂直。梯度方向被归为四类:垂直,水平,和两个对角线。)
(3).非极大值抑制
在获得梯度的方向和大小之后,应该对整幅图像做一个扫描,去除那些非边界上的点。对每一个像素进行检查,看这个点的梯度是不是周围具有相同梯 度方向的点中最大的。如下图所示:
现在你得到的是一个包含“窄边界”的二值图像。
(4).滞后阈值
现在要确定那些边界才是真正的边界。这时我们需要设置两个阈值: minVal 和 maxVal。当图像的灰度梯度高于 maxVal 时被认为是真的边界, 那些低于 minVal 的边界会被抛弃。如果介于两者之间的话,就要看这个点是 否与某个被确定为真正的边界点相连,如果是就认为它也是边界点,如果不是就抛弃。在这一步,一些小的噪声点也会被除去,因为我们假设边界都是一些长的线段。
代码:
cv2.Canny(image,threschold1,threschold2,[edges,apertureSize,L2gradient])
参数:
image:图像
threschold1:最小滞后阈值
Threschold2:最大滞后阈值
apertureSize:计算图像梯度的 Sobel 卷积核的大小,默认值为 3
apertureSize:是一个布尔值,用来设定 求梯度大小的方程。如果设为 True,就使用更精确的L2范数进行计算(即两个方向的倒数的平方和再开放),否则使用方程: 代替,默认值为 False。
例子:
import cv2
from matplotlib import pyplot as plt
img = cv2.imread('1.jpg', 0)
edges = cv2.Canny(img, 100, 200)
plt.subplot(121), plt.imshow(img, cmap='gray')
plt.title('Original Image'), plt.xticks([]), plt.yticks([])
plt.subplot(122), plt.imshow(edges, cmap='gray')
plt.title('Edge Image'), plt.xticks([]), plt.yticks([])
plt.show()