目标:
图像梯度、边界
函数cv2.Sobel(),cv2.Scharr(),cv2.Laplacian()
简单的来说,梯度的原理就是求导数,opencv中有三种不同滤波器,或者说成高通滤波器。分别是Sobel,Scharr 和 Laplacian
Sobel 和 Scharr 导数
Sobel算子是结合了高斯平滑与微分运算的结合方法,所以它的抗噪声能力很强。用户可以设定求导方向,水平或者垂直(通过参数yorder和xorder)。也可以指定卷积核大小,通过参数ksize。如果ksize=-1,那么一个3*3的scharr滤波器会被使用,该滤波器会得到比Sobel滤波器更好的效果。
每个求导数的方法都是使用Sobel求导方法。如果ksize=1,那么会使用下面核函数进行滤波
def sobel_demo(img):
grad_x = cv.Sobel(img, cv.CV_32F, 1, 0) # 使用CV_32F防止数据溢出
grad_y = cv.Sobel(img, cv.CV_32F, 0, 1)
gradx = cv.convertScaleAbs(grad_x)
grady = cv.convertScaleAbs(grad_y)
cv.imshow("gradx", gradx)
cv.imshow("grady", grady)
# 合并x, y两个梯度
gradxy = cv.addWeighted(gradx,0.5, grady, 0.5, 0)
cv.imshow("gradxy", gradxy)
仔细观察三张图不难发现,X方向梯度在Y方向上边缘较为清晰,而Y方向梯度在X方向上边缘较为清晰,合并后的图像则综合了两张图的特征
注意:
1、Sobel算子用来计算图像灰度函数的近似梯度。Sobel算子根据像素点上下、左右邻点灰度加权差,在边缘处达到极值这一现象检测边缘。对噪声具有平滑作用,提供较为精确的边缘方向信息,边缘定位精度不够高。当对精度要求不是很高时,是一种较为常用的边缘检测方法。
2、Sobel具有平滑和微分的功效。即:Sobel算子先将图像横向或纵向平滑,然后再纵向或横向差分,得到的结果是平滑后的差分结果。
3、OpenCV的Sobel函数原型为:Sobel(src, ddepth, dx, dy[, dst[, ksize[, scale[, delta[, borderType]]]]]) -> dst
src参数表示输入需要处理的图像。
ddepth参数表示输出图像深度,针对不同的输入图像,输出目标图像有不同的深度。
具体组合如下:
src.depth() = CV_8U, 取ddepth =-1/CV_16S/CV_32F/CV_64F (一般源图像都为CV_8U,为了避免溢出,一般ddepth参数选择CV_32F)
src.depth() = CV_16U/CV_16S, 取ddepth =-1/CV_32F/CV_64F
src.depth() = CV_32F, 取ddepth =-1/CV_32F/CV_64F
src.depth() = CV_64F, 取ddepth = -1/CV_64F
注:ddepth =-1时,代表输出图像与输入图像相同的深度。
dx参数表示x方向上的差分阶数,1或0 。
dy参数表示y 方向上的差分阶数,1或0 。
dst参数表示输出与src相同大小和相同通道数的图像。
ksize参数表示Sobel算子的大小,必须为1、3、5、7。
scale参数表示缩放导数的比例常数,默认情况下没有伸缩系数。
delta参数表示一个可选的增量,将会加到最终的dst中,同样,默认情况下没有额外的值加到dst中。
borderType表示判断图像边界的模式。这个参数默认值为cv2.BORDER_DEFAULT。
OpenCV的convertScaleAbs函数使用线性变换转换输入数组元素成8位无符号整型。函数原型:convertScaleAbs(src[, dst[, alpha[, beta]]]) -> dst
src参数表示原数组。
dst参数表示输出数组 (深度为 8u)。
alpha参数表示比例因子。
beta参数表示原数组元素按比例缩放后添加的值。
4、OpenCV的addWeighted函数是计算两个数组的加权和。函数原型:addWeighted(src1, alpha, src2, beta, gamma[, dst[, dtype]]) -> dst
src1参数表示需要加权的第一个输入数组。
alpha参数表示第一个数组的权重。
src2参数表示第二个输入数组,它和第一个数组拥有相同的尺寸和通道数。
beta参数表示第二个数组的权重。
gamma参数表示一个加到权重总和上的标量值。
dst参数表示输出的数组,它和输入的两个数组拥有相同的尺寸和通道数。
dtype参数表示输出数组的可选深度。当两个输入数组具有相同的深度时,这个参数设置为-1(默认值),即等同于src1.depth()。
参数和Sobel算子的几乎差不多,意思也一样,只是没有ksize大小
def scharr_demo(img):
grad_x = cv.Scharr(img, cv.CV_32F, 1, 0) # 使用CV_32F防止数据溢出
grad_y = cv.Scharr(img, cv.CV_32F, 0, 1)
gradx = cv.convertScaleAbs(grad_x) # 取绝对值转到8位
grady = cv.convertScaleAbs(grad_y)
cv.imshow("gradx", gradx)
cv.imshow("grady", grady)
# 合并x, y两个梯度
gradxy = cv.addWeighted(gradx,0.5, grady, 0.5, 0)
cv.imshow("gradxy", gradxy)
def laplace_demo(img):
lap = cv.Laplacian(img, cv.CV_32F)
laplace = cv.convertScaleAbs(lap)
cv.imshow("laplace", laplace)
注意:
1.拉普拉斯算子(Laplace Operator)是n维欧几里德空间中的一个二阶微分算子,定义为梯度(▽f)的散度(▽·f)。
2.OpenCV的Laplacian函数原型为:Laplacian(src, ddepth[, dst[, ksize[, scale[, delta[, borderType]]]]]) -> dst
src参数表示输入需要处理的图像。
ddepth参数表示输出图像深度,针对不同的输入图像,输出目标图像有不同的深度。
具体组合如下:
src.depth() = CV_8U, 取ddepth =-1/CV_16S/CV_32F/CV_64F (一般源图像都为CV_8U,为了避免溢出,一般ddepth参数选择CV_32F)
src.depth() = CV_16U/CV_16S, 取ddepth =-1/CV_32F/CV_64F
src.depth() = CV_32F, 取ddepth =-1/CV_32F/CV_64F
src.depth() = CV_64F, 取ddepth = -1/CV_64F
注:ddepth =-1时,代表输出图像与输入图像相同的深度。
dst参数表示输出与src相同大小和相同通道数的图像。
ksize参数表示用于计算二阶导数滤波器的孔径大小,大小必须是正数和奇数。
scale参数表示计算拉普拉斯算子值的比例因子,默认情况下没有伸缩系数。
delta参数表示一个可选的增量,将会加到最终的dst中,同样,默认情况下没有额外的值加到dst中。
borderType表示判断图像边界的模式。这个参数默认值为cv2.BORDER_DEFAULT。
def laplace_demo(img):
# lap = cv.Laplacian(img, cv.CV_32F)
# laplace = cv.convertScaleAbs(lap)
kernel = np.array([[0, 1 , 0], [1, -4, 1], [0, 1 , 0]])
dst = cv.filter2D(img, cv.CV_32F, kernel=kernel)
laplace = cv.convertScaleAbs(dst)
cv.imshow("laplace", laplace)
kernel = np.array([[1, 1 , 1], [1, -8, 1], [1, 1 , 1]])