图像滤波的作用简单来说就是将一副图像通过滤波器得到另一幅图像;明确一个概念,滤波器又被称为卷积核,滤波的过程又被称为卷积;实际上深度学习就是训练许多适应任务的滤波器,本质上就是得到最佳的参数;当然在深度学习之前,也有一些常见的滤波器,本篇主要介绍这些常见的滤波器;
卷积核大小一般为奇数的原因:
1、增加padding的原因;
2、保证锚点在中间,防止位置发生偏移;
卷积核大小的影响:卷积核越大,感受野越大,提取的特征越好,同时计算量也越大;
边界扩充(padding)作用:使得输出数据的尺寸与输入相等;
计算公式:
N = (W - F + 2P)/ S + 1
首先介绍两个简单的滤波:低通滤波与高通滤波;
低通滤波:低于阈值的可通过,去除噪音或平滑图像;
高通滤波:高于阈值的可 通过,用于边缘检测;
函数原型:
filter2D(src,ddepth,kernel,[anchor,delta,borderType])
代码案例:
kernel = np.ones((5, 5), np.float32) / 25
result = cv2.filter2D(img, -1, kernel)
这是一个平均卷积,起到一个降噪的作用,但效果并不明显;
首先介绍一个方盒滤波,实际上就是全为1的卷积核乘以权重a;
函数原型:boxFilter(src,ddepth,ksize,anchor,normalize,borderType)
说明:当normalize为True时,乘以1/W*H,也就是均值滤波,所以一般不用这个滤波函数;
均值滤波函数原型:blur(src,ksize,[anchor,borderType])
注意:一般均值滤波就是使用这个API;
代码案例:
result = cv2.blur(img, 5)
原理:越靠近中心,权重越大,离中心越远,权重越小;
函数原型:
GaussianBlur(img,kernel,sigmaX,[sigmaY,…])
说明:对效果有影响的参数为kernel和sigmaX,这两者越大图像平滑(模糊)的效果会越明显;
代码案例:
gauss = cv2.imread('gaussian.png')
result = cv2.GaussianBlur(gauss, (5, 5), 5)
cv2.imshow('org', gauss)
cv2.imshow('result', result)
cv2.waitKey(0)
从图中可看出,处理后高斯噪点减少了,但整体图像也变模糊了;
本质:取中间值作为卷积结果;
作用:对胡椒噪音有很好的处理效果;
函数原型:
medianBlur(img,ksize)
代码案例:
img = cv2.imread('papper.png')
result = cv2.medianBlur(img, 5)
cv2.imshow('org', img)
cv2.imshow('result', result)
cv2.waitKey(0)
从上图可以看出,效果是相当不错的;
作用:可以保留边缘,同时对边缘内的区域进行平滑处理;(主要进行美颜)
参考文章:https://zhuanlan.zhihu.com/p/127023952
函数原型:
bilateralFilter(img,d,sigmaColor,sigmaSpace)
案例代码:
img = cv2.imread('1.jpg')
result = cv2.bilateralFilter(img, 9, 50, 50)
cv2.imshow('org', img)
cv2.imshow('result', result)
cv2.waitKey(0)
从图中可以看出,美颜效果是比较明显的,并且对于边缘轮廓也处于能接受范围;
上述介绍的几种滤波均为低通滤波,接下来介绍高通滤波,最主要作用是检测边缘;
实现步骤:
x轴方向求导 —— y轴方向求导 —— 最终结果为二者相加
函数原型:
Sobel(src,ddepth,dx,dy,ksize=3,…)
代码案例:
chess = cv2.imread('chess.png')
# 求y方向边缘
dy = cv2.Sobel(chess, cv2.CV_64F, 1, 0, ksize=5)
# 求x方向边缘
dx = cv2.Sobel(chess, cv2.CV_64F, 0, 1, ksize=5)
# 二者相加
result = dy + dx
cv2.imshow('chess', chess)
cv2.imshow('dy', dy)
cv2.imshow('dx', dx)
cv2.imshow('result', result)
cv2.waitKey(0)
从上图可以明显看出,当dx设置为1时,求得y方向上的边缘信息,反之也是,最终二者相加的结果也就是Sobel算子的结果。不能一开始就设定dx,dy为1,这样子不能达到该效果;
定义:与Sobel类似,但使用的kernel值不同,并且只能为3x3,只能求x方向或y方向一个方向的边缘信息;
函数原型:
Scharr(src,ddepth,dx,dy)
在这里就不演示了,该算子不常用,主要优点是能检测到不明显的边缘,当Sobel的ksize设置为-1时等同;
优点:可同时求得两个方向的边缘;
缺点:对噪音比较敏感,一般需要先进行去噪在调用拉普拉斯算子;
函数原型:
Laplacian(img,ddepth,ksize=1)
代码案例:
chess = cv2.imread('chess.png')
result = cv2.Laplacian(chess, cv2.CV_64F, ksize=5)
cv2.imshow('chess', chess)
cv2.imshow('result', result)
cv2.waitKey(0)
从效果上看,比起Sobel步骤更加简单,并且效果也比较好,缺点就是如果噪声过多的话效果会比较差;
实现步骤:
1、使用5x5高斯滤波消除噪音;
2、使用Sobel计算图像梯度的方向(0°、45°、90°、135°);
3、取局部极大值;
4、阈值计算;
函数原型:
Canny(img,minVal,maxVal,…)
其中的minVal和maxVal代表边缘的阈值,两者差值过大的话会损失一定的边缘信息;
代码案例:
img = cv2.imread('1.jpg')
result = cv2.Canny(img, 100, 200)
cv2.imshow('org', img)
cv2.imshow('result', result)
cv2.waitKey(0)
图像滤波中最重要的算法就是Canny,本篇并没有涉及内部数学知识的讲解,主要还是在于算法的应用,也是后续完成实际案例的基础;