由于种种原因,图像中难免会存在噪声,需要对其去除。噪声可以理解为灰度值的随机变化,即拍照过程中引入的一些不想要的像素点。噪声可分为椒盐噪声,高斯噪声,加性噪声和乘性噪声等,参见:https://zhuanlan.zhihu.com/p/52889476
噪声主要通过平滑进行抑制和去除,包括基于二维离散卷积的高斯平滑,均值平滑,基于统计学的中值平滑,以及能够保持图像边缘的双边滤波,导向滤波算法等。下面介绍其具体使用
理解卷积:https://www.zhihu.com/question/22298352/answer/637156871
https://www.zhihu.com/question/22298352/answer/228543288
学习图像平滑前,有必要了解下卷积的知识,看完上述连接,对于图像处理中卷积应该了解几个关键词:卷积核,锚点,步长,内积,卷积模式
所谓两个函数的卷积,本质上就是先将一个函数翻转,然后进行滑动叠加。在连续情况下,叠加指的是对两个函数的乘积求积分,在离散情况下就是加权求和,为简单起见就统一称为叠加。整体看来是这么个过程: 翻转——>滑动——>叠加——>滑动——>叠加——>滑动——>叠加…多次滑动得到的一系列叠加值,构成了卷积函数。
卷积核(kernel):用来对图像矩阵进行平滑的矩阵,也称为过滤器(filter)
锚点:卷积核和图像矩阵重叠,进行内积运算后,锚点位置的像素点会被计算值取代。一般选取奇数卷积核,其中心点作为锚点
步长:卷积核沿着图像矩阵每次移动的长度
内积:卷积核和图像矩阵对应像素点相乘,然后相加得到一个总和,如下图所示。(不要和矩阵乘法混淆)
卷积模式:卷积有三种模式,FULL, SAME,VALID,实际使用注意区分使用的那种模式。(参考:https://zhuanlan.zhihu.com/p/62760780)
Full:全卷积,full模式的意思是,从filter和image刚相交开始做卷积,白色部分为填0,橙色部分为image, 蓝色部分为filter,filter的运动范围如图所示。
Same卷积:当filter的锚点(K)与image的边角重合时,开始做卷积运算,可见filter的运动范围比full模式小了一圈,same mode为full mode 的子集,即full mode的卷积结果包括same mode。
valid卷积:当filter全部在image里面的时候,进行卷积运算,可见filter的移动范围较same更小了,同样valid mode为same mode的子集。valid mode的卷积计算,填充边界中的像素值不会参与计算,即无效的填充边界不影响卷积,所以称为valid mode。
python的scipy包中提供了convolve2d()函数来实现卷积运算,其参数如下:
复制代码
from scipy import signal
signal.convolve2d(src,kernel,mode,boundary,fillvalue)
src: 输入的图像矩阵,只支持单通的(即二维矩阵)
kernel:卷积核
mode:卷积类型:full, same, valid
boundary:边界填充方式:fill,wrap, symm
fillvalue: 当boundary为fill时,边界填充的值,默认为0
opencv中提供了flip()函数翻转卷积核,filter2D进行same 卷积, 其参数如下:
dst = cv2.flip(src,flipCode)
src: 输入矩阵
flipCode:0表示沿着x轴翻转,1表示沿着y轴翻转,-1表示分别沿着x轴,y轴翻转
dst:输出矩阵(和src的shape一样)
cv2.filter2D(src,dst,ddepth,kernel,anchor=(-1,-1),delta=0,borderType=cv2.BORDER_DEFAULT)
src: 输入图像对象矩阵
dst:输出图像矩阵
ddepth:输出矩阵的数值类型
kernel:卷积核
anchor:卷积核锚点,默认(-1,-1)表示卷积核的中心位置
delat:卷积完后相加的常数
borderType:填充边界类型
2.1 高斯平滑
高斯平滑即采用高斯卷积核对图像矩阵进行卷积操作。高斯卷积核是一个近似服从高斯分布的矩阵,随着距离中心点的距离增加,其值变小。这样进行平滑处理时,图像矩阵中锚点处像素值权重大,边缘处像素值权重小,下为一个3*3的高斯卷积核:
opencv中提供了GaussianBlur()函数来进行高斯平滑,其对应参数如下:
复制代码
dst = cv2.GaussianBlur(src,ksize,sigmaX,sigmay,borderType)
src: 输入图像矩阵,可为单通道或多通道,多通道时分别对每个通道进行卷积
dst:输出图像矩阵,大小和数据类型都与src相同
ksize:高斯卷积核的大小,宽,高都为奇数,且可以不相同
sigmaX: 一维水平方向高斯卷积核的标准差
sigmaY: 一维垂直方向高斯卷积核的标准差,默认值为0,表示与sigmaX相同
borderType:填充边界类型
复制代码
代码使用示例和效果如下:(相比于原图,平滑后图片变模糊)
GaussianBlur()
#coding:utf-8
import cv2 as cv
import matplotlib.pyplot as plt
import numpy as np
img = cv.imread(r"C:\Users\Administrator\Desktop\timg.jpg")
img_gauss = cv.GaussianBlur(img,(3,3),1)#高斯卷积核的大小,格式为(宽,高)
cv.imshow("img",img)
cv.imshow("img_gauss",img_gauss)
cv.waitKey(0)
cv.destroyAllWindows()
对于上面的高斯卷积核,可以由如下两个矩阵相乘进行构建,说明高斯核是可分离卷积核,因此高斯卷积操作可以分成先进行垂直方向的一维卷积,再进行一维水平方向卷积。
opencv中getGaussianKernel()能用来产生一维的高斯核,分别获得水平和垂直的高斯核,分两步也能完成高斯卷积,获得和GaussianBlur一样的结果。其参数如下:
复制代码
cv2.getGaussianKernel(ksize,sigma,ktype)
ksize:奇数,一维核长度
sigma:标准差
ktype:数据格式,应该为CV_32F 或者 CV_64F
返回矩阵如下:垂直的矩阵
[[ 0.27406862]
[ 0.45186276]
[ 0.27406862]
复制代码
先水平卷积,再垂直卷积
#coding:utf-8
import cv2 as cv
import matplotlib.pyplot as plt
import numpy as np
from scipy import signal
#convolve2d只是对单通道进行卷积,若要实现cv.GaussianBlur()多通道高斯卷积,需要拆分三个通道进行,再合并
def gaussianBlur(img,h,w,sigma,boundary="fill",fillvalue=0):
kernel_x = cv.getGaussianKernel(w,sigma,cv.CV_64F) #默认得到的为垂直矩阵
kernel_x = np.transpose(kernel_x) #转置操作,得到水平矩阵
#水平方向卷积
gaussian_x = signal.convolve2d(img,kernel_x,mode="same",boundary=boundary,fillvalue=fillvalue)
#垂直方向卷积
kernel_y = cv.getGaussianKernel(h,sigma,cv.CV_64F)
gaussian_xy = signal.convolve2d(gaussian_x,kernel_y,mode="same",boundary=boundary,fillvalue=fillvalue)
#cv.CV_64F数据转换为uint8
gaussian_xy = np.round(gaussian_xy)
gaussian_xy = gaussian_xy.astype(np.uint8)
return gaussian_xy
if __name__=="__main__":
img = cv.imread(r"C:\Users\Administrator\Desktop\timg.jpg",0)
img_gauss = gaussianBlur(img,3,3,1)
cv.imshow("img",img)
cv.imshow("img_gauss",img_gauss)
cv.waitKey(0)
cv.destroyAllWindows()
2.2 均值平滑
高斯卷积核,对卷积框中像素值赋予不同权重,而均值平滑赋予相同权重,一个3*5的均值卷积核如下,均值卷积核也是可分离的。
opencv的boxFilter()函数和blur()函数都能用来进行均值平滑,其参数如下:
复制代码
cv2.boxFilter(src,ddepth,ksize,dst,anchor,normalize,borderType)
src: 输入图像对象矩阵,
ddepth:数据格式,位深度
ksize:高斯卷积核的大小,格式为(宽,高)
dst:输出图像矩阵,大小和数据类型都与src相同
anchor:卷积核锚点,默认(-1,-1)表示卷积核的中心位置
normalize:是否归一化 (若卷积核3*5,归一化卷积核需要除以15)
borderType:填充边界类型
cv2.blur(src,ksize,dst,anchor,borderType)
src: 输入图像对象矩阵,可以为单通道或多通道
ksize:高斯卷积核的大小,格式为(宽,高)
dst:输出图像矩阵,大小和数据类型都与src相同
anchor:卷积核锚点,默认(-1,-1)表示卷积核的中心位置
borderType:填充边界类型
复制代码
示例代码和使用效果如下:
blur()和boxFilter()
#coding:utf-8
import cv2 as cv
import matplotlib.pyplot as plt
import numpy as np
img = cv.imread(r"C:\Users\Administrator\Desktop\timg.jpg")
img_blur = cv.blur(img,(3,5))
# img_blur = cv.boxFilter(img,-1,(3,5))
cv.imshow("img",img)
cv.imshow("img_blur",img_blur)
cv.waitKey(0)
cv.destroyAllWindows()
2.3 中值平滑
中值平滑也有核,但并不进行卷积计算,而是对核中所有像素值排序得到中间值,用该中间值来代替锚点值。opencv中利用medianBlur()来进行中值平滑,中值平滑特别适合用来去除椒盐噪声,其参数如下:
cv2.medianBlur(src,ksize,dst)
src: 输入图像对象矩阵,可以为单通道或多通道
ksize:核的大小,格式为 3 #注意不是(3,3)
dst:输出图像矩阵,大小和数据类型都与src相同
其使用代码及效果如下:(加上的白点噪声都被平滑掉了)
medianBlur()
#coding:utf-8
import cv2 as cv
import matplotlib.pyplot as plt
import numpy as np
import random
img = cv.imread(r"C:\Users\Administrator\Desktop\timg.jpg")
rows,cols = img.shape[:2]
#加入椒盐噪声
for i in range(100):
r = random.randint(0,rows-1)
c = random.randint(0,cols-1)
img[r,c]=255 #这些点的值为255,全部为白色,即为椒盐噪声
img_medianblur = cv.medianBlur(img,5)#5为核的大小
cv.imshow("img",img)
cv.imshow("img_medianblur",img_medianblur)
cv.waitKey(0)
cv.destroyAllWindows()
中值滤波自己实现代码如下:
Medain Filter算法实现
#coding:utf-8
import heapq
import cv2
#实现图片的中值滤波算法
# 2D median filter with no stride, zero padding
def medain_filter(img, kernel_w, kernel_h):
"""
img: cv2 matrix
kernel_w: kernel width
kernel_h: kernel height
"""
rows, cols = img.shape[:2]
for i in range(rows):
for j in range(cols):
left = max(0, j-kernel_w//2)
right = min(cols-1, j+kernel_w//2)
upper = max(0, i-kernel_h//2)
lower = min(rows-1, i+kernel_h//2)
#kernel中的像素点放入堆中
hq = []
for m in range(upper, lower+1):
for n in range(left, right+1):
heapq.heappush(hq, img[m, n])
size = (right-left+1)*(lower-upper+1)
if size&1: #奇数个元素,取中间值
for k in range(0, (size+1)//2):
median = heapq.heappop(hq)
img[i, j] = median
else: #偶数个元素,取中间两个元素平均值
for k in range(0, (size+1)//2):
median1 = heapq.heappop(hq)
median2 = heapq.heappop(hq)
img[i, j] = (median1+median2)//2
return img
if __name__ == "__main__":
img = cv2.imread(r"C:\Users\Administrator\Desktop\dog.jpg", 0)
img2 = medain_filter(img, 3, 3)
cv2.imshow("img", img)
cv2.imshow("img2", img2)
cv2.waitKey(0)
cv2.destroyAllWindows()
2.4 双边滤波
相比于上面几种平滑算法,双边滤波在平滑的同时还能保持图像中物体的轮廓信息。双边滤波在高斯平滑的基础上引入了灰度值相似性权重因子,所以在构建其卷积核核时,要同时考虑空间距离权重和灰度值相似性权重。在进行卷积时,每个位置的邻域内,根据和锚点的距离d构建距离权重模板,根据和锚点灰度值差异r构建灰度值权重模板,结合两个模板生成该位置的卷积核。opencv中的bilateralFilter()函数实现了双边滤波,其参数对应如下:
dst = cv2.bilateralFilter(src,d,sigmaColor,sigmaSpace,borderType)
src: 输入图像对象矩阵,可以为单通道或多通道
d:用来计算卷积核的领域直径,如果d<=0,从sigmaSpace计算d
sigmaColor:颜色空间滤波器标准偏差值,决定多少差值之内的像素会被计算(构建灰度值模板)
sigmaSpace:坐标空间中滤波器标准偏差值。如果d>0,设置不起作用,否则根据它来计算d值(构建距离权重模板)
其使用代码及效果如下:
bilateralFilter
#coding:utf-8
import cv2 as cv
import matplotlib.pyplot as plt
import numpy as np
import random
import math
img = cv.imread(r"C:\Users\Administrator\Desktop\timg.jpg")
img_bilateral = cv.bilateralFilter(img,0,0.2,40)
cv.imshow("img",img)
cv.imshow("img_bilateral",img_bilateral)
cv.waitKey(0)
cv.destroyAllWindows()
同样,利用numpy也可以自己实现双边滤波算法,同样需要对每个通道进行双边滤波,最后进行合并,下面代码只对单通道进行了双边滤波,代码和效果如下图:
python实现双边滤波
#coding:utf-8
import cv2 as cv
import matplotlib.pyplot as plt
import numpy as np
import random
import math
def getDistanceWeight(sigmaSpace,H,W):
r,c = np.mgrid[0:H:1,0:W:1]
r = r-(H-1)/2
c =c-(W-1)/2
distanceWeight = np.exp(-0.5*(np.power(r,2)+np.power(c,2))/math.pow(sigmaSpace,2))
return distanceWeight
def bilateralFilter(img,H,W,sigmaColor,sigmaSpace):
distanceWeight = getDistanceWeight(sigmaSpace,H,W)
cH = (H-1)/2
cW = (W-1)/2
rows,cols = img.shape[:2]
bilateralImg = np.zeros((rows,cols),np.float32)
for r in range(rows):
for c in range(cols):
pixel = img[r,c]
rTop = 0 if r-cH<0 else r-cH
rBottom = rows-1 if r+cH>rows-1 else r+cH
cLeft = 0 if c-cW<0 else c-cW
cRight = cols-1 if c+cW>cols-1 else c+cW
#权重模板作用区域
region=img[rTop:rBottom+1,cLeft:cRight+1]
#灰度值差异权重
colorWeight = np.exp(0.5*np.power(region-pixel,2.0)/math.pow(sigmaColor,2))
print(colorWeight.shape)
#距离权重
distanceWeightTemp = distanceWeight[cH-(r-rTop):rBottom-r+cH+1,cW-(c-cLeft):cRight-c+cW+1]
print(distanceWeightTemp.shape)
#权重相乘并归一化
weightTemp = colorWeight*distanceWeightTemp
weightTemp = weightTemp/np.sum(weightTemp)
bilateralImg[r][c]=np.sum(region*weightTemp)
return bilateralImg
if __name__=="__main__":
img = cv.imread(r"C:\Users\Administrator\Desktop\timg.jpg",0)
img_temp = img/255.0
img_bilateral = bilateralFilter(img_temp,3,3,0.2,19)*255
img_bilateral[img_bilateral>255] = 255
img_bilateral = img_bilateral.astype(np.uint8)
cv.imshow("img",img)
cv.imshow("img_bilateral",img_bilateral)
cv.waitKey(0)
cv.destroyAllWindows()
2.5 联合双边滤波
双边滤波是根据原图中不同位置灰度相似性来构建相似性权重模板,而联合滤波是先对原图进行高斯平滑,然后根据平滑后的图像灰度值差异建立相似性模板,再与距离权重模板相乘得到最终的卷积核,最后再对原图进行处理。所以相比于双边滤波,联合双边滤波只是建立灰度值相似性模板的方法不一样。
联合双边滤波作为边缘保留滤波算法时,进行joint的图片即为自身原图片,如果将joint换为其他引导图片,联合双边滤波算法还可以用来实现其他功能。opencv 2中不支持联合双边滤波,opencv 3中除了主模块,还引入了contrib,其中的ximgproc模块包括了联合双边滤波的算法。因此如果需要使用opencv的联合双边滤波,需要安装opencv-contrib-python包。
安装opencv主模块和contrib附加模块步骤:
pip uninstall opencv-python (如果已经安装opencv-python包,先卸载)
pip install opencv-contrib-python
联合双边滤波: cv2.xmingproc.jointBilateralFilter(), 其相关参数如下:
复制代码
dst = cv2.xmingproc.jointBilateralFilter(joint,src,d,sigmaColor,sigmaSpace,borderType)
joint: 进行联合滤波的导向图像,可以为单通道或多通道,保持边缘的滤波算法时常采用src 高斯滤波后在图像作为导向图象,也可以用图片自身作为导向图片
src: 输入图像对象矩阵,可以为单通道或多通道
d:用来计算卷积核的领域直径,如果d<0,从sigmaSpace计算d
sigmaColor:颜色空间滤波器标准偏差值,决定多少差值之内的像素会被计算(构建灰度值模板)
sigmaSpace:坐标空间中滤波器标准偏差值。如果d>0,设置不起作用,否则根据它来计算d值(构建距离权重模板)
复制代码
下面是联合双边滤波的使用代码和效果:(采用src的高斯平滑图片作为joint)
cv2.ximgproc.jointBilateralFilter()
#coding:utf-8
import cv2 as cv
import matplotlib.pyplot as plt
import numpy as np
import random
import math
src = cv.imread(r"C:\Users\Administrator\Desktop\timg.jpg")
joint = cv.GaussianBlur(src,(7,7),1,0)
dst = cv.ximgproc.jointBilateralFilter(joint,src,33,2,0)
# dst = cv.ximgproc.jointBilateralFilter(src,src,33,2,0) #采用src作为joint
cv.imshow("img",src)
cv.imshow("joint",joint)
cv.imshow("dst",dst)
cv.waitKey(0)
cv.destroyAllWindows()
2.6 导向滤波
导向滤波也是需要一张图片作为引导图片,来表明边缘,物体等信息,作为保持边缘滤波算法,可以采用自身作为导向图片。opencv 2中也暂不支持导向滤波, 同样在opencv-contrib-python包的ximgproc模块提供了导向滤波函。
导向滤波具体原理可以参考:https://blog.csdn.net/baimafujinji/article/details/74750283
opencv中导向滤波cv2.ximgproc.guidedFilter()的参数如下:
复制代码
导向滤波
cv2.ximgproc.guidedFilter(guide,src,radius,eps,dDepth)
guide: 导向图片,单通道或三通道
src: 输入图像对象矩阵,可以为单通道或多通道
radius:用来计算卷积核的领域直径
eps:规范化参数, eps的平方类似于双边滤波中的sigmaColor(颜色空间滤波器标准偏差值)
(regularization term of Guided Filter. eps2 is similar to the sigma in the color space into bilateralFilter.)
dDepth: 输出图片的数据深度
复制代码
其代码使用和效果如下:
cv2.ximgproc.guidedFilter
#coding:utf-8
import cv2 as cv
src = cv.imread(r"C:\Users\Administrator\Desktop\timg.jpg")
dst = cv.ximgproc.guidedFilter(src,src,33,2,-1)
cv.imshow("img",src)
cv.imshow("dst",dst)
cv.waitKey(0)
cv.destroyAllWindows()