什么是图片卷积?
图像卷积就是卷积核在图像上按行滑动遍历像素时不断的相乘求和的过程
步长
步长就是卷积核在图像上移动的步幅.
上面例子中卷积核每次移动一个像素步长的结果, 如果将这个步长修改为2, 结果会如何?
为了充分扫描图片, 步长一般设为1.
padding
从上面例子中我们发现, 卷积之后图片的长宽会变小. 如果要保持图片大小不变, 我们需要在图片周围填充0. padding指的就是填充的0的圈数.
我们可以通过公式计算出需要填充的0的圈数.
如果要保持卷积之后图片大小不变, 可以得出等式: (N + 2P - F + 1) = N从而可以推导出P = (F -1)/2
卷积核的大小
图片卷积中, 卷积核一般为奇数, 比如 3 * 3, 5 * 5, 7 * 7.为什么一般是奇数呢, 出于以下两个方面的考虑:
1. 根据上面padding的计算公式, 如果要保持图片大小不变, 采用偶数卷积核的话, 比如4 * 4, 将会出现填充1.5圈零的情况.
2. 奇数维度的过滤器有中心,便于指出过滤器的位置, 即OpenCV卷积中的锚点.
- filter2D(src, ddepth, kernel, dst, anchor, delta, borderType)
- ddepth是卷积之后图片的位深, 即卷积之后图片的数据类型, 一般设为-1, 表示和原图类型一致.
- kernel是卷积核大小, 用元组或者ndarray表示, 要求数据类型必须是float型.
- anchor 锚点, 即卷积核的中心点, 是可选参数, 默认是(-1,-1)
- delta 可选参数, 表示卷积之后额外加的一个值, 相当于线性方程中的偏差, 默认是0.
- borderType 边界类型.一般不设.
# OpenCV图像卷积操作
import cv2
import numpy as np
#导入图片
img = cv2.imread('./dog.jpeg')
# 相当于原始图片中的每个点都被平均了一下, 所以图像变模糊了.
kernel = np.ones((5, 5), np.float32) / 25
# ddepth = -1 表示图片的数据类型不变
dst = cv2.filter2D(img, -1, kernel)
# 很明显卷积之后的图片模糊了.
cv2.imshow('img', np.hstack((img, dst)))
cv2.waitKey(0)
cv2.destroyAllWindows()
每个像素都变为周围像素的均值,所以图像模糊了