OpenCV-38 图像金字塔

目录

一、图像金字塔

1. 高斯金字塔

2. 拉普拉斯金字塔 


一、图像金字塔

图像金字塔是图像中多尺度表达的一种,最主要用于图像的分割,是一种以多分辨率来解释图像的有效但概念简单的结构。简单来说,图像金字塔是同一图像不同分辨率的子图集合

图像金字塔最初用于机器视觉和图像压缩,一幅图像的金字塔是一系列以金字塔状排列的分辨率逐步降低,且来源于同一张原始图的图像集合。其通过梯次向下采样获得,直到达到某个终止条件才停止采样金字塔的底部是待处理图像的高分辨率表示,而顶部是低分辨率的近似。我们将一层一层的图像比喻成金字塔,层级越高,则图像越小,分辨率越低。

OpenCV-38 图像金字塔_第1张图片

目前有两类常用的图像金字塔

高斯金字塔(Gaussian pyramid):用于向下/降采样(向下不是方向向下,而是指的是分辨率减小),是主要的图像金字塔

拉普拉斯金字塔(Laplacian pyramid):用于从金字塔底层图像重建上层未采样图像,在数字图像处理中也即是预测残差,可以对图像进行最大程度的还原,配合高斯金字塔一起使用

1. 高斯金字塔

高斯金字塔是通过高斯平滑亚采样(subsampling)获得一系列下采样的图像。

原理如下:

OpenCV-38 图像金字塔_第2张图片

GI指图像

原始图像 M * N -> 处理后图像 M/2 * N/2(奇数也可以进行,系统会自动进行类似于四舍五入的操作)

每次处理后,结果图像时原来的1/4 

OpenCV-38 图像金字塔_第3张图片

注意:

向下采样会丢失图像的信息

向上采样与向下采样操作相反

OpenCV-38 图像金字塔_第4张图片

1. 将图像在每个方向扩大为原来的两倍,新增的行和列以0补充。

2. 使用先前同样的内核(乘以4)与放大后的图像卷积。获得近似值。 

pyrDown(img)--- 向下采样

pyrUp(img)--- 向上采样

示例代码如下:

import cv2
import numpy as np
lena = cv2.imread("beautiful women.png")
print(lena.shape)
# 分辨率减小,下采样
new_1 = cv2.pyrDown(lena)
new_2 = cv2.pyrDown(new_1)
print(new_1.shape)
cv2.imshow("img", lena)
cv2.imshow("img1", new_1)
cv2.imshow("img2", new_2)
# 分辨率增大,上采样
new_3 = cv2.pyrUp(lena)
cv2.imshow("img3", new_3)
cv2.waitKey(0)
cv2.destroyAllWindows()

输出结果如下:

OpenCV-38 图像金字塔_第5张图片

2. 拉普拉斯金字塔 

拉普拉斯金字塔没有特定的函数,只是用数学公式进行推导得到的。

OpenCV-38 图像金字塔_第6张图片

将降采样之后的图像在进行上采样操作,与原图进行做差得到残差图。 为还原图像做信息准备。

即拉普拉斯金字塔最终得到的是残差。

拉普拉斯金字塔由高斯金字塔构成,没有专门的函数。

拉普拉斯金字塔图像类似图像边缘,它的大部分元素都是0, 用于图像压缩。

OpenCV-38 图像金字塔_第7张图片

OpenCV-38 图像金字塔_第8张图片

示例代码如下:

import cv2
lena = cv2.imread("beautiful women.png")
# 计算第0层的拉普拉斯金字塔
# 先缩小再放大
dst = cv2.pyrDown(lena)
# 分辨率增大,上采样
dst = cv2.pyrUp(dst)
dst.resize((634, 627, 3))
print(dst.shape)
print(lena.shape)
lap0 = lena - dst
cv2.imshow("img", lap0)
#  计算第1层的拉普拉斯金字塔
dst1 = cv2.pyrDown(dst)
dst1 = cv2.pyrUp(dst1)
dst1.resize((634, 627, 3))
lap1 = dst - dst1
cv2.imshow("img1", lap1)
cv2.waitKey(0)
cv2.destroyAllWindows()

输出结果如下: 

第0层拉普拉斯金字塔:

第1层拉普拉斯金字塔:

你可能感兴趣的:(OpenCV,opencv,计算机视觉,图像处理,人工智能,python,numpy)