图像金字塔是图像中多尺度的一种表现,主要用于分割,目前最流行的方法:深度学习里面也有它的身影,比如文本检测方法“TextBoxes++”就用到它了,为什么要用它,效果会好一些呢?因为一张图片中,有些字体比较大,有些字体比较小。今天的猪脚是介绍传统图像金字塔:高斯金字塔和拉普拉斯金字塔,至于深度学习的,我就不展开讲了。
高斯金字塔的生成,主要用到pyrDown函数,其生成原理:
(1)输入图片
(2)对图像进行高斯内核卷积
(3)将所有偶数行和列去除,得到(1)中图片的1/4大小
(4)将(3)中得到的图片重复(2)和(3)步骤,直到得到n级图像金字塔
注意:在生成图像金字塔过程中,图像的信息是在不断的被丢失
#include
#include
using namespace cv;
int main()
{
Mat srcImage = imread("kodim23.png");
Mat dstImage1, dstImage2;
pyrDown(srcImage, dstImage1, Size(srcImage.cols / 2, srcImage.rows / 2));
pyrDown(dstImage1, dstImage2, Size(dstImage1.cols / 2, dstImage1.rows / 2));
imshow("srcImage", srcImage);
imshow("dstImage1", dstImage1);
imshow("dstImage2", dstImage2);
waitKey(0);
return 0;
}
效果:
拉普拉斯金字塔的生成,主要是基于高斯金字塔以及用到pyrUp函数,其生成原理:
(1)输入图片
(2)缩小图片,对应高斯金字塔步骤中的(2)和(3)
(3)将上一步骤得到的图像在每个方向扩大为原来的两倍,新增的行和列以0填充
(4)进行高斯内核卷积(缩小的时候,用什么核,这里就用什么核)
(5)步骤(1)的图片 - 步骤(4)所得到的图片(所得到的图片具有高频信息)
(6)重复(2)-(5),直到得到n级图像金字塔
#include
#include
using namespace cv;
int main()
{
Mat srcImage = imread("kodim23.png");
Mat downImage1, downImage2;
Mat upImage1, upImage2;
Mat lapImage1, lapImage2;
pyrDown(srcImage, downImage1, Size(srcImage.cols / 2, srcImage.rows / 2));
pyrDown(downImage1, downImage2, Size(downImage1.cols / 2, downImage1.rows / 2));
pyrUp(downImage2, upImage2, Size(downImage2.cols * 2, downImage2.rows * 2));
pyrUp(downImage1, upImage1, Size(downImage1.cols * 2, downImage1.rows * 2));
lapImage1 = srcImage - upImage1;
lapImage2 = downImage1 - upImage2;
imwrite("lapImage1.png", lapImage1);
imwrite("lapImage2.png", lapImage2);
return 0;
}
效果: