【OpenCV入门教程之十】 形态学图像处理(一):膨胀与腐蚀
一、理论与概念讲解——从现象到本质
形态学(morphology)一词通常表示生物学的一个分支,该分支主要研究动植物的形态和结构。而我们图像处理中指的形态学,往往表示的是数学形态学。
数学形态学(Mathematical morphology) 是一门建立在格论和拓扑学基础之上的图像分析学科,是数学形态学图像处理的基本理论。
- 格论 - 维基百科
- 拓扑学 - 维基百科
其基本的运算包括:二值腐蚀和膨胀、二值开闭运算、骨架抽取、极限腐蚀、击中击不中变换、形态学梯度、Top-hat变换、颗粒分析、流域变换、灰值腐蚀和膨胀、灰值开闭运算、灰值形态学梯度等。
最基本的形态学操作有二种:膨胀与腐蚀(Dilation与Erosion)。膨胀与腐蚀能实现多种多样的功能,主要如下:
- 消除噪声
- 分割(isolate)出独立的图像元素,在图像中连接(join)相邻的元素。
- 寻找图像中的明显的极大值区域或极小值区域
- 求出图像的梯度
在进行腐蚀和膨胀的讲解之前,首先需要注意,腐蚀和膨胀是对白色部分(高亮部分)而言的,不是黑色部分。膨胀就是图像中的高亮部分进行膨胀,“领域扩张”,效果图拥有比原图更大的高亮区域。腐蚀就是原图中的高亮部分被腐蚀,“领域被蚕食”,效果图拥有比原图更小的高亮区域。
1.1 结构元和腐蚀
1.2 膨胀
按数学方面来说,膨胀或者腐蚀操作就是将图像(或图像的一部分区域,我们称之为A)与核(我们称之为B)进行卷积。核可以是任何的形状和大小,它拥有一个单独定义出来的参考点,我们称其为锚点(anchorpoint)。多数情况下,核是一个小的中间带有参考点和实心正方形或者圆盘,其实,我们可以把核视为模板或者掩码。
而膨胀就是求局部最大值的操作,核B与图形卷积,即计算核B覆盖的区域(体现局部)的像素点的最大值,并把这个最大值赋值给参考点指定的像素。这样就会使图像中的高亮区域逐渐增长。
注意:其实右图要比左图大了一圈
膨胀可以理解为B的中心(锚点)沿着A的外边界走了一圈。膨胀是对高亮部分而言,A区域之外的部分 < A的高亮像素,所里外面被里面取代。
效果图,高亮部分膨胀
膨胀的数学表达式:
用(x, y)
周边区域(x+x', y+y')
内的最大值代替(x, y)
的值。
1.3 腐蚀
腐蚀与膨胀是相反的操作,腐蚀是求局部最小值。
可与膨胀对比理解。
注意:其实右图要比左图小了一圈
腐蚀可以理解为B的中心(锚点)沿着A的内边界走了一圈。腐蚀也是对高亮部分而言,A区域之外的部分 < A的高亮像素,所里里面被外面取代。
A中能完全包含B的像素被留下来了。
效果图,高亮部分被腐蚀
二、函数和实例
2.1 函数源码
opencv\sources\modules\imgproc\src\morph.cpp
// 腐蚀
void cv::erode( InputArray src, OutputArray dst, InputArray kernel,
Point anchor, int iterations,
int borderType, const Scalar& borderValue )
{
CV_INSTRUMENT_REGION()
morphOp( MORPH_ERODE, src, dst, kernel, anchor, iterations, borderType, borderValue );
}
// 膨胀
void cv::dilate( InputArray src, OutputArray dst, InputArray kernel,
Point anchor, int iterations,
int borderType, const Scalar& borderValue )
{
CV_INSTRUMENT_REGION()
morphOp( MORPH_DILATE, src, dst, kernel, anchor, iterations, borderType, borderValue );
}
erode和dilate这两个函数内部就是调用了一下morphOp,只是调用morphOp时,第一个参数标识符不同,一个为MORPH_ERODE(腐蚀),一个为MORPH_DILATE(膨胀)。
这些函数在imgproc.hpp
中后面的参数是设置了默认值。
void dilate( InputArray src, OutputArray dst, InputArray kernel,
Point anchor = Point(-1,-1), int iterations = 1,
int borderType = BORDER_CONSTANT,
const Scalar& borderValue = morphologyDefaultBorderValue() );
- 第三个参数,InputArray类型的kernel,膨胀操作的核。若为NULL时,表示的是使用参考点位于中心3x3的核。我们一般使用函数
getStructuringElement
返回指定形状和尺寸的 结构元(SE)。
Mat getStructuringElement(int shape, Size ksize, Point anchor = Point(-1,-1));
# 第一个参数表示内核的形状,我们可以选择如下三种形状之一
# 矩形: MORPH_RECT
# 交叉形: MORPH_CROSS
# 椭圆形: MORPH_ELLIPSE
#
# 第二和第三个参数分别是内核的尺寸以及锚点的位置。
# 我们一般在调用erode以及dilate函数之前,先定义一个Mat类型的变量来获得getStructuringElement函数的返回值。
# 对于锚点的位置,有默认值Point(-1,-1),表示锚点位于中心。
# 且需要注意,交叉形的element形状唯一依赖于锚点的位置。
# 而在其他情况下,锚点只是影响了形态学运算结果的偏移。
- 第四个参数,Point类型的anchor,锚的位置,默认值(-1,-1),表示锚位于中心。
- 第五个参数,int类型的iterations,迭代使用erode()函数的次数,默认值为1。
- 第六个参数,int类型的borderType,用于推断图像外部像素的某种边界模式。注意它有默认值BORDER_DEFAULT。
- 第七个参数,const Scalar&类型的borderValue,当边界为常数时的边界值,有默认值morphologyDefaultBorderValue(),一般我们不用去管他。需要用到它时,可以看官方文档中的createMorphologyFilter()函数得到更详细的解释。
2.2 实例
#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/highgui/highgui.hpp"
#include
using namespace cv;
using namespace std;
int main() {
Mat src = imread("../pics/pig.jpg");
namedWindow("src");
imshow("src", src);
// 获得结构元
Mat se = getStructuringElement(MORPH_RECT, Size(10, 10));
Mat dst;
dilate(src, dst, se); // 后4个参数使用默认值
namedWindow("膨胀");
imshow("膨胀", dst);
waitKey(0);
}
Size(10, 10)
将膨胀代码给为腐蚀
erode(src, dst, se);
三、总结
虽然膨胀和腐蚀是相反的操作,但是如果用同样的SE连续执行2个操作,也不一定能恢复原图。其实就是开闭操作。
先腐蚀再膨胀 其实就是开操作
开操作一般会平滑物体的轮廓,断开较窄的狭颈并消除细的突出物。
erode(src, dst, se);
namedWindow("先腐蚀");
imshow("先腐蚀", dst);
dilate(dst, dst, se);
namedWindow("再膨胀");
imshow("再膨胀", dst);
先膨胀再腐蚀 其实就是闭操作
闭操作也会平滑轮廓的一部分,但与开操作相反,通常会弥合较窄的间断和细长的沟壑,消除小的孔洞,填补轮廓线中的断裂。
dilate(src, dst, se);
namedWindow("先膨胀");
imshow("先膨胀", dst);
erode(dst, dst, se);
namedWindow("再腐蚀");
imshow("再腐蚀", dst);