一个小猴子｀

掌握imgproc组件：opencv-图像处理

图像处理

1.线性滤波：方框滤波、均值滤波、高斯滤波
- 1.1 平滑处理
- 1.2 图像滤波与滤波器
- 1.3 线性滤波器的简介
- 1.4 滤波和模糊
- 1.5 邻域算子与线性邻域滤波
- 1.6 方框滤波
- 1.7 均值滤波
- 1.8 高斯滤波
- 1.9 线性滤波综合案例
2.非线性滤波：中值滤波、双边滤波
- 2.1 中值滤波
- 2.2 双边滤波
- 2.3 综合案例
3.形态学滤波(1):腐蚀与膨胀
- 3.1 膨胀
- 3.2 腐蚀
- 3.3 腐蚀和膨胀综合案例
4.形态学滤波(2):开运算、闭运算、形态学梯度、顶帽、黑帽
- 4.1 开运算
- 4.2 闭运算
- 4.3 形态学梯度
- 4.4 顶帽
- 4.5 黑帽
- 4.6 morphologyEx()函数
- 4.7 综合案例：形态学滤波
5.漫水填充
- 5.1 漫水填充：floodFill函数
6.图像金字塔与图片尺寸缩放
- 6.1 引言
- 6.2 关于图像金字塔
- 6.3 高斯金字塔
- 6.4 拉普拉斯金字塔
- 6.5 图像金字塔相关API函数
- 6.6 尺寸调整：resize()函数
7 阈值化
- 7.1 固定阈值操作：Threshold()
- 7.2 自适应阈值操作：adaptiveThreshold()函数
- 7.3 阈值操作综合案例

1.线性滤波：方框滤波、均值滤波、高斯滤波

1.1 平滑处理

平滑处理(smoothing)也成为模糊处理(bluring)，是一种简单且使用频率很高的图像处理方法。平滑处理的用途有很多，最常见的是用来减少图像上的噪点或者失真。在涉及到降低图像分辨率时，平滑处理是非常好用的方法。

1.2 图像滤波与滤波器

图像滤波，指在尽量保留图像细节特征的条件下对标图像的噪声进行抑制，是图像预处理中不可缺少的操作，其处理效果的好坏将直接影响到后续图像处理和分析的有效性和可靠性。

消除图像中的噪声成分叫做图像的平滑化或者滤波操作。信号或图像的能量大部分集中在幅度谱的低频和中频段，有用的信息经常被噪声淹没。因此一个能降低高频成分幅度的滤波器就能够减少噪声的影响。

图像滤波的目的有两个：一个是抽出对象的特征作为图像识别的特征模式；另一个是为适应图像处理的要求，消除图像数字化时所混入的噪声。

而对滤波处理的要求也有两条：一是不能损坏图像的轮廓及边缘等重要信息；二是使图像清晰视觉效果好。

平滑滤波是低频增强的空间域滤波技术。它的目的有两类：一类是模糊；另一类是消除噪音。

空间域的平滑滤波一般才用简单平均法进行，就是求邻近像元点的平均亮度值。邻域的的大小与平滑的效果直接相关，邻域越大平滑的效果越好，但邻域过大，平滑也会使边缘信息损失的越大，从而使输出的图像变得模糊，因此需合理选择邻域的大小。

关于滤波器，一种形象的比喻就是：可以把滤波器想象成一个包含加权系数的窗口，当使用这个滤波器平滑处理图像时，就把这个窗口放到图像上，透过这个窗口来看我们得到的图像。

滤波器的种类有很多：

方框滤波——BoxBlur函数
均值滤波——Blur函数
高斯滤波——GaussianBlur函数
中值滤波——medianBlur函数
双边滤波——bilateralFilter函数

1.3 线性滤波器的简介

线性滤波器经常用于提出输入信号中不想要的频率或者从许多频率中选择一个想要的频率。

低通滤波器：允许低频率通过
高通滤波器：允许高频率通过
带通滤波器：允许一定范围频率通过
带阻滤波器：阻止一定范围频率通过并且允许其他频率通过
全通滤波器：允许所有频率通过，仅仅改变相位关系
陷波滤波器：阻止一个狭窄频率范围通过，是一种特殊的带阻滤波器。

1.4 滤波和模糊

滤波是将信号中特定波段频率滤除的操作，是防止和抑制干扰的一项重要措施。
以高斯滤波为例：滤波可分为低通滤波和高通滤波两种：高斯滤波是指用高斯函数作为滤波函数的滤波操作，至于是不是模糊，就要看是高斯低通还是高斯高通，低通就是模糊，高通就是锐化。

1.5 邻域算子与线性邻域滤波

邻域算子（局部算子）是利用给定像素周围的像素值的决定此像素的最终输出值的一种算子。而线性邻域滤波就是一种常用的邻域算子，像素的输出值取决于输入像素的加权和。

邻域算子除了用于局部色调调整以外，还可以用于图像滤波，以实现图像的平滑和锐化、图像边缘增强或者图像噪声的去除。

1.6 方框滤波

方框滤波被封装在一个名为boxblur的函数中，即boxblur函数的作用是使用方框滤波器来模糊一行图片
void boxFilter(InputArray src, OutputArray dst, int ddepth, Size ksize, Point anchor=Point(-1,-1), bool normalize=true, int borderType=BORDER_DEFAULT)

第一个参数：输入图像
第二个参数：输出图像，与源图像有一样的尺寸和类型
第三个参数：输出图像的深度，-1代表使用原图深度
第四个参数：内核的大小
第五个参数：锚点；默认值Point(-1,-1)表示锚点在内核中心。
第六个参数：指定内核是否按其区域进行归一化。
第七个参数：用于推断图像外部像素的某种边界模式。

boxFilter()函数方框滤波所用的核表示如下：

1.7 均值滤波

均值滤波，是最简单的一种滤波操作，输出图像的每一个像素是核窗口内输入图像对应像素的平均值。其实说白了它就是归一化后的方框滤波。

均值滤波的缺陷
均值滤滤波本身存在着固有的缺陷，即它不能很好地保护图像细节，在图像去噪的同时也破坏了图像的细节部分，从而使图像变得模糊，不能很好地去除噪声点。

void blur(InputArray src, OutputArray dst, Size ksize, Point anchor=Point(-1,-1),int borderType=BORDER_DEFAULT)
参数可参考方框滤波。

1.8 高斯滤波

void GaussianBlur(InputArray src, OutputArray dst, Size ksize, double sigmaX, double sigmaY=0, int borderType=BORDER_DEFAULT)

第一个参数：输入图像；该图像可以有任何数量的通道，它们被独立处理，但深度应该是CV_8U、CV_16U、CV_16S、CV_32F或CV_64F。
第二个参数：输出图像
第三个参数：高斯内核的大小
第四个参数：表示高斯核函数在X方向的标准偏差
第五个参数：Y方向的高斯核标准差；如果sigmaY为零，则设置为等于sigmaX，如果两个sigmas都为零，则分别从ksize.width和ksize.height中计算出来。
第六个参数：用于推断图像外部像素的某种边界模式。有默认值BORDER_DEFAULT，我们一般不去管它。

深度的概念
图像深度是指存储每个像素所用的位数,也用于量度图像的色彩分辨率.图像深度确定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。他决定了彩色图像中可出现的最多颜色数，或灰度图像中的最大灰度等级。

1.9 线性滤波综合案例

#include
using namespace std;
using namespace cv;

//-----------------全局变量声明-------------------
Mat g_srcImage, g_dstImage1, g_dstImage2, g_dstImage3;//存储图
int g_nBoxFilterValue = 3; //方框滤波参数值
int g_nMeanBlurValue = 3;//均值滤波参数值
int g_nGaussianBlurValue = 3;//高斯滤波参数值

//方框滤波操作的回调函数
static void on_BoxFilter(int, void*) {
	boxFilter(g_srcImage, g_dstImage1, -1, Size(g_nBoxFilterValue + 1, g_nGaussianBlurValue + 1));
	imshow("方框滤波", g_dstImage1);
}

//均值滤波的回调函数
static void on_MeanBlur(int, void*) {
	blur(g_srcImage, g_dstImage2, Size(g_nMeanBlurValue + 1, g_nMeanBlurValue + 1));
	imshow("均值滤波",g_dstImage2);
}

//高斯滤波
static void on_GaussianBlur(int, void*) {
	GaussianBlur(g_srcImage, g_dstImage3, Size(g_nGaussianBlurValue * 2 + 1, g_nGaussianBlurValue * 2 + 1), 0, 0);
	imshow("高斯滤波", g_dstImage3);
}

int main() {
	g_srcImage = imread("../../image/lena_color_256.tif");
	if (!g_srcImage.data)  cout << "图片读取错误" << endl;

	//赋值原图到三个Mat类型中
	g_dstImage1 = g_srcImage.clone();
	g_dstImage2 = g_srcImage.clone();
	g_dstImage3 = g_srcImage.clone();
	
	namedWindow("原始窗口");
	imshow("原始窗口",g_srcImage);

	namedWindow("方框滤波");
	createTrackbar("内核值：","方框滤波",&g_nBoxFilterValue,40,on_BoxFilter);
	on_BoxFilter(g_nBoxFilterValue, 0);


	namedWindow("均值滤波");
	createTrackbar("内核值：", "均值滤波", &g_nMeanBlurValue, 40, on_MeanBlur);
	on_MeanBlur(g_nMeanBlurValue, 0);

	namedWindow("高斯滤波");
	createTrackbar("内核值：", "高斯滤波", &g_nGaussianBlurValue, 40, on_GaussianBlur);
	on_GaussianBlur(g_nGaussianBlurValue, 0);

	waitKey();
	return 0;
}

2.非线性滤波：中值滤波、双边滤波

2.1 中值滤波

中值滤波是一种典型的非线性滤波技术，基本思想是用像素点邻域灰度值的中值来代替像素点的灰度值，该方法在去除脉冲噪声、椒盐噪声的同时又能保留图像的边缘细节。
中值滤波是基于排序统计理论的一种能够有效抑制噪声的非线性信号处理技术，其基本原理是把数字图像或数字序列中一点的值用该店的一个林与众个点至的中值代替，该周围的像素值接近真实值，从而消除孤立的噪声点。这对于斑点噪声和椒盐噪声来说尤其有用，因为他不依赖于邻域内那些典型值差别很大的值。中值滤波器在处理连续图像窗函数时与线性滤波器的工作方式类似，但滤波过程不再是加权运算。
中值滤波在一定的条件下可以克服常见线性滤波器，如最小均方滤波、方框滤波、均值滤波等带来的图像细节模糊，而且对滤除脉冲干扰及图像扫描噪声非常有效，也常用于保护边缘信息。保存边缘的特征使它在不希望出现边缘模糊的场合也很有用，是非常经典的平滑噪声处理方式。

中值滤波与均值滤波器比较
优势：在均值滤波器中，由于噪声成分被放入平均计算中，所以输出受到了噪声的影响。但是在中值滤波器中，由于噪声成分很难被选上，所以几乎不会影响到输出。因此同样用33区域进行处理，中值滤波消除的噪声能力更胜一筹。中值滤波无论是在消除噪声还是保存边缘方面都是一个不错的方法。
劣势：中值滤波花费的时间是均值滤波的5倍以上。
顾名思义，中值滤波选择每个像素的邻域像素中的中值作为输出，或者说中值滤波将每一像素点的灰度值设置为该点某邻域窗口内的所有像素点灰度值的中值。
例如，去33的函数窗，计算以点[i,j]为中心的函数窗像素中值，具体步骤如下。
1）按强度值大小排列像素点
2）选择排序像素集的中间值作为点[i,j]的新值。
一般采用奇数点的邻域来计算中值，但像素点数为偶数时，中值就取排列像素中间两个点的平均值。

中值滤波在一定条件下，可以克服线性滤波器(如均值滤波等)所带来的图像细节模糊，对滤除脉冲干扰即图像扫描噪声最为有效，而且在实际运算过程中并不需要图像的统计特性，也给计算带来不少方便。但是对一些细节(特别是细、尖顶等)多的图像不太适合。

void medianBlur(InputArray src, OutputArray dst, int ksize)

第一个参数：填1、3或者4通道的Mat类型图像。当ksize为3或者5的使用，图像深度需为CV_8U、CV_16U、CV_32F其中之一，而对于较大孔径尺寸的图片，它只能是CV_8U。
第二个参数：函数的输入参数，需要和源图片有一样的尺寸和类型。我们可以用Mat::Clone，以源图片为模板，来初始化得到如假包换的目标图。
第三个参数：int类型的ksize，孔径的线性尺寸，注意这个参数必须是大于1的奇数。

2.2 双边滤波

双边滤波是一种非线性的滤波方法，是结合图像的空间邻近度和像素值相似度的一种折中处理，同时考虑空域信息和灰度相似性，达到保边去噪的目的，具有简单、非迭代、局部的特点。
双边滤波器的好处是可以做边缘保存。以往常用维纳滤波或者高斯滤波去降噪，但二者都会较明显地模糊边缘，对于高频细节的保护效果并不明显。双边滤波器顾名思义，比高斯滤波多了一个高斯方差sigma-d，它是基于空间分布的高斯滤波函数，所以在边缘附近，离得较远的像素不会对边缘上的像素值影响太多，这样就保证了边缘附近像素值的保存。但是，由于保存了过多的高频信息，多余彩色图像里的高频噪声，双边滤波器不能够干地滤掉，知识对于低频信息系进行了比较好的滤波。
void bilateralFilter(InputArray src, OutputArray dst, int d, double sigmaColor, double sigmaSpace, int borderType=BORDER_DEFAULT)

第一个参数：输入图像，需要为8位或者浮点型单通道、三通道图像。
第二个参数：输出图像，需要和源图像有一样的类型和尺寸。
第三个参数：表示在过滤过程中每个像素邻域的直径。如果这个值被设置为非正数，那么OpenCV会从第五个参数sigmaSpace计算出来它。
第四个参数：颜色空间滤波器的sigma值。这个参数的值越大，就表明该像素淋浴呢优越宽广的颜色会被混合到一起，产生较大的半相等颜色区域。
第五个参数：坐标空间中滤波器的是sigma值，坐标空间的标注方差。它的数值越大，意味着越远的像素会相互影响，从而使更大的区域中足够相似的颜色获取相同的颜色。当d>0，d指定了邻域大小且与sigmaSpace无缘。否则d正比于sigmaSpace。
第六个参数：用于推断图像外的像素的边界模式。

2.3 综合案例

#include
using namespace std;
using namespace cv;

Mat srcImage, dstImage1, dstImage2;
int g_nMedianBlurValue = 10; //中值滤波参数值
int g_nBilateralFilterValue = 10;//双边滤波参数值

//中值滤波操作的回调函数
static void on_MedianBlur(int, void*) {
	medianBlur(srcImage, dstImage1, g_nMedianBlurValue * 2 + 1);
	imshow("中值滤波", dstImage1);
}

//双边滤波操作的回调函数
static void on_BilateralFilter(int, void*) {
	bilateralFilter(srcImage, dstImage2, g_nBilateralFilterValue, g_nBilateralFilterValue * 2, g_nBilateralFilterValue / 2);
	imshow("双边滤波", dstImage2);
}


int main() {
	srcImage = imread("../../image/1.tif");
	if (!srcImage.data) {
		cout << "图片读入错误" << endl;
		return false;
	}
	dstImage1 = srcImage.clone();
	dstImage1 = srcImage.clone();
	namedWindow("原图", 0);
	imshow("原图", srcImage);

	//中值滤波
	namedWindow("中值滤波", 0);
	createTrackbar("参数值：", "中值滤波", &g_nMedianBlurValue, 50, on_MedianBlur);
	on_MedianBlur(g_nMedianBlurValue, 0);
	
	//双边滤波
	namedWindow("双边滤波", 0);
	createTrackbar("参数值：", "双边滤波", &g_nBilateralFilterValue, 50, on_BilateralFilter);
	on_BilateralFilter(g_nBilateralFilterValue, 0);

	waitKey();
	return 0;

}

3.形态学滤波(1):腐蚀与膨胀

形态学操作就是基于形状的一系列图像处理操作。最基本的形态学操作有两种，分别是：膨胀与腐蚀。
膨胀与腐蚀能实现多种多样的功能，主要如下。

消除噪声
分割出独立的图像元素，在图像中连接相邻的元素
寻找图像中的明显的极大值区域和极小值区域
求出图像的梯度

3.1 膨胀

膨胀（dialate）就是求局部最大值的操作。从数学角度来说，膨胀或者腐蚀操作就是将图像与核进行卷积。
核可以死任何形状和大小，它拥有一个单独定义出来的参考点，我们称其为锚点。多数情况下，核实一个小的，中间带有参考点和实心正方形或者圆盘。其实，可以把核视为模板或者掩码。
而膨胀就是求局部最大值的操作。核与图形卷积，计算核覆盖的区域的像素点的最大值，并把这个最大值赋值给参考点指定的像素。这样就会使图像中的高亮区域逐渐增长。

第一个参数：输入图像
第二个参数：输出图像和源图像有桐乡的类型和尺寸
第三个参数：用于膨胀操作的核；如果 element=Mat()，则使用一个 3 x 3 的矩形结构元素。一般使用getStructuringElement函数配合这个参数使用。geiStructuringElement函数会返回指定形状和尺寸的结构元素。其中，getStructuringElement函数的第一个参数表示内核的形状。第二个和第三个参数分别是内核尺寸以及锚点的位置。
第四个参数：锚点在元素中的位置；默认值（-1，-1）意味着锚点位于元素中心。
第五个参数：迭代使用dilate()函数的次数
第六个参数：用于推断图像外部像素的某种边界模式
第七个参数：const Scalar&类型的borderType，用于推断图像外部像素的某种边界模式。
使用dilate函数，一般只需要填前面的三个参数，后面的四个参数都有默认值，而且往往结合getStructuringElement一起使用。

3.2 腐蚀

膨胀和腐蚀(erode)是相反的一对操作，所以腐蚀就是求局部最小值的操作。

3.3 腐蚀和膨胀综合案例

#include
using namespace std;
using namespace cv;

Mat srcImage, dstImage;
int g_nTrackbarNumer = 0;//0表示腐蚀，1表示膨胀
int g_nStructElementSize = 3;//结构元素的尺寸

//进行自定义的腐蚀和膨胀操作
void Process() {
	Mat element = getStructuringElement(MORPH_RECT, Size(2 * g_nStructElementSize * 2 + 1, 2 * g_nStructElementSize * 2 + 1),
		Point(g_nStructElementSize, g_nStructElementSize));

	if (g_nTrackbarNumer == 0)
		erode(srcImage, dstImage, element);
	else
		dilate(srcImage, dstImage, element);

	imshow("效果图", dstImage);
}

//膨胀和腐蚀之间切换开关的回调函数
void on_TrackbarNumChange(int, void*) {
	Process();
}

//膨胀和腐蚀操作内核改变时的回调函数
void on_ElementSize(int, void*) {
	Process();
}

int main() {
	srcImage = imread("../../image/1.tif");
	if (!srcImage.data) {
		cout << "读取图片错误" << endl;
		return false;
	}
	namedWindow("原图",0);
	imshow("原图", srcImage);

	namedWindow("效果图", 0);

	Mat element = getStructuringElement(MORPH_RECT,
		Size(2 * g_nStructElementSize + 1, 2 * g_nStructElementSize * 2 + 1),
		Point(g_nStructElementSize, g_nStructElementSize));
	erode(srcImage, dstImage, element);
	imshow("效果图", dstImage);

	//创建轨迹条
	createTrackbar("腐蚀/膨胀", "效果图", &g_nTrackbarNumer, 1, on_TrackbarNumChange);
	createTrackbar("内核尺寸", "效果图", &g_nStructElementSize, 21, on_ElementSize);
	
	waitKey();
	return 0;
}

4.形态学滤波(2):开运算、闭运算、形态学梯度、顶帽、黑帽

本节的主角是OpenCV中的morphologyEx函数，他利用基本的膨胀和腐蚀技术，来执行更加高级的形态学变换，如开闭运算、形态学梯度、顶帽、黑帽等。我们需要知道形态学的高级形态，往往都是建立在复试和膨胀这两个基本操作之上的。

4.1 开运算

开运算(Opening Operation)，其实就是先腐蚀后膨胀的过程。
dst=open(src,element)=dilate(erode(src,element))
开运算可以用来消除小物体，在纤细点处分离物体，并且在平滑较边界的同时不明显改变其面积。
例如，请看下面的例子。左边的图像是原始图像，右边的图像是应用开运算后的结果。我们可以观察到，小圆点已经消失了。

4.2 闭运算

先膨胀后腐蚀的过程成为闭运算(Closing Operation)
dst=close(src,element)=erode(dilate(src,element)
闭运算能够排除小型黑洞(黑色区域)。

4.3 形态学梯度

形态学梯度(Morphological Gradient)是膨胀图与腐蚀图之差。
dst=morph-grad(src,element)=dialate(src,element)-erode(src,element)
它对寻找图像的轮廓很有用。

4.4 顶帽

顶帽运算(Top Hat)又常常被译为"礼帽"运算，是源图像与开运算之差。
dst=tophat(src,element)=src-open(src,element)
因为开运算带来的结果是放大了裂缝或者局部低亮度的区域。因此，从原图中减去开运算后的图，得到的效果突出了比原图轮廓周围的区域更明亮的区域，且这一操作与选择的核的大小相关。

顶帽运算往往用来分离比邻近点亮一些的斑点。在一幅图像具有大幅的背景，而微小物品比较有规律的情况下，可以使用顶帽运算进行背景提取。

4.5 黑帽

黑帽(Black Hat)运算是闭运算的结果图与原图像之差。
dst=blackhat(src,element)=close(src,element)-src
黑帽运算后的效果图突出了比原图轮廓周围的区域更暗的区域，且这一操作和选择的核的大小相关。所以黑猫运算用来分离比邻近点暗一些的斑块，效果图有着非常完美的轮廓。

4.6 morphologyEx()函数

第一个参数：输入图像
第二个参数：输出图像
第三个参数：形态学操作的类型
第四个参数：核元素。它可以用getStructuringElement创建。
第五个参数：锚点与内核的位置。负值意味着锚点在内核中心。
第六个参数：应用函数的次数，默认值为1。

4.7 综合案例：形态学滤波

#include
using namespace std;
using namespace cv;

Mat g_srcImage, g_dstImage;
int g_nElementShape = MORPH_RECT;//元素结构的形状

//TrackBar参数
int g_nMaxIterationNum = 10;
int g_nOpenCloseNum = 0;
int g_nErodeDilateNum = 0;
int g_nTopBlackHatNum = 0;

// 开运算/闭运算窗口的回调函数
static void on_OpenClose(int, void*) {
	//偏移量的定义
	int offset = g_nOpenCloseNum - g_nMaxIterationNum;//偏移量
	int Absolute_offset = offset > 0 ? offset : -offset;

	//核
	Mat element = getStructuringElement(g_nElementShape,
		Size(Absolute_offset * 2 + 1, Absolute_offset * 2 + 1),
		Point(Absolute_offset, Absolute_offset));
	
	if (offset < 0)
		morphologyEx(g_srcImage, g_dstImage, MORPH_OPEN, element);
	else
		morphologyEx(g_srcImage, g_dstImage, MORPH_CLOSE, element);

	imshow("开运算/闭运算", g_dstImage);
}

// 腐蚀/膨胀窗口的回调函数
static void on_ErodeDilate(int, void*) {
	//偏移量的定义
	int offset = g_nErodeDilateNum - g_nMaxIterationNum;//偏移量
	int Absolute_offset = offset > 0 ? offset : -offset;

	//核
	Mat element = getStructuringElement(g_nElementShape,
		Size(Absolute_offset * 2 + 1, Absolute_offset * 2 + 1),
		Point(Absolute_offset, Absolute_offset));

	if (offset < 0)
		morphologyEx(g_srcImage, g_dstImage, MORPH_ERODE, element);
	else
		morphologyEx(g_srcImage, g_dstImage, MORPH_DILATE, element);

	imshow("腐蚀/膨胀", g_dstImage);
}

// 顶帽/黑帽窗口的回调函数
static void on_TopBlackHat(int, void*) {
	//偏移量的定义
	int offset = g_nErodeDilateNum - g_nMaxIterationNum;//偏移量
	int Absolute_offset = offset > 0 ? offset : -offset;

	//核
	Mat element = getStructuringElement(g_nElementShape,
		Size(Absolute_offset * 2 + 1, Absolute_offset * 2 + 1),
		Point(Absolute_offset, Absolute_offset));

	if (offset < 0)
		morphologyEx(g_srcImage, g_dstImage, MORPH_TOPHAT, element);
	else
		morphologyEx(g_srcImage, g_dstImage, MORPH_BLACKHAT, element);

	imshow("顶帽/黑帽", g_dstImage);
}



int main() {
	g_srcImage = imread("../../image/1.tif");
	namedWindow("原始图",0);
	imshow("原始图", g_srcImage);

	namedWindow("开运算/闭运算",0);
	namedWindow("腐蚀/膨胀", 0);
	namedWindow("顶帽/黑帽", 0);

	//参数赋值
	g_nOpenCloseNum = 9;
	g_nErodeDilateNum = 9;
	g_nTopBlackHatNum = 2;

	//分别为三个窗口创建滚动条
	createTrackbar("迭代值", "开运算/闭运算", &g_nOpenCloseNum,
		2 * g_nMaxIterationNum + 1, on_OpenClose);
	on_OpenClose(g_nOpenCloseNum, 0);

	createTrackbar("迭代值", "腐蚀/膨胀", &g_nErodeDilateNum,
		2 * g_nMaxIterationNum + 1, on_ErodeDilate);
	on_OpenClose(g_nOpenCloseNum, 0);

	createTrackbar("迭代值", "顶帽/黑帽", &g_nTopBlackHatNum,
		2 * g_nMaxIterationNum + 1, on_TopBlackHat);
	

	while (1) {
		int c;
		on_OpenClose(g_nOpenCloseNum, 0);
		on_ErodeDilate(g_nErodeDilateNum, 0);
		on_TopBlackHat(g_nTopBlackHatNum, 0);
		c = waitKey(0);//获取按键

		//按下q或者esc程序退出
		if ((char)c == 'q', (char)c == 27)
			break;
		if ((char)c == 49) //1的ASCII码
			g_nElementShape = MORPH_ELLIPSE;
		else if ((char)c == 50)
			g_nElementShape = MORPH_RECT;
		else if ((char)c == 51)
			g_nElementShape = MORPH_CROSS;

		else if ((char)c == ' ')
			g_nElementShape = (g_nElementShape + 1) % 3;
	}
	return 0;
}

5.漫水填充

漫水填充是一种用特定的颜色填充连通区域，通过设置可连通像素的上下限以及连同方式，来达到不同的填充效果的方法。漫水填充经常被用来标记或分离图像的一部分，以便其进行进一步处理或分析，也可以用来从输入图像获取掩码区域，掩码会加速处理的过程，或只处理掩码指定的像素点，操作的结果总是某个连续的区域。

5.1 漫水填充：floodFill函数

第一个版本的floodFill():带有掩膜mask

第一个版本的floodFill():不带掩膜mask

第一个参数：输入/输出1或3通道、8位或浮点图像。
第二个参数：操作掩码，应该是一个单通道的8位图像，比图像宽2像素，高2像素。如果传递了一个空的Mat，它将被自动创建。由于这既是一个输入参数又是一个输出参数，你必须负责初始化它。填充不能跨越输入掩码中的非零像素。例如，一个边缘检测器的输出可以作为一个掩码，在边缘停止填充。在输出时，掩码中与图像中的填充像素相对应的像素被设置为1或如下所述的标志中的指定值。此外，该函数用1填充蒙版的边界，以简化内部处理。因此，可以在多次调用该函数时使用同一个掩码，以确保填充的区域不重叠。
第三个参数：漫水填充算法的起始点。
第四个参数：像素点被染色的值，即在重绘区域像素的新值。
第五个参数：用于设置floodFill函数将要重绘区域的最小边界矩形区域。
第六个参数：Scalar类型的loDiff，有默认值Scalar()，表示当前观察像素值与其部件邻域像素值或者待加入该部件的种子像素之间的亮度或颜色之负差的最大值。
第七个参数：upDiff，有默认值Scalar()，表示当前观察像素值与其部件邻域像素值或者待加入该部件的种子像素之间的亮度或颜色之正差的最大值。
第八个参数：操作标志。前8位包含一个连接值。默认值为4意味着只考虑四个最近的邻居像素（那些共享一个边缘的像素）。连通性值为8意味着八个最近的邻居像素（那些共享一个角的像素）将被考虑。接下来的8位（8-16）包含一个1到255之间的值，用来填充掩码（默认值是1）。例如，4 | ( 255 << 8 ) 将考虑4个最近的邻居，并以255的值填充遮罩。下面的附加选项占据了更高的位数，因此可以使用位数或（|）与连接性和掩码填充值进一步结合。

#include
using namespace std;
using namespace cv;

int main() {
	Mat src = imread("../../image/1.tif");
	imshow("原图", src);
	Rect ccomp;
	floodFill(src, Point(250, 250), Scalar(0, 255, 0), &ccomp,
		Scalar(20, 20, 20), Scalar(20, 20, 20));
	imshow("效果图", src);
	waitKey();
	return 0;
}

6.图像金字塔与图片尺寸缩放

6.1 引言

我们经常会蒋某中尺寸的图像转换成其他尺寸的图像，如果要放大或者缩小图片的尺寸，可以用OpenCV提供的如下两种方法。

resize函数。这是最直接的方式。
pyrUp()、PyrDown()函数。即图像金字塔相关的两个函数，对图像进行向上采样和向下采样的操作。

6.2 关于图像金字塔

图像金字塔是图像中多尺度表达的一种，最主要用于图像的分割，是一种以多分辨率来解释图像的有效但概念简单的结构。
图像金字塔最初用于机器视觉和图像压缩，一幅图像的金字塔是一系列以金字塔形状排列的，分辨率逐步降低且来源于同一张原始图片的几何。其通过梯次向下采样获得，直到达到某个终止条件才停止采样。
金字塔的底部是待处理图像的高分辨率表示，而顶部是低分辨率的近似。我们将一层一层的图像比喻成金字塔，层级越高，则图像越小，分辨率越低。

一般有两种类型的图像金字塔出现在文献以及实际应用中。

高斯金字塔——用来向下采样，主要的图像金字塔
拉普拉斯金字塔——用来从金字塔底层图像重建上层未采样的图像，在数字图像处理中也即是预测残差，可以对图像进行最大程度的还原，配合高斯金字塔一起使用。
要从金字塔第i层生成第i+1层(从下往上，第i+1层表示为G_i+1)，我们先要用高斯核对G_i进行卷积，然后删除所有偶数行和偶数列，新得到图像面积会变成源图像的四分之一。按上诉过程对输入图像G₀执行操作就可产生出整个金字塔。
对图像向上采样——pyrUp函数
对图像向下采样——pyrDown函数
这里的向下和向上采样，是针对图像的尺寸而言的(和金字塔的方向相反)，向上就是图像尺寸加倍，向下就是尺寸减半。
但需要注意的是，pryUp和pryDown不是互逆的操作，即pryUp不是降采样的逆操作。这种情况下，图像首先在每个维度上扩大为原来的两倍，新增的行(偶数行)以0填充。然后给指定的滤波器进行卷积(实际上是一个在每个维度都扩大为原来两倍的过滤器)去估计“丢失”像素的近似值。
pryDown()是一个会丢新信息的函数。为了恢复原来更高的分辨率的图像，我们要获得由降采样操作丢失的信息，这些数据就和拉普拉斯金字塔有关了。

6.3 高斯金字塔

高斯金字塔是通过高斯平滑和亚采样获得一系列下采样图像，也就是说第K层高斯金字塔通过平滑、亚采样就能获得K+1层高斯图像。高斯金字塔包含了一系列低通滤波器，期截止频率从上一层到下一层以因子2逐渐增加，所以高斯金字塔可以跨越很大的频率范围。
1.对图像的向下采样
为了获取层级为G_i+1的金字塔图像，我们采用如下方法：
1）对图像G_i进行高斯内核卷积
2）将所有偶数行和列去除
得到的图像即为G_i+1的图像。显而易见，结果图像只有原图像的四分之一。通过对输入图像G_i不停迭代以上步骤就会得到整个金字塔。同时我们也可以看到，向下取样会逐渐丢失图像的信息。

2.对图像的向上采样
如果想放大图像,则需要通过向上采样操作得到,具体方法如下。
1）将图像在每个方向扩大为原来的两倍，新增的行和列以0填充
2）使用先前同样的内核(乘以4)与放大后的图像卷积，获得"新增像素"的近似值。
得到的图像即为放大后的图像，但是与原来的图像相比会发觉比较模糊，因为在缩放的过程中已经丢失了一些信息。如果想在缩小和放大整个过程这能够减少信息的丢失，这些数据就形成了拉普拉斯金字塔。

6.4 拉普拉斯金字塔

关于图像金字塔非常重要的一个应用就是图像分割。图像分割的话，先要建立一个图像金字塔，然后对G_i和G_i+1的直接依照对应的关系，建立起"父与子"关系。而快速初始化分割可以现在金字塔高层的低分辨率上完成，然后逐层对分割加以优化。

6.5 图像金字塔相关API函数

1.向上采样pyrUp()函数
pyrUp()函数的作用是向上采样并模糊一张图像，说白了就是放大一张图片。
void pyrUp(InputArray src,OutputArray dst,const Size& dstsize=Size(),int borderType=BORDER_DEFAULT)

第一个参数：InputArray类型的src，输入图像，即源图像
第二个参数：输出图像
第三个参数：const Size&类型的dstsize，输出图像的大小；有默认值Size()，即默认情况下，由Size(src.cols2,src.rows2)来进行计算。

#include
using namespace std;
using namespace cv;

int main() {
	Mat srcImage = imread("../../image/lena_color_256.tif");
	Mat tmpImage, dstImage;
	tmpImage = srcImage;

	imshow("原图", srcImage);
	
	pyrUp(tmpImage, dstImage, Size(tmpImage.cols * 2, tmpImage.rows * 2));

	imshow("效果图", dstImage);
	waitKey();
	return 0;
}

2.向下采样pyrDown()函数

#include
using namespace std;
using namespace cv;

int main() {
	Mat srcImage = imread("../../image/lena_color_256.tif");
	Mat tmpImage, dstImage;
	tmpImage = srcImage;

	imshow("原图", srcImage);
	
	pyrDown(tmpImage, dstImage, Size(tmpImage.cols / 2, tmpImage.rows / 2));

	imshow("效果图", dstImage);
	waitKey();
	return 0;

}

6.6 尺寸调整：resize()函数

resize()函数将源图像精确地转换为指定尺寸的目标图像。如果原图像中设置了ROI，那么resize()函数会对原图像的ROI区域进行调整图像尺寸的操作，来输出到目标图像中。若目标图像中已经设置了ROI区域，不难理解resize()将会对源图像进行尺寸调整并填充到目标图像的ROI中。
很多时候，我们并不用考虑第二个参数dst的初始图像和尺寸(即直接定义一个Mat类型，不用对其初始化)，因为其尺寸和类型可以由src，dsize、fx和fy这几个参数确定
void resize(InputArray src, OutputArray dst, Size dsize, double fx=0, double fy=0, int interpolation=INTER_LINEAR)

第一个参数：InputArray类型的src，输入图像，即源图像，填Mat类的对象即可。
第二个参数：输出图像；它的大小为dsize（当它不为零时）或由src.size()、fx和fy计算出的大小；dst的类型与src的类型相同。
第三个参数：输出图像的大小。如果它为0时，计算公式如下：

$d s i ze = S i ze (ro u n d (f x * src . co l s), ro u n d (f y * src . ro w s))$
第四个参数：沿着水平轴的缩放系数；当它等于0时，它被计算为

$(d o u b l e) d s i ze . w i d t h / src . co l s$
第五个参数：沿纵轴的缩放系数；当它等于0时，它被计算为

$(d o u b l e) d s i ze . h e i g h t / src . ro w s$

resize的调用范例：
方式一：

Mat dstImage = Mat::zeros(512,512,CV_8UC3);
Mat srcImage=imread("../../image/1.tif");
//显示指定dsize=dstImage.size()，那么fx和fy会被计算出来，不用额外指定
resize(srcImage,dstImage,dstImage.size());

方式二：

Mat dstImage;
Mat srcImage=imread("../../1.tif");
//指定fx和fy，让函数计算出目标图像的大小
resize(srcImage,dstImage,Size(),0.5,0.5);

resize函数案例

#include
using namespace std;
using namespace cv;

int main() {
	Mat srcImage = imread("../../image/lena_color_256.tif");
	Mat tmpImage, dstImage1, dstImage2;
	tmpImage = srcImage;
	imshow("原始图", srcImage);

	resize(tmpImage, dstImage1, Size(tmpImage.cols / 2, tmpImage.rows / 2),
		(0, 0), (0, 0), 3);

	resize(tmpImage, dstImage2, Size(tmpImage.cols * 2, tmpImage.rows * 2),
		(0, 0), (0, 0), 3);

	imshow("缩小", dstImage1);
	imshow("放大", dstImage2);

	waitKey();
	return 0;
}

7 阈值化

在对各种图形进行处理操作的工程中，我们常常需要对图像中的像素做出取舍与决策，直接提出一些低于或高于一定值的像素。
阈值可以被视作最简单的图像分割方法。比如，从一幅图像中利用阈值分割出我们需要的物体部分。这样的图像分割方法基于图像中物体与背景之间的灰度差异，而且此分割属于像素级的分割。为了从一幅图像中提取我们需要的部分，用该用图像中的每一个像素点的灰度值与选取的阈值进行比较，并作出相应的判断。注意:阈值的选取依赖于具体的问题。即物体在不同的图像中有可能会有不同的灰度值。
一旦找到了需要分割的物体的像素点，可以对这些像素点设定一些特定的值来表示。例如，可以将该物体的像素点的灰度值设置为0(黑色)，其他的像素点灰度值为255(白色)。当然像素点的灰度值可以任意，但最好设定的两种颜色对比度较强，以方便观察结果。

7.1 固定阈值操作：Threshold()

函数Threshold()对单通道数组应用固定阈值操作。该函数的典型应用是对灰度图像进行阈值操作得到二值图像(compare()函数也可以达到此目的)或者是去掉噪声，例如过滤很小或很大像素值的图像点。
double threshold(InputArray src,OutputArray dst,double thresh,double maxval,int type)

第一个参数：输入图像（多通道，8位或32位浮点）。
第二个参数：与src相同大小和类型、相同通道数的输出阵列。
第三个参数：阈值
第四个参数：与 THRESH_BINARY 和 THRESH_BINARY_INV 阈值类型一起使用的最大值。
第五个参数：阈值类型

7.2 自适应阈值操作：adaptiveThreshold()函数

void adaptiveThreshold ( InputArray src, OutputArray dst, double maxValue, int adaptiveMethod, int thresholdType, int blockSize, double C )

第一个参数：输入图像
第二个参数：输出图像
第三个参数：给像素赋的满足条件的非零值
第四个参数：用于指定要使用的自适应阈值算法，可取值为ADAPTIVE_THRESH_MEAN_C或ADAPTIVE_THRESH_GAUSSIAN_C。
第五个参数：阈值类型，取值必须为THRESH_BINARY、THRESH_BINARY_INV其中之
第六个参数：int类型的blockSize，用于计算阈值大小的一个像素的邻域尺寸，取值为3，5，7等。
第七个参数：double类型的C，减去平均或加权平均值后的常数值。

7.3 阈值操作综合案例

#include
using namespace std;
using namespace cv;

#define WINDOW_NAME "程序窗口"

int g_nThreshouldValue = 100;
int g_nThreshouldType = 3;
Mat g_srcImage, g_grayImage, g_dstImage;


void on_Threshold(int, void*) {
	threshold(g_grayImage, g_dstImage, g_nThreshouldValue,
		255, g_nThreshouldType);

	imshow(WINDOW_NAME, g_dstImage);
}

int main() {
	g_srcImage = imread("../../image/1.tif");
	if (!g_srcImage.data) {
		cout << "读取图片失败" << endl;
		return false;
	}

	cvtColor(g_srcImage, g_grayImage, COLOR_RGB2GRAY);
	imshow("原图", g_grayImage);
	namedWindow(WINDOW_NAME);

	createTrackbar("模式", WINDOW_NAME, &g_nThreshouldType,
		4, on_Threshold);

	createTrackbar("参数值", WINDOW_NAME, &g_nThreshouldValue,
		255, on_Threshold);

	on_Threshold(0, 0);

	while (1) {
		int key;
		key = waitKey(20);
		if ((char)key == 27)
			break;
	}
}

你可能感兴趣的:(Opencv,opencv,图像处理,计算机视觉)

景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
OpenCV 4.2.0与扩展模块安装与应用指南土城三富
本文还有配套的精品资源，点击获取简介：OpenCV4.2.0是一个先进的计算机视觉库，包含了图像处理、计算机视觉和机器学习算法。本压缩包包含OpenCV核心库和扩展模块（opencv_contrib），版本均为4.2.0。该版本引入了性能增强、API优化以及对深度学习框架和硬件加速技术的更新支持。扩展模块提供了额外的实验性算法和功能，有助于研究和开发新算法。指南详细介绍了如何安装和配置这些库，并提
OpenCV ML 模块使用指南 ice_junjun OpenCV opencv 人工智能计算机视觉
一、模块概述OpenCV的ML模块提供了丰富的机器学习算法，可用于解决各种计算机视觉和数据分析问题。本指南将详细介绍该模块中主要的机器学习算法，包括支持向量机（SVM）、K均值聚类（K-Means）和神经网络（ANN），并结合图像分类和聚类分析这两个典型应用场景进行代码实现与解释。二、主要函数及类详解（一）支持向量机（SVM）：cv.ml.SVM_create()功能支持向量机（SVM）是一种强大
opencv对图像处理 syfirst1111 图像处理 opencv 计算机视觉
形态学转换：基于图像形状的操作，通常在二进制图像上执行。腐蚀、膨胀：腐蚀：求局部最小值，原图高亮部分被蚕食膨胀：求局部最大值，原图高亮部分部分扩张img=cv.imread(path)kenel=np.ones((5,5),np.uint8)#创建核结构img2=cv.erode(img,kenel)#腐蚀去噪img1=cv.dilate(img,kenel)#膨胀目标增大，填充孔洞图像平滑（去噪
OpenCV图像处理基础2 指尖下的技术 OpenCV opencv 图像处理计算机视觉
接着上一篇OpenCV图像处理基础1继续说。图像阈值处理1、简单阈值处理ret,thresholded_image=cv2.threshold(image,thresh,maxval,cv2.THRESH_BINARY)thresh是阈值，maxval是最大值。2、自适应阈值处理thresholded_image=cv2.adaptiveThreshold(image,maxval,cv2.ADA
初始OpenCV 指尖下的技术 OpenCV opencv 人工智能计算机视觉
OpenCV是一个功能强大、应用广泛的计算机视觉库，它为开发人员提供了丰富的工具和算法，可以帮助他们快速构建各种视觉应用。随着计算机视觉技术的不断发展，OpenCV也将会继续发挥重要的作用。OpenCV提供了大量的计算机视觉算法和图像处理工具，广泛应用于图像和视频的处理、分析以及机器学习领域。所以学习人计算机视觉或者图像处理方面的知识，OpenCV是一个要重点学习的工具库。首先介绍一下OpenCV
【2017-2025】Adobe Photoshop【PS】软件下载安装 adkjcbqvblq adobe photoshop ui
获取安装包https://pan.baidu.com/s/1NLUthiAyC2chlSEwbf1LRQ?pwd=4ppq1.起源与发展1.1初试啼声AdobePhotoshop的历史可以追溯到1987年，当时由托马斯·诺尔（ThomasKnoll）和他的兄弟约翰·诺尔（JohnKnoll）共同开发。托马斯在父亲的帮助下，开始了图像处理的编程尝试。他们的初始产品是一个用于Mac系统的程序，最初名为
GStreamer —— 3.2、Qt+GStreamer+OpenCV制作图像处理播放器(对每帧图像处理)，支持本地mp4文件、rtsp流、usb摄像头等（可跨平台，附源码）信必诺 GStreamer Qt GStreamer Qt
运行效果介绍本项目是一个结合了Qt、GStreamer和OpenCV的跨平台图像处理播放器项目。该
人脸识别的一些代码饿了就干饭 CV相关人脸识别
1、cv2入门函数imread及其相关操作2、（详解）opencv里的cv2.resize改变图片大小Python3、机器学习之人脸识别face_recognition使用4、使用face_recognition进行人脸校准5、简单的人脸识别通用流程示意图（这个看着写的挺好的）6、face_recognition和图像处理中left、top、right、bottom解释7、使用pillow库对图片
【人工智能】大模型的幻觉问题：DeepSeek 的解决策略与实践蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界大语言模型（LLM）的“幻觉”问题，即模型生成与事实不符或脱离上下文的内容，是限制其广泛应用的关键挑战之一。本文深入探讨了幻觉问题的成因，包括训练数据的偏差、推理过程中的过度泛化以及缺乏外部验证机制。以DeepSeek系列模型为研究对象，我们分析了其在解
AI时代个人财富增长实战指南：从零基础到精通变现的完整路径 A达峰绮人工智能
（本文基于人工智能技术发展规律，结合互联网经济底层逻辑，为普通从业者构建系统性AI应用框架）一、建立AI认知基础：技术理解与工具掌握技术分类认知人工智能工具分为四大功能模块：自然语言处理（文本生成、对话交互）、计算机视觉（图像视频处理）、数据分析（预测建模）、自动化控制（流程优化）。建议新手首先掌握语言类工具的基础操作，逐步扩展到其他领域。工具操作逻辑通用AI工具通常包含三大核心功能模块：输入界面
【北上广深杭大厂AI算法面试题】计算机视觉篇...如何解决多尺度问题？努力毕业的小土博^_^ AI算法题库人工智能算法计算机视觉深度学习神经网络
【北上广深杭大厂AI算法面试题】计算机视觉篇…如何解决多尺度问题？【北上广深杭大厂AI算法面试题】计算机视觉篇…如何解决多尺度问题？文章目录【北上广深杭大厂AI算法面试题】计算机视觉篇...如何解决多尺度问题？前言数据级别的多尺度模型架构上的多尺度表示FPN代码示例（PyTorch）说明其他多尺度处理方法总结欢迎铁子们点赞、关注、收藏！祝大家逢考必过！逢投必中！上岸上岸上岸！upupup大多数高校
深度学习与目标检测系列(三) 本文约(4万字) | 全面解读复现AlexNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch AlexNet 人工智能
文章目录解读Abstract-摘要翻译精读主要内容1.Introduction—前言翻译精读主要内容：本文主要贡献：2.TheDataset-数据集翻译精读主要内容：ImageNet简介：图像处理方法：3.TheArchitecture—网络结构3.1ReLUNonlinearity—非线性激活函数ReLU翻译精读传统方法及不足本文改进方法本文的改进结果3.2TrainingonMultipleG
Windows配置opencv详细教程吃旺旺雪饼的小男孩环境配置 windows opencv 人工智能计算机视觉
Windows配置opencv1.安装CMakeCMake安装步骤：2.安装VisualStudioVisualStudio安装步骤：3.下载OpenCV源码下载步骤：4.配置OpenCV使用CMake4.1.配置CMakeGUI4.2.配置选项5.使用VisualStudio编译OpenCV5.1.打开VisualStudio项目5.2.编译OpenCV6.配置开发环境（VisualStudio
计算机视觉技术探索：美颜SDK如何利用深度学习优化美颜、滤镜功能？美狐美颜sdk 美颜SDK 美颜API 直播美颜SDK 计算机视觉深度学习直播美颜SDK 美颜sdk 第三方美颜sdk 美颜api
时下，计算机视觉+深度学习正在重塑美颜技术，通过智能人脸检测、AI滤镜、深度美肤、实时优化等方式，让美颜效果更加自然、精准、个性化。那么，美颜SDK如何结合深度学习来优化美颜和滤镜功能？本文将深入解析AI在美颜技术中的应用，并探讨其未来发展趋势。一、深度学习如何赋能美颜SDK？1.AI人脸检测与关键点识别：精准捕捉五官在美颜过程中，首先需要精准检测人脸位置和五官特征点，确保美颜效果不会失真。深度学
车牌识别技术揭秘：如何用 C# 实现自动车牌识别系统威哥说编程 c#开发语言
车牌识别（LicensePlateRecognition，LPR）是一项计算机视觉技术，用于自动识别车辆的车牌号码。在实际应用中，车牌识别技术被广泛用于停车场管理、交通监控和安防系统等领域。实现车牌识别系统的关键步骤包括图像预处理、车牌检测、字符分割、字符识别等。C#中可以通过结合OpenCV、EmguCV、TesseractOCR等工具来实现车牌识别系统。一、所需工具和库EmguCV：这是一个封
10.2 如何解决从复杂 PDF 文件中提取数据的问题？墨染辉大语言模型 pdf
10.2如何解决从复杂PDF文件中提取数据的问题？解决方案：嵌入式表格检索解释：嵌入式表格检索是一种专门针对从复杂PDF文件中的表格提取数据的技术。它结合了表格识别、解析和语义理解，使得从复杂结构的表格中检索信息成为可能。具体步骤：表格检测和识别：目标：在PDF页面中准确地定位和识别表格区域。方法：使用计算机视觉和深度学习技术，如卷积神经网络（CNN）或其他先进的图像处理算法。效果：能够检测出页面
用Python实现SFM 薄辉 python opencv 计算机视觉人工智能图像处理
SFM(结构化光流法)是一种用于解决三维重建问题的方法，它可以根据许多二维图像和它们之间的相对位置，估计出三维场景的深度和摄像机的姿态。在Python中，你可以使用OpenCV库来实现SFM。下面是一个简单的例子，展示了如何使用OpenCV库的cv2.sfm_create函数来实现SFM：importcv2#读入图像，存入列表images中images=[]foriinrange(1,11):im
cv2 orb 图像拼接_图像拼接Opencv源码重构是佐罗而非索隆 cv2 orb 图像拼接
请看赵春江https://me.csdn.net/zhaocj的主页，他已经对Opencv图像拼接流程中的代码做了很详细的解释。前人栽树，后人乘凉。一.本文所做的事1.重构了Opencv图像拼接的源代码，整个代码是面向过程的；2.在赵春江源码分析基础上，对一些细节部分进行说明。代码链接：https://github.com/mhhai/ImageStitch二.特征点检测一切起源于这段代码Ptrf
OpenCV图像拼接（2）基于羽化（feathering）技术的图像融合算法拼接类cv::detail::FeatherBlender 村北头的码农 OpenCV opencv 算法人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::FeatherBlender是OpenCV中用于图像拼接的一个类，它属于stitching模块的一部分。这个类实现了基于羽化（feathering）技术的图像融合算法，用于平滑地混合重叠区域中的图像，从而生成无缝的全景图。主要特点羽化技术：
OpenCV图像拼接（1）自动校准之校准旋转相机的函数calibrateRotatingCamera() 村北头的码农 OpenCV opencv 人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::calibrateRotatingCamera是OpenCV中用于校准旋转相机的函数。它特别适用于那种相机相对于一个固定的场景进行纯旋转运动的情况，比如在全景拼接过程中。此函数可以从一系列单应性矩阵（HomographyMatrices）中
探索Sfm-python: 一款强大的计算机视觉库缪昱锨Hunter
探索Sfm-python:一款强大的计算机视觉库去发现同类优质开源项目:https://gitcode.com/在计算机视觉领域，Sfm-python是一个值得关注的开源项目，它以简洁高效的Python接口提供结构化从运动（StructurefromMotion,SfM）算法。如果你对3D重建、图像匹配或地理定位有兴趣，那么这个项目将是你不可或缺的工具。让我们一起深入了解一下它的技术细节、应用场景
17-OpenCVSharp 中实现 Halcon 的 Points_Harris算子（Harris 角点检测）观视界 #opencv 人工智能计算机视觉图像处理矩阵
专栏地址：《OpenCV功能使用详解200篇》《OpenCV算子使用详解300篇》《Halcon算子使用详解300篇》内容持续更新，欢迎点击订阅在OpenCVSharp中实现类似于Halcon中的Points_Harris算子，实际上就是实现Harris角点检测算法。Harris角点检测算法是用于检测图像中的角点特征，可以用来进行图像匹配、物体识别等任务。Halcon提供的Points_Harri
常见经典目标检测算法 109702008 人工智能 #深度学习目标检测人工智能
ChatGPT目标检测（ObjectDetection）是计算机视觉领域的一个重要分支，其目的是识别数字图像中的不同对象，并给出它们的位置和类别。近年来，许多经典的目标检测算法被提出并广泛应用。以下是一些常见的经典目标检测算法：1.R-CNN（RegionswithCNNfeatures）:R-CNN通过使用区域提议方法（如选择性搜索）首先生成潜在的边界框，然后使用卷积神经网络(CNN)提取特征，
并查集：从连通性检测到动态合并的算法艺术六七_Shmily 数据结构与算法分析算法
并查集：从连通性检测到动态合并的算法艺术（C++实现）一、并查集：算法世界的隐形支柱在算法竞赛和工程实践中，并查集（DisjointSetUnion，DSU）是解决动态连通性问题的终极武器。它能在近乎常数时间内完成集合的合并与查询操作，广泛应用于社交网络、图像处理、编译器优化等领域。本文将深入剖析并查集的核心原理，并通过实战案例揭示其精妙之处。二、并查集的三重核心1.数据结构设计classDSU{
深度学习的颠覆性发展：从卷积神经网络到Transformer AI天才研究院 AI大模型应用入门实战与进阶 ChatGPT 大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍深度学习是人工智能的核心技术之一，它通过模拟人类大脑中的神经网络学习从大数据中抽取知识，从而实现智能化的自动化处理。深度学习的发展历程可以分为以下几个阶段：2006年，GeoffreyHinton等人开始研究卷积神经网络（ConvolutionalNeuralNetworks，CNN），这是深度学习的第一个大突破。CNN主要应用于图像处理和语音识别等领域。2012年，AlexKrizh
AI 大模型应用数据中心的数据迁移架构 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
AI大模型、数据中心、数据迁移、架构设计、迁移策略、性能优化、安全保障1.背景介绍随着人工智能（AI）技术的飞速发展，大规模AI模型的应用日益广泛，涵盖了自然语言处理、计算机视觉、语音识别等多个领域。这些AI模型通常需要海量的数据进行训练和推理，因此数据中心作为AI应用的基础设施，显得尤为重要。然而，随着AI模型规模的不断扩大，数据中心面临着新的挑战：数据规模庞大:AI模型的训练和推理需要海量数据
实测 Gemini 2.0 Flash 图像生成：多模态 AI 的创作力边界 python
近日，Google发布了Gemini2.0Flash的实验性图像生成功能（Gemini2.0Flash(ImageGeneration)Experimental）。我也第一时间体验了这一功能，再次感受到AI技术对传统图像处理工具的颠覆性冲击。本文从主要功能、安装方法、应用场景，并通过实际测试展示其能力，希望帮助大家更好地了解和使用这一工具。引言Gemini2.0Flash的实验性图像生成功能于20
gralloc usage flags Damon_X gralloc
下面这些示例主要说明了grallocusageflags在图像处理和多媒体应用中如何影响性能和正确性。让我们逐个详细分析每个问题的根因和修复方案，并深入解析gralloc标志对缓存管理和数据流的影响。✅Example1:长曝光快照耗时异常问题描述症状：长曝光快照（longexposuresnapshot）在某些内存优化后，拍摄时间异常变长。根因：第三方算法在多个快照帧上执行，耗时约1.2秒。Buf
暗光增强技术研究进展与产品落地综合分析（2023-2025） AndrewHZ 深度学习新浪潮图像处理算法动态范围计算机视觉深度学习 transformer 暗光增强
一、引言暗光增强技术作为计算机视觉与移动影像领域的核心研究方向之一，近年来在算法创新、硬件适配及产品落地方面取得了显著进展。本文从技术研究与产业应用两个维度，系统梳理近三年（2023-2025）该领域的关键突破，并对比分析主流手机厂商的影像技术优劣势。二、暗光增强技术研究进展1.算法创新：从传统模型到深度学习（1）Retinex理论的深度结合清华与ETH联合提出的Retinexformer（202
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe