luckyone906

opencv学之图像傅里叶变换dft

一、前言

接触了图像的傅里叶变换，数学原理依旧不是很懂，因此不敢在这里妄言。下午用Opencv代码实现了这一变换，有一些经验心得

二、关键函数解析

2.1copyMakeBorder() 扩展图片尺寸

傅里叶变换的计算对图像的尺寸有一定要求，尺寸不满足要求的，可用copyMakeBorder() 函数进行扩展。函数定义如下：

void copyMakeBorder(InputArray  src,        //输入图像
		    OutputArray dst,        //输出图像
		    int top,                //上边界添加的像素行数
		    int bottom,             //下边界添加的像素行数
		    int left,               //左边界添加的像素列数
		    int right,              //右边界添加的像素列数
		    int borderType,         //表示边界的类型
		    const Scalar& value=Scalar()//表示如果边界的类型是BORDER_CONSTANT时边界的颜色值 )

borderType边界的类型有以下几种:

1)BORDER_REPLICATE:重复： aaaaaa|abcdefgh|hhhhhhh

2)BORDER_REFLECT:反射: fedcba|abcdefgh|hgfedcb

3)BORDER_REFLECT_101:反射101: gfedcb|abcdefgh|gfedcba

4)BORDER_WRAP:外包装： cdefgh|abcdefgh|abcdefg

5)BORDER_CONSTANT:常量复制： iiiiii|abcdefgh|iiiiiii(i的值由最后一个参数 const Scalar& value=Scalar()确定，如Scalar::all(0) )

2.2getOptimalDFTSize() 获取最佳计算尺寸

离散傅里叶变换的计算速度与图片的尺寸有关，当图片的尺寸是2，3，5的倍数时，计算速度最快。常与函数copyMakeBorder() 配合使用，保证较快的计算速度。

int getOptimalDFTSize(int vecsize)

使用示例：

int m = getOptimalDFTSize(mImage.rows);//返回行的最佳尺寸
int n = getOptimalDFTSize(mImage.cols);//返回列的最佳尺寸
copyMakeBorder(mImage, mImage, 0, m - mImage.rows, 0, n - mImage.cols, BORDER_CONSTANT, Scalar(0));

2.3dft()傅里叶变换计算

傅里叶变换计算函数。

void dft(InputArray src, OutputArray dst, int flags=0, int nonzeroRows=0);

参数解释：
InputArray src: 输入图像，可以是实数或虚数
OutputArray dst: 输出图像，其大小和类型取决于第三个参数flags
int flags = 0: 转换的标识符，有默认值0。其可取的值如下所示：
1）DFT_INVERSE: 用一维或二维逆变换取代默认的正向变换；
2）DFT_SCALE: 缩放比例标识符，根据数据元素个数平均求出其缩放结果，如有N个元素，则输出结果以1/N缩放输出，常与DFT_INVERSE搭配使用；
3）DFT_ROWS: 对输入矩阵的每行进行正向或反向的傅里叶变换；此标识符可在处理多种适量的的时候用于减小资源的开销，这些处理常常是三维或高维变换等复杂操作；
4）DFT_COMPLEX_OUTPUT: 对一维或二维的实数数组进行正向变换，这样的结果虽然是复数阵列，但拥有复数的共轭对称性（CCS），可以以一个和原数组尺寸大小相同的实数数组进行填充，这是最快的选择也是函数默认的方法。你可能想要得到一个全尺寸的复数数组（像简单光谱分析等等），通过设置标志位可以使函数生成一个全尺寸的复数输出数组；
5）DFT_REAL_OUTPUT: 对一维二维复数数组进行逆向变换，这样的结果通常是一个尺寸相同的复数矩阵，但是如果输入矩阵有复数的共轭对称性（比如是一个带有DFT_COMPLEX_OUTPUT标识符的正变换结果），便会输出实数矩阵。
int nonzeroRows = 0: 当这个参数不为0，函数会假设只有输入数组（没有设置DFT_INVERSE）的第一行或第一个输出数组（设置了DFT_INVERSE）包含非零值。这样的话函数就可以对其他的行进行更高效的处理节省一些时间，这项技术尤其是在采用DFT计算矩阵卷积时非常有效。

2.4magnitude()计算二维矢量幅值

void magnitude(InputArray x, InputArray y, OutputArray magnitude)；

参数解释：
InputArray x: 浮点型数组的x坐标矢量，也就是实部
InputArray y: 浮点型数组的y坐标矢量，必须和x尺寸相同
OutputArray magnitude: 与x类型和尺寸相同的输出数组
其计算公式如下：

2.5log()自然对数计算

log()函数的功能是计算每个数组元素绝对值的自然对数。

void log(InputArray src,OutputArray dst)

参数解释：

InputArray src：为输入图像
OutputArray dst：为得到的对数值

其原理如下：

2.6normalize()矩阵归一化

归一化就是把要处理的数据经过某种算法的处理限制在所需要的范围内。首先归一化是为了后面数据处理的方便，其次归一化能够保证程序运行时收敛加快。

void normalize(InputArray src, OutputArray dst, 
               double alpha=1, double beta=0, int norm_type=NORM_L2, int dtype=-1, InputArray mask=noArray() )

参数解释：
InputArray src: 输入图像 ;
OutputArray dst: 输出图像，尺寸大小和src相同 ;
double alpha = 1: range normalization模式的最小值 ;
double beta = 0: range normalization模式的最大值，不用于norm normalization(范数归一化)模式 ;
int norm_type = NORM_L2: 归一化的类型，主要有 :
1)NORM_INF: 归一化数组的C-范数（绝对值的最大值）
2)NORM_L1: 归一化数组的L1-范数（绝对值的和）
3)NORM_L2: 归一化数组的L2-范数（欧几里得）
4)NORM_MINMAX: 数组的数值被平移或缩放到一个指定的范围，线性归一化，一般较常用。
int dtype = -1: 当该参数为负数时，输出数组的类型与输入数组的类型相同，否则输出数组与输入数组只是通道数相同，而depth = CV_MAT_DEPTH(dtype) ;
InputArray mask = noArray(): 操作掩膜版，用于指示函数是否仅仅对指定的元素进行操作。

归一化公式：

1)norm_type!=NORM_MINMAX(线性函数转换)：

if mask(i,j)!=0

dst(i,j)=(src(i,j)-min(src))*(b'-a')/(max(src)-min(src))+ a'

else

dst(i,j)=src(i,j)

其中b'=MAX(a,b), a'=MIN(a,b);

2)norm_type!=NORM_MINMAX:

if mask(i,j)!=0

dst(i,j)=src(i,j)*a/norm (src,norm_type,mask)

else

dst(i,j)=src(i,j)

其中，函数norm的功能是计算norm（范数）的绝对值

三、代码及结果分享

#include 
#include 

using namespace std;
using namespace cv;

int main() 
{
	Mat mImage = imread("Lenna.jpg", 0);
	if (mImage.data == 0)
	{
		cerr << "Image reading error" << endl;
		system("pause");
		return -1;
	}
	namedWindow("The original image", WINDOW_NORMAL);
	imshow("The original image", mImage);

	//Extending image
	int m = getOptimalDFTSize(mImage.rows);
	int n = getOptimalDFTSize(mImage.cols);
	copyMakeBorder(mImage, mImage, 0, m - mImage.rows, 0, n - mImage.cols, BORDER_CONSTANT, Scalar(0));

	//Fourier transform
	Mat mFourier(mImage.rows + m, mImage.cols + n, CV_32FC2, Scalar(0, 0));
	Mat mForFourier[] = { Mat_(mImage), Mat::zeros(mImage.size(), CV_32F) };
	Mat mSrc;
	merge(mForFourier, 2, mSrc);
	dft(mSrc, mFourier);

	//channels[0] is the real part of Fourier transform,channels[1] is the imaginary part of Fourier transform 
	vector channels;
	split(mFourier, channels);
	Mat mRe = channels[0];
	Mat mIm = channels[1];

	//Calculate the amplitude
	Mat mAmplitude;
	magnitude(mRe, mIm, mAmplitude);

	//Logarithmic scale
	mAmplitude += Scalar(1);
	log(mAmplitude, mAmplitude);

	//The normalized
	normalize(mAmplitude, mAmplitude, 0, 255, NORM_MINMAX);

	Mat mResult(mImage.rows, mImage.cols, CV_8UC1, Scalar(0));
	for (int i = 0; i < mImage.rows; i++)
	{
		uchar* pResult = mResult.ptr(i);
		float* pAmplitude = mAmplitude.ptr(i);
		for (int j = 0; j < mImage.cols; j++)
		{
			pResult[j] = (uchar)pAmplitude[j];
		}
	}

	Mat mQuadrant1 = mResult(Rect(mResult.cols / 2, 0, mResult.cols / 2, mResult.rows / 2));
	Mat mQuadrant2 = mResult(Rect(0, 0, mResult.cols / 2, mResult.rows / 2));
	Mat mQuadrant3 = mResult(Rect(0, mResult.rows / 2, mResult.cols / 2, mResult.rows / 2));
	Mat mQuadrant4 = mResult(Rect(mResult.cols / 2, mResult.rows / 2, mResult.cols / 2, mResult.rows / 2));

	Mat mChange1 = mQuadrant1.clone();
	//mQuadrant1 = mQuadrant3.clone();
	//mQuadrant3 = mChange1.clone();
	mQuadrant3.copyTo(mQuadrant1);
	mChange1.copyTo(mQuadrant3);

	Mat mChange2 = mQuadrant2.clone();
	//mQuadrant2 = mQuadrant4.clone();
	//mQuadrant4 = mChange2.clone();
	mQuadrant4.copyTo(mQuadrant2);
	mChange2.copyTo(mQuadrant4);

	namedWindow("The Fourier transform", WINDOW_NORMAL);
	imshow("The Fourier transform", mResult);
	waitKey();
	destroyAllWindows();
	return 0;
}

四、注意事项

4.1Mat对象类型问题

为方便运算，在计算过程中，Mat对象中数据都是float型，将其归一化至0-255范围后仍保留有小数部分，造成无法用imshow()正常显示。最后结果必须用uchar强制转换。源代码中以下片段实现了这一过程：

	normalize(mAmplitude, mAmplitude, 0, 255, NORM_MINMAX);

	Mat mResult(mImage.rows, mImage.cols, CV_8UC1, Scalar(0));
	for (int i = 0; i < mImage.rows; i++)
	{
		uchar* pResult = mResult.ptr(i);
		float* pAmplitude = mAmplitude.ptr(i);
		for (int j = 0; j < mImage.cols; j++)
		{
			pResult[j] = (uchar)pAmplitude[j];
		}
	}

4.2clone()与copyTo()的差异问题

clone 是完全的深拷贝，在内存中申请新的空间。copyTo 也是深拷贝，但是否申请新的内存空间，取决于dst矩阵头中的大小信息是否与src一至，若一致则只深拷贝并不申请新的空间，否则先申请空间后再进行拷贝。

Mat A  = Mat::ones(4,5,CV_32F);
Mat B = A.clone()    //clone 是完全的深拷贝，在内存中申请新的空间，与Ａ独立
Mat C;
A.copyTo(C) //此处的Ｃ矩阵大小与Ａ大小不一致，则申请新的内存空间，并完成拷贝，等同于clone()
Mat D = A.col(１);
A.col(0).copyTo(D)　//此处D矩阵大小与Ａ.col(0)大小一致，因此不会申请空间，而是直接进行拷贝，相当于把Ａ的第１列赋值给第二列

因此在进行不同象限数据对换时，用copyTo()能成功对换数据，而用clone()则不能起到作用，原因就在于mQuadrant.clone()时重新开辟了内存空间，数据对换时对换的并非是原矩阵mResult中的数据。所以源代码中，以下片段能够正常对换数据，而注释掉的部分不能正常工作。

	Mat mChange1 = mQuadrant1.clone();
	//mQuadrant1 = mQuadrant3.clone();
	//mQuadrant3 = mChange1.clone();
	mQuadrant3.copyTo(mQuadrant1);
	mChange1.copyTo(mQuadrant3);

	Mat mChange2 = mQuadrant2.clone();
	//mQuadrant2 = mQuadrant4.clone();
	//mQuadrant4 = mChange2.clone();
	mQuadrant4.copyTo(mQuadrant2);
	mChange2.copyTo(mQuadrant4);

//*************

在学习信号与系统或通信原理等课程里面可能对傅里叶变换有了一定的了解。我们知道傅里叶变换是把一个信号从时域变换到其对应的频域进行分析。如果有小伙伴还对傅里叶变换处于很迷糊的状态，请戳这里，非常通俗易懂。而在图像处理中也有傅里叶分析的概念，我这里给出在其官方指导文件opencv_tutorials中给出的解释。
傅里叶变换可以将一幅图片分解为正弦和余弦两个分量，换而言之，他可以将一幅图像从其空间域（spatial domain）转换为频域（frequency domain）。这种变换的思想是任何函数可以很精确的接近无穷个sin()函数和cos()函数的和。傅里叶变换提供了这种方法来达到这种效果。对于二位图像其傅里叶变换公式如下：

式中f(i, j)是图像空间域的值而F是频域的值。傅里叶转换的结果是复数，这也显示出了傅里叶变换是一副实数图像（real image）和虚数图像（complex image）叠加或者是幅度图像（magitude image）和相位图像（phase image）叠加的结果。在实际的图像处理算法中仅有幅度图像（magnitude image）图像能够用到，因为幅度图像包含了我们所需要的所有图像几何结构的信息。但是，如果想通过修改幅度图像或者相位图像来间接修改原空间图像，需要保留幅度图像和相位图像来进行傅里叶逆变换，从而得到修改后图像。

1.dft()

首先看一下opencv提供的傅里叶变换函数dft()，其定义如下：

C++: void dft(InputArray src, OutputArray dst, int flags=0, int nonzeroRows=0);
1
参数解释：
. InputArray src: 输入图像，可以是实数或虚数
. OutputArray dst: 输出图像，其大小和类型取决于第三个参数flags
. int flags = 0: 转换的标识符，有默认值0.其可取的值如下所示：
。DFT_INVERSE: 用一维或二维逆变换取代默认的正向变换
。DFT_SCALE: 缩放比例标识符，根据数据元素个数平均求出其缩放结果，如有N个元素，则输出结果以1/N缩放输出，常与DFT_INVERSE搭配使用。
。DFT_ROWS: 对输入矩阵的每行进行正向或反向的傅里叶变换；此标识符可在处理多种适量的的时候用于减小资源的开销，这些处理常常是三维或高维变换等复杂操作。
。DFT_COMPLEX_OUTPUT: 对一维或二维的实数数组进行正向变换，这样的结果虽然是复数阵列，但拥有复数的共轭对称性（CCS），可以以一个和原数组尺寸大小相同的实数数组进行填充，这是最快的选择也是函数默认的方法。你可能想要得到一个全尺寸的复数数组（像简单光谱分析等等），通过设置标志位可以使函数生成一个全尺寸的复数输出数组。
。DFT_REAL_OUTPUT: 对一维二维复数数组进行逆向变换，这样的结果通常是一个尺寸相同的复数矩阵，但是如果输入矩阵有复数的共轭对称性（比如是一个带有DFT_COMPLEX_OUTPUT标识符的正变换结果），便会输出实数矩阵。
. int nonzeroRows = 0: 当这个参数不为0，函数会假设只有输入数组（没有设置DFT_INVERSE）的第一行或第一个输出数组（设置了DFT_INVERSE）包含非零值。这样的话函数就可以对其他的行进行更高效的处理节省一些时间，这项技术尤其是在采用DFT计算矩阵卷积时非常有效。

2. getOptimalDFTSize()

返回给定向量尺寸经过DFT变换后结果的最优尺寸大小。其函数定义如下：

C++: int getOptimalDFTSize(int vecsize);
1
参数解释：
int vecsize: 输入向量尺寸大小(vector size)
DFT变换在一个向量尺寸上不是一个单调函数，当计算两个数组卷积或对一个数组进行光学分析，它常常会用0扩充一些数组来得到稍微大点的数组以达到比原来数组计算更快的目的。一个尺寸是2阶指数（2,4,8,16,32…）的数组计算速度最快，一个数组尺寸是2、3、5的倍数（例如：300 = 5*5*3*2*2）同样有很高的处理效率。
getOptimalDFTSize()函数返回大于或等于vecsize的最小数值N，这样尺寸为N的向量进行DFT变换能得到更高的处理效率。在当前N通过p,q,r等一些整数得出N = 2^p*3^q*5^r.
这个函数不能直接用于DCT（离散余弦变换）最优尺寸的估计，可以通过getOptimalDFTSize((vecsize+1)/2)*2得到。

3.magnitude()

计算二维矢量的幅值，其定义如下：

C++: void magnitude(InputArray x, InputArray y, OutputArray magnitude)；
1
参数解释：
. InputArray x: 浮点型数组的x坐标矢量，也就是实部
. InputArray y: 浮点型数组的y坐标矢量，必须和x尺寸相同
. OutputArray magnitude: 与x类型和尺寸相同的输出数组
其计算公式如下：

4. copyMakeBorder()
扩充图像边界，其函数定义如下：

C++: void copyMakeBorder(InputArray src, OutputArray dst, int top, int bottom, int left, int right, int borderType, const Scalar& value=Scalar() )；
1
参数解释：
. InputArray src: 输入图像
. OutputArray dst: 输出图像，与src图像有相同的类型，其尺寸应为Size(src.cols+left+right, src.rows+top+bottom)
. int类型的top、bottom、left、right: 在图像的四个方向上扩充像素的值
. int borderType: 边界类型，由borderInterpolate()来定义，常见的取值为BORDER_CONSTANT
. const Scalar& value = Scalar(): 如果边界类型为BORDER_CONSTANT则表示为边界值

5. normalize()
归一化就是把要处理的数据经过某种算法的处理限制在所需要的范围内。首先归一化是为了后面数据处理的方便，其次归一化能够保证程序运行时收敛加快。归一化的具体作用是归纳同意样本的统计分布性，归一化在0-1之间是统计的概率分布，归一化在某个区间上是统计的坐标分布，在机器学习算法的数据预处理阶段，归一化也是非常重要的步骤。其定义如下：

C++: void normalize(InputArray src, OutputArray dst, double alpha=1, double beta=0, int norm_type=NORM_L2, int dtype=-1, InputArray mask=noArray() )
1
参数解释：
. InputArray src: 输入图像
. OutputArray dst: 输出图像，尺寸大小和src相同
. double alpha = 1: range normalization模式的最小值
. double beta = 0: range normalization模式的最大值，不用于norm normalization(范数归一化)模式
. int norm_type = NORM_L2: 归一化的类型，主要有
。NORM_INF: 归一化数组的C-范数（绝对值的最大值）
。NORM_L1: 归一化数组的L1-范数（绝对值的和）
。NORM_L2: 归一化数组的L2-范数（欧几里得）
。NORM_MINMAX: 数组的数值被平移或缩放到一个指定的范围，线性归一化，一般较常用。
. int dtype = -1: 当该参数为负数时，输出数组的类型与输入数组的类型相同，否则输出数组与输入数组只是通道数相同，而depth = CV_MAT_DEPTH(dtype)
. InputArray mask = noArray(): 操作掩膜版，用于指示函数是否仅仅对指定的元素进行操作。

示例程序：

#include
#include
#include
#include

using namespace std;
using namespace cv;

int main()
{
Mat I = imread("lena.jpg", IMREAD_GRAYSCALE); //读入图像灰度图

//判断图像是否加载成功
if (I.empty())
{
cout << "图像加载失败!" << endl;
return -1;
}
else
cout << "图像加载成功!" << endl << endl;

Mat padded; //以0填充输入图像矩阵
int m = getOptimalDFTSize(I.rows);
int n = getOptimalDFTSize(I.cols);

//填充输入图像I，输入矩阵为padded，上方和左方不做填充处理
copyMakeBorder(I, padded, 0, m - I.rows, 0, n - I.cols, BORDER_CONSTANT, Scalar::all(0));

Mat planes[] = { Mat_(padded), Mat::zeros(padded.size(),CV_32F) };
Mat complexI;
merge(planes, 2, complexI); //将planes融合合并成一个多通道数组complexI

dft(complexI, complexI); //进行傅里叶变换

//计算幅值，转换到对数尺度(logarithmic scale)
//=> log(1 + sqrt(Re(DFT(I))^2 + Im(DFT(I))^2))
split(complexI, planes); //planes[0] = Re(DFT(I),planes[1] = Im(DFT(I))
//即planes[0]为实部,planes[1]为虚部
magnitude(planes[0], planes[1], planes[0]); //planes[0] = magnitude
Mat magI = planes[0];

magI += Scalar::all(1);
log(magI, magI); //转换到对数尺度(logarithmic scale)

//如果有奇数行或列，则对频谱进行裁剪
magI = magI(Rect(0, 0, magI.cols&-2, magI.rows&-2));

//重新排列傅里叶图像中的象限，使得原点位于图像中心
int cx = magI.cols / 2;
int cy = magI.rows / 2;

Mat q0(magI, Rect(0, 0, cx, cy)); //左上角图像划定ROI区域
Mat q1(magI, Rect(cx, 0, cx, cy)); //右上角图像
Mat q2(magI, Rect(0, cy, cx, cy)); //左下角图像
Mat q3(magI, Rect(cx, cy, cx, cy)); //右下角图像

//变换左上角和右下角象限
Mat tmp;
q0.copyTo(tmp);
q3.copyTo(q0);
tmp.copyTo(q3);

//变换右上角和左下角象限
q1.copyTo(tmp);
q2.copyTo(q1);
tmp.copyTo(q2);

//归一化处理，用0-1之间的浮点数将矩阵变换为可视的图像格式
normalize(magI, magI, 0, 1, CV_MINMAX);

imshow("输入图像", I);
imshow("频谱图", magI);
waitKey(0);

return 0;
}
程序分析：
1.图像填充：

Mat padded;
int m = getOptimalDFTSize(I.rows);
int n = getOptimalDFTSize(I.cols);
copyMakeBorder(I, padded, 0, m - I.rows, 0, n - I.cols, BORDER_CONSTANT, Scalar::all(0));

根据前面的理论介绍可以知道当图像尺寸为2、3、5的倍数时可以得到最快的处理速度，所以通过getOptimalDFTSize()函数获取最佳DFT变换尺寸，之后再结合copyMakeBorder()函数对图像进行扩充。

2.为实部和虚部分配存储空间

Mat planes[] = { Mat_(padded), Mat::zeros(padded.size(),CV_32F) };
Mat complexI;
merge(planes, 2, complexI);

傅里叶变换的结果是复数，这就意味着经过傅里叶变换每个图像值都会变成两个值，此外其频域(frequency domains)范围比空间域(spatial counterpart)范围大很多。我们通常以浮点型数据格式对结果进行存储。因此我们将输入图像转换为这种类型，通过另外的通道扩充图像。

3.傅里叶变换

dft(complexI, complexI);
1
傅里叶变换函数，对图像进行傅里叶变换。

4.将实数和复数的值转换为幅度值

split(complexI, planes);
magnitude(planes[0], planes[1], planes[0]);
Mat magI = planes[0];
1
2
3
复数包含实部和虚部两个部分，傅里叶变换的结果是一个复数，傅里叶变换的幅度计算公式是：

5.转换为对数尺度(Switch to a logarithmic scale)

magI += Scalar::all(1);
log(magI, magI);
1
2
之所以要进行对数转换是因为傅里叶变换后的结果对于在显示器显示来讲范围比较大，这样的话对于一些小的变化或者是高的变换值不能进行观察。因此高的变化值将会转变成白点，而较小的变化值则会变成黑点。为了能够获得可视化的效果，可以利用灰度值将我们的线性尺度(linear scale)转变为对数尺度(logarithmic scale)，其计算公式如下：

6.剪切和象限变换

magI = magI(Rect(0, 0, magI.cols&-2, magI.rows&-2));
int cx = magI.cols / 2;
int cy = magI.rows / 2;

Mat q0(magI, Rect(0, 0, cx, cy));
Mat q1(magI, Rect(cx, 0, cx, cy));
Mat q2(magI, Rect(0, cy, cx, cy));
Mat q3(magI, Rect(cx, cy, cx, cy));

//变换左上角和右下角象限
Mat tmp;
q0.copyTo(tmp);
q3.copyTo(q0);
tmp.copyTo(q3);

//变换右上角和左下角象限
q1.copyTo(tmp);
q2.copyTo(q1);
tmp.copyTo(q2);

在进行傅里叶变换时，为了取得更快的计算效果，对图像进行了扩充，现在就需要对新增加的行列进行裁剪了。为了可视化的需要，我们同样需要对显示的结果图像像素进行调整，如果不进行调整，最后显示的结果是这样的：

可以看到四周的角上时高频分量，现在我们通过重新调整象限将高频分量调整到图像正中间。

7.归一化

normalize(magI, magI, 0, 1, CV_MINMAX);
1
对结果进行归一化处理同样是处于可视化的目的。现在我们得到了幅度值，但是这仍然超出了0-1的显示范围。这就需要利用normalize()函数对数据进行归一化处理。

程序运行结果如图：

————————————————
版权声明：本文为CSDN博主「梧桐栖鸦」的原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/keith_bb/article/details/53389819

//***********

傅里叶变换将图像分解成其正弦和余弦分量，它将图像由空域转换为时域。任何函数都可以近似的表示为无数正弦和余弦函数的和，傅里叶变换就是实现这一步的，数学上一个二维图像的傅里叶变换为：

正在上传…重新上传取消转存失败重新上传取消

公式中，f是图像在空域的值，F是频域的值。转换的结果是复数，但是不可能通过一个真实图像和一个复杂的图像或通过大小和相位图像去显示这样的一个图像。然而，在整个图像处理算法只对大小图像是感兴趣的，因为这包含了所有我们需要的图像几何结构的信息。

可通过以下几步显示一副傅里叶变换后的图像

1、将图像扩展到它的最佳尺寸，DFT(直接傅里叶变换)的性能依赖于图片的尺寸，当图像是2，3，5的倍数时往往是最快的。因此，为了达到最优性能通常采用垫边界值的方法，得到一个最佳的尺寸。

2、为傅立叶变换结果的实部和虚部分配存储空间。傅里叶变换的结果是一个复数，这意味着每幅图的结果都有一个实部和虚部，此外，频域范围远远大于它对应的空间范围。因此，我们这些通常至少以一个浮点数格式存储这些数值。因此，我们会将我们的输入图像转换为这种类型并且扩展它与另一通道存放复数值

3、进行傅里叶变换。

4、将复数转换为幅值，DFT的幅值由以下公式得出：正在上传…重新上传取消转存失败重新上传取消

5、切换到对数刻度。对图像进行对数尺度的缩放，结果证明，傅立叶系数矩阵的动态范围太大，无法显示在屏幕上，我们无法通过这样去观察一些小的和高的变化值。因此那些高的数值将转化成白点而小的数值会变成黑点，使用灰度值进行可视化，我们可以将线性刻度转换为对数刻度，以便于观察。

转存失败重新上传取消转存失败重新上传取消

6、剪切和重分布幅度图象，第一步我们扩展了图像，这里我们去掉扩展的那部分值，基于可视化的目的，我们还可以重新排列结果的象限，使原点(0，0)对应于与图像中心

7、归一化。目前得到的幅值图像仍然太大，超出了显示的范围，归一化这范围内的值，可以进一步达到可视化的目的

实现程序

void _DFT(){

//1以灰度模式读取原图像并显示

Mat srcImage = imread("miFan.jpg",0);

if (!srcImage.data){ cout << "Error\n"; }

imshow("原图像", srcImage);

//2将输入图像扩展到最佳尺寸,边界用0补充

int m = getOptimalDFTSize(srcImage.rows);

int n = getOptimalDFTSize(srcImage.cols);

//将添加的像素初始化为0

Mat padded;

copyMakeBorder(srcImage, padded, 0, m - srcImage.rows,

0, n - srcImage.cols, BORDER_CONSTANT, Scalar::all(0));

//3为傅里叶变换的结果(实部和虚部)分配存储空间

//将数组组合合并为一个多通道数组

Mat planes[] = { Mat_<float>(padded), Mat::zeros(padded.size(), CV_32F) };

Mat complexI;

merge(planes, 2, complexI);

//4进行傅里叶变换

dft(complexI, complexI);

//5将复数转换为幅值，即=> log(1 + sqrt(Re(DFT(I))^2 + Im(DFT(I))^2))

//将多通道数组分离为几个单通道数组

split(complexI, planes);//planes[0] = Re(DFT(I), planes[1] = Im(DFT(I))

magnitude(planes[0], planes[1], planes[0]);

Mat magImage = planes[0];

//6进行对数尺度缩放

magImage += Scalar::all(1);

log(magImage, magImage);//求自然对数

//7剪切和重分布幅度图象限

//若有奇数行或奇数列，进行频谱剪裁

magImage = magImage(Rect(0, 0, magImage.cols&-2, magImage.rows&-2));

//重新排列傅立叶图像中的象限，使得原点位于图像中心

int cx = magImage.cols / 2;

int cy = magImage.rows / 2;

Mat q0(magImage, Rect(0, 0, cx, cy));

Mat q1(magImage, Rect(cx, 0, cx, cy));

Mat q2(magImage, Rect(0,cy,cx,cy));

Mat q3(magImage, Rect(cx,cy,cx,cy));

//交换象限(左上与右下进行交换)

Mat tmp;

q0.copyTo(tmp);

q3.copyTo(q0);

tmp.copyTo(q3);

//交换象限（右上与左下进行交换）

q1.copyTo(tmp);

q2.copyTo(q1);

tmp.copyTo(q2);

//8归一化，用0到1的浮点值将矩阵变换为可视的图像格式

normalize(magImage, magImage, 0, 1, CV_MINMAX);

//9显示

imshow("频谱增幅", magImage);

waitKey();

}

正在上传…重新上传取消转存失败重新上传取消

傅里叶变换后的图片

正在上传…重新上传取消转存失败重新上传取消

Opencv 实现图像的离散傅里叶变换（DFT）、卷积运算（相关滤波）

我是做Tracking 的，对于速度要求非常高。发现傅里叶变换能够使用。

于是学习之。

核心： 最根本的一点就是将时域内的信号转移到频域里面。这样时域里的卷积能够转换为频域内的乘积！

在分析图像信号的频率特性时，对于一幅图像，直流分量表示预想的平均灰度。低频分量代表了大面积背景区域和缓慢变化部分，高频部分代表了它的边缘，细节，跳跃部分以及颗粒噪声. 因此，我们能够做对应的锐化和模糊的处理：提出当中的高频分量做傅里叶逆变换得到的就是锐化的结果。

提出当中的低频分量做傅里叶逆变换得到的就是模糊的结果。

最不能理解的应该是：截取频域图中的不论什么一个区域相应的都是原来的整张图的区域。而不是相应的局部。

由于频域内的各个点都反映的是整张图的一个状态。

我们能够用时间和频率来理解：当你走完一段单位路程的时候。如果你花了100秒，那么你的频率就是0.01HZ。

这个0.01HZ显然体现的是一个总体的结果。而不是局部。

我们再由公式来看：

能够非常明显的知道频域内的每个点的值都是由整个图像求出来的。当然以上得出的结果，我们一般仅仅关注幅值频谱图。

也就是说真正起作用的就是前面的那个cos x而已. 于是我们能够知道。在整个范围内（0

且其它地方的值仅仅可能比这个小。

在原点的傅里叶变换即等于图像的平均灰度级。由于在原点处经常为零，F(0，0)有时称做频率谱的直流成分。

使用：

当图像的尺寸是2，3，5的整数倍时，计算速度最快。因此opencv里面有一个函数：

int m = getOptimalDFTSize( I.rows );
int n = getOptimalDFTSize( I.cols ); // 在边缘加入0

它能够使得图片的尺寸能够满足这个要求。

可是这样就须要对原来的图像进行大小的处理，因此使用函数：CopyMakeBorder复制图像而且制作边界。

（处理边界卷积）

Mat padded;

copyMakeBorder(I, padded, 0, m - I.rows, 0, n - I.cols, BORDER_CONSTANT, Scalar::all(0));

将原始的图像I 扩充为理想的大小放在padded里面。

接下来我们须要给计算出来的结果分配空间：

Mat planes[] = {Mat_(padded), Mat::zeros(padded.size(), CV_32F)};
Mat complexI;
merge(planes, 2, complexI);         // 为延扩后的图像增添一个初始化为0的通道

然后便能够进行傅里叶变换了：

dft(complexI, complexI);            // 变换结果非常好的保存在原始矩阵中

得到的结果有两部分。实数部分和虚数部分，你能够分别对这两部分进行操作：

split(complexI, planes);                   // planes[0] = Re(DFT(I), planes[1] = Im(DFT(I))
magnitude(planes[0], planes[1], planes[0]);// planes[0] = magnitude
Mat magI = planes[0];

当然还能够进行：归一化：

normalize(magI, magI, 0, 1, CV_MINMAX); // 将float类型的矩阵转换到可显示图像范围
                                        // (float [0。 1]).

另外重要的一个应用是： convolveDFT。

当中的 *代表的是卷积。我认为这也是我们进行离散傅里叶变换的目的。

使得计算的速度大大的添加。

先来说一下卷积在图像中的意义：

如果图像f(x),模板是g(x),然后将模版g(x)在模版中移动,每到一个位置,就把f(x)与g(x)的定义域相交的元素进行乘积而且求和,得出新的图像一点,就是被卷积后的图像. 模版又称为卷积核.卷积核做一个矩阵的形状.（当然边缘点可能须要特殊的处理，同一时候这个操作和滤波也非常像，或许就是一回事）。

#include "opencv2/core/core.hpp"
#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/highgui/highgui.hpp"
#include 

using namespace cv;
using namespace std;

//http://docs.opencv.org/modules/core/doc/operations_on_arrays.html#dft[2]
void convolveDFT(Mat A, Mat B, Mat& C)
{
    // reallocate the output array if needed
    C.create(abs(A.rows - B.rows)+1, abs(A.cols - B.cols)+1, A.type());
    Size dftSize;
    // calculate the size of DFT transform
    dftSize.width = getOptimalDFTSize(A.cols + B.cols - 1);
    dftSize.height = getOptimalDFTSize(A.rows + B.rows - 1);

    // allocate temporary buffers and initialize them with 0's
    Mat tempA(dftSize, A.type(), Scalar::all(0));//initial 0
    Mat tempB(dftSize, B.type(), Scalar::all(0));

    // copy A and B to the top-left corners of tempA and tempB, respectively
    Mat roiA(tempA, Rect(0,0,A.cols,A.rows));
    A.copyTo(roiA);
    Mat roiB(tempB, Rect(0,0,B.cols,B.rows));
    B.copyTo(roiB);

    // now transform the padded A & B in-place;
    // use "nonzeroRows" hint for faster processing
    dft(tempA, tempA, 0, A.rows);
    dft(tempB, tempB, 0, B.rows);

    // multiply the spectrums;
    // the function handles packed spectrum representations well
    mulSpectrums(tempA, tempB, tempA, DFT_COMPLEX_OUTPUT);
	//mulSpectrums(tempA, tempB, tempA, DFT_REAL_OUTPUT);

    // transform the product back from the frequency domain.
    // Even though all the result rows will be non-zero,
    // you need only the first C.rows of them, and thus you
    // pass nonzeroRows == C.rows
    dft(tempA, tempA, DFT_INVERSE + DFT_SCALE, C.rows);

    // now copy the result back to C.
    tempA(Rect(0, 0, C.cols, C.rows)).copyTo(C);

    // all the temporary buffers will be deallocated automatically
}


int main(int argc, char* argv[])
{
	const char* filename = argc >=2 ? argv[1] : "Lenna.png";

    Mat I = imread(filename, CV_LOAD_IMAGE_GRAYSCALE);
    if( I.empty())
        return -1;

	Mat kernel = (Mat_(3,3) << 1, 1, 1, 1, 1, 1, 1, 1, 1);
	cout << kernel;

	Mat floatI = Mat_(I);// change image type into float
	Mat filteredI;
	convolveDFT(floatI, kernel, filteredI);
	
	normalize(filteredI, filteredI, 0, 1, CV_MINMAX); // Transform the matrix with float values into a
                                            // viewable image form (float between values 0 and 1).
	imshow("image", I);
	imshow("filtered", filteredI);
	waitKey(0);

}

当中：

C.create(abs(A.rows - B.rows)+1, abs(A.cols - B.cols)+1, A.type());

C 为什么是这种勒？想想一个特殊的样例就知道了：当A，B尺寸相等的时候，这个时候的高斯滤波得到的也就是中心点的那一个值（卷积核滤波的区别在于须要绕中心180度旋转）。

MulSpectrums 是对于两张频谱图中每个元素的乘法。

void cvMulSpectrums( const CvArr* src1, const CvArr* src2, CvArr* dst, int flags );
src1 
第一输入数组 
src2 
第二输入数组 
dst 
输出数组，和输入数组有同样的类型和大小。 
flags 
以下列举的值的组合: 
CV_DXT_ROWS - 把数组的每一行视为一个单独的频谱 (參见 cvDFT 的參数讨论). 
CV_DXT_MUL_CONJ - 在做乘法之前取第二个输入数组的共轭.

第四个參数flag值没有指定，应指定为DFT_COMPLEX_OUTPUT或是DFT_REAL_OUTPUT.

參考资料：

http://blog.sina.com.cn/s/blog_4bdb170b01019atv.html

http://www.opencv.org.cn/opencvdoc/2.3.2/html/doc/tutorials/core/discrete_fourier_transform/discrete_fourier_transform.html

http://www.cnblogs.com/xianglan/archive/2010/12/30/1922386.html

http://www.cnblogs.com/tornadomeet/archive/2012/07/26/2610414.html

http://blog.csdn.net/ubunfans/article/details/24787569

http://blog.csdn.net/lichengyu/article/details/18848281

你可能感兴趣的:(图像处理,OpenCv,视觉)

MATLAB算法实战应用案例精讲-【目标检测】机器视觉-工业相机（补充篇）林聪木数码相机 matlab 算法
目录知识储备光学系统设计全过程算法原理工业相机基本参数以及选型工业相机基本参数：如何选择合适的工业相机：分辨率分辨率的定义与“检测/测量精度”的区别分辨率与相机的匹配相机关键参数设置工业相机的曝光、曝光时间、快门、增益什么是曝光？什么是快门影响曝光的因素工业相机-坐标系和机械手坐标系的标定工业相机-缺陷检测一、相机的选择（1）工业数字相机的分类：（2）相机的主要参数（3）工业数字摄像机主要接口类型
利用 OpenCV 进行棋盘检测与透视变换萧鼎 python基础到进阶教程 opencv 人工智能计算机视觉
利用OpenCV进行棋盘检测与透视变换1.引言在计算机视觉领域，棋盘检测与透视变换是一个常见的任务，广泛应用于摄像机标定、文档扫描、增强现实（AR）等场景。本篇文章将详细介绍如何使用OpenCV进行棋盘检测，并通过透视变换将棋盘区域转换为一个标准的矩形图像。我们将基于一段Python代码进行分析，代码的主要任务包括：读取图像并进行预处理（灰度转换、自适应直方图均衡化、去噪）检测边缘并提取棋盘区域计
对换脸、动嘴生成的视频做初筛之群害马音视频计算机视觉 opencv
首尾帧人脸差异检测代码概述本脚本实现了一个简单的视频筛查系统，主要功能是通过比较视频首帧和尾帧中的人脸差异来判断视频是否合格。如果视频中没有人脸或存在其他异常情况，视频将被移动到错误目录中。具体来说，系统包含以下几个主要步骤：加载视频文件：尝试打开视频文件，并读取首帧和尾帧。人脸检测：使用OpenCV的Haar级联分类器检测视频首帧和尾帧中的人脸。人脸提取与标准化：从检测到的人脸区域中提取并标准化
智能硬件定位技术发展趋势 2401_88540551 智能硬件智能手表物联网宠物智慧城市 uni-app 微信小程序
在科技飞速进步的当下，智能硬件定位技术作为众多领域的关键支撑，正沿着多元且极具创新性的路径蓬勃发展，持续重塑我们的生活与工作方式。一、精度提升的极致追求当前，智能硬件定位精度虽已满足诸多日常应用，但未来发展仍聚焦高精度突破。在自动驾驶领域，厘米级甚至毫米级定位精度至关重要。科研人员正致力于融合多种定位技术，如卫星定位、惯性导航、视觉识别与高精度地图匹配。通过复杂算法协同运作，车辆在复杂路况下能精准
51-31 CVPR’24 | VastGaussian，3D高斯大型场景重建深圳季连AIgraphX aiXpilot 智驾大模型1 自动驾驶智慧城市 AIGC 计算机视觉数据挖掘
2024年2月，清华大学、华为和中科院联合发布的VastGaussian模型，实现了基于3DGaussianSplatting进行大型场景高保真重建和实时渲染。Abstract现有基于NeRF大型场景重建方法，往往在视觉质量和渲染速度方面存在局限性。虽然最近3DGaussiansSpltting在小规模和以对象为中心的场景中效果很好，但由于视频内存有限、优化时间长、外观变化明显，将其扩展到大型场景
CVPR2023 Highlight | ECON：最新单图穿衣人三维重建SOTA算法 3Ｄ视觉工坊 3D视觉从入门到精通算法 SLAM 自动驾驶 3D视觉
作者：宁了个宁|来源：计算机视觉工坊在公众号「3D视觉工坊」后台，回复「原论文」可获取论文pdf。添加微信：dddvisiona，备注：三维重建，拉你入群。文末附行业细分群。图1所示。从彩色图像进行人体数字化。ECON结合了自由形式隐式表示的最佳方面，以及明确的拟人化正则化，以推断高保真度的3D人类，即使是宽松的衣服或具有挑战性的姿势。0.笔者个人体会这篇文章讨论了单图像的穿着人类重建问题。隐式方
什么是插值？（通俗解释） MO__YE 计算机视觉人工智能
什么是插值？（通俗解释）想象一下，你有一本100页的书，现在你想把它缩小到50页或放大到200页，但是你不想丢失重要的信息。你会怎么做？缩小（Downsampling）：你可以挑选关键的内容，把不重要的部分去掉。放大（Upsampling）：你可以在两页之间补充一些额外的内容，使它们读起来更连贯。在图像处理中，插值（Interpolation）就是如何在缩放图片时，生成新的像素点，让图片看起来更自
商汤绝影端到端自动驾驶的迭代优化 AGI大模型与大数据研究院计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
自动驾驶,端到端,迭代优化,深度学习,感知,规划,控制,模型训练,数据增强,模型微调1.背景介绍随着人工智能和计算机视觉技术的飞速发展，自动驾驶汽车从科幻走进了现实。商汤科技推出的绝影端到端自动驾驶系统，就是其中的佼佼者。本文将深入剖析商汤绝影端到端自动驾驶系统的迭代优化过程，帮助读者理解其背后的技术原理和架构设计。2.核心概念与联系商汤绝影端到端自动驾驶系统的核心架构如下：graphLRA[感知
AI日报 - 2025年02月16日 - 推特版訾博ZiBo AI日报人工智能
今日概览（60秒速览）▎AGI突破|阿里巴巴发布Qwen2.5-VL视觉语言模型，支持多模态交互新模型评测榜性能提升30%▎商业动向|NVIDIABlackwell超级芯片网络研讨会将聚焦生成式AI创新预计推动算力市场增长15%▎政策追踪|印度总统宣布AI国家战略升级，聚焦半导体与算法研发计划未来3年投入50亿美元一、今日热点(HotTopic)1.1阿里巴巴发布Qwen2.5-VL系列视觉语言模
vue单词汇总小六妹妹 vue.js 前端 javascript
vueVue单词大全0~9vue:(view)视图，视觉;message:消息;item:项目;in:在...里面;在(某范围或空间内的)某一点;在(某物的形体或范围)中;在…内;在…中;进入;counter:计数器;柜台;对立面;el:(element)(计算计)挂载元素;Vue实例挂载的元素节点;data:数据;methods:方法,方法论;add:添加;reduce:减少;10~19func
CVPR‘24 | 百度开源DETRs在实时目标检测中胜过YOLOs 3Ｄ视觉工坊 3D视觉从入门到精通百度目标检测人工智能计算机视觉
点击下方卡片，关注「3D视觉工坊」公众号选择星标，干货第一时间送达来源：3D视觉工坊添加小助理：dddvision，备注：目标检测，拉你入群。文末附行业细分群论文题目：DETRsBeatYOLOsonReal-timeObjectDetection作者：WenyuLv,YianZhao等作者机构：BaiduInc.论文链接：https://arxiv.org/pdf/2304.08069.pdf代
新书速览|细说PyTorch深度学习：理论、算法、模型与编程实现全栈开发圈深度学习 pytorch 算法
超详细的PyTorch深度学习入门书，100余个编程示例+6大热点案例，大咖带路，边学边实践。本书特点：1.专家编撰：由资深专家精心编撰，通俗易懂，娓娓道来2．范例丰富：100余个编程教学示例，帮你深入理解，边学习、边操练。3.实战应用：6大典型应用，原理与实操并重，快速掌握提升实战能力。4技术先进：视觉transformer模型详解，紧跟大模型核心技术。5易于上手：Pytorch详解并使用Pyt
ocr智能票据识别系统|自动化票据识别集成方案 OCR_API 接口 ocr 自动化运维
在企业日常运营中，对大量票据实现数字化管理是一项耗时且容易出错的任务。随着技术的进步，OCR（光学字符识别）智能票据识别系统的出现为企业提供了一个高效、准确的解决方案，不仅简化了财务流程，还大幅提升了工作效率。一、什么是OCR智能票据识别系统？OCR智能票据识别系统是一种基于先进图像处理和深度学习算法的技术，能够自动从各类票据中提取关键信息，并将其转换为结构化数据。翔云发票识别系统可以应用于增值税
深度学习下的图像分割人工智能大讲堂深度学习人工智能
在之前写的文章[图像分割演进之路]中，讲述了图像分割的发展历程，从传统图像分割算法到人工智能，分割算法百花齐放，但最终的佼佼者当属人工智能，但即使是人工智能领域，图像分割也五花八门，今天就让我们看几种基于学习的图像分割方法。基于学习的图像分割算法主要依赖于深度神经网络，经典的深度神经网络分为如下几种：2.1卷积神经网络CNN：卷积神经网络是图像处理领域应用最为广泛的网络，其权值共享，局部连接等特性
使用OpenCV在Visual Studio上编译x86或x64平台的应用程序程序世界航海 opencv visual studio 人工智能编程
OpenCV是一个广泛使用的计算机视觉库，它提供了丰富的图像处理和计算机视觉算法。如果你想在VisualStudio上编译一个使用OpenCV的应用程序，并且需要针对特定的x86或x64平台进行优化，那么本文将为你提供一些指导。以下是在VisualStudio中编译x86或x64平台上的OpenCV应用程序的步骤：步骤1：安装VisualStudio和OpenCV首先，确保你已经安装了最新版本的V
用realsense d435i传感器在实际环境中跑ORB_SLAM3，顺带解决一部分编译问题睫力上爬 SLAM 日常折腾传感器 ORB_SLAM3
是的ORB_SLAM3来了，时隔五年，它来带的惊喜到底是啥呢？一个完全依赖于最大后验估计（MAP）的单/双目惯导融合系统高回召的地点识别功能（High-recallplacerecognition）第一个完整的多地图系统（multi-map）一个抽象的相机模型表示论文地址论文细节今天不说，今天主要先拿到代码，并且用自己的传感器试试实际效果编译终端拉代码记得提前安装好OpenCV，Eigen，和Pa
ROS教程（六）：Rviz显示USB摄像头（详细图文） Leslie___Cheung ROS ROS rviz usb摄像头
目录前言一、RVIZ介绍1.数据类型介绍2.界面介绍二、配置RVIZ1.打开RVIZ2.添加模块三、启动总结（最重要的）前言上一章讲解了如何使用OpenCV调用电脑摄像头或USB摄像头，本章Leslie就讲解如何使用rviz来显示摄像头的画面。一、RVIZ介绍1.数据类型介绍参考ROS教程（四）->数据类型介绍2.界面介绍二、配置RVIZ1.打开RVIZ打开终端，输入rvi
【ORB_SLAM系列3】—— 如何在Ubuntu18.04中使用自己的单目摄像头运行ORB_SLAM3（亲测有效，踩坑记录）啥也不会的研究僧 SLAM算法安装与实践记录 ubuntu 计算机视觉人工智能自动驾驶
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、ORB_SLAM3源码编译二、ORB_SLAM3实时单目相机测试1.查看摄像头的话题2.运行测试三.运行测试可能的报错1.报错一(1)问题描述(2)原因分析(3)解决2.报错二(1)问题描述(2)解决前言本次教程运行ORB_SLAM3，所需的环境如下：Ubuntu18.04、ros版本：melodicOpencv4.5
奥比中光3D机器视觉相机能连接halcon吗？视觉人机器视觉机器视觉3D 3d 数码相机视觉检测 c#
奥比中光的设备与Halcon的兼容性可以通过以下方式实现：数据接口的通用性奥比中光的相机（如AstroPro、大白等）支持通过UVC协议获取彩色图像，深度数据则通过OpenNI或ROS2接口传输105。若Halcon支持这些协议或标准接口（如ROS消息、OpenCV图像流），则可通过直接调用或二次开发实现连接。例如，通过Python或C#脚本将图像数据从相机传输至Halcon的处理流程中。SDK与
探秘 DeepSeek R1 模型：跨越多领域的科技奇迹，引领智能应用新浪潮羑悻的小杀马特. AI学习科技 deepseek AI大模型
DeepSeekR1模型功能强大，应用广泛。在自然语言处理、计算机视觉、推荐系统和医疗等领域都能发挥作用。本文介绍了其在各领域的应用场景和代码示例，助你深入了解它。目录编辑一、本篇背景：二、DeepSeekR1模型概述：2.1模型特点：2.2技术原理：三、自然语言处理领域的应用：3.1文本分类：3.1.1应用场景：3.1.2代码演示：3.2情感分析：3.2.1应用场景：3.2.2代码演示：3.3机
智能图像处理平台：技术融合与实践的结晶顾北辰20 智能图像处理平台图像处理人工智能
目录项目目标项目功能用户模块图像处理模块异步任务模块技术栈数据库设计核心功能实现方式图片上传图片处理异步任务项目扩展近日DeepSeek很火，我让他给我出了个小项目练练手，带大家一起做一下，可做为毕业设计参考。在当今数字化时代，图像处理技术广泛应用于各个领域，从医学影像到社交媒体，其重要性不言而喻。本文将介绍一个智能图像处理平台的练手项目，旨在巩固Java、MySQL、SpringBoot、Red
Ubuntu 安装 OpenCV (C++) LegendBIT 程序开发--基本工具 ubuntu opencv c++
版本详情：Ubuntu:22.04+5.15.0-133-genericgcc:11.4.0g++:11.4.0OpenCV:4.7.01.卸载OpenCV进入原先编译opencv的build目录，在该目录下打开终端，执行以下代码（如果build已经删除了，可以重新编译一遍该版本的opencv，然后在最后一步执行sudomakeuninstall）sudomakeuninstallcd..sudo
QT5在windows下调用OpenCV库出现: undefined reference to `xxxxx' 错误解决办法（适用MinGW编译器）。 DS小龙哥 QT(C++)应用软件开发 AI人工智能 opencv
一、环境介绍window系统：win10X64QT版本:5.12QT5.12自带的MinGW编译器版本：mingw730_32与mingw730_64在QT的安装目录下，可以查看MinGW编译器的版本:二、使用OpenCV出现的问题在QT框架代码里使用老版本的分类器(cvLoad、cvHaarDetectObjects)处理图像时，正常编译没有问题，当使用新版本级联分类器(CascadeClass
可对画面进行平台传输，实时查看监控的智慧交通开源了 AI服务老曹开源人工智能大数据物联网
智慧交通视觉监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。用户只需在界面上进行简单的操作，就可以实现全视频的接入及布控。项目搭建地址项目开源地址：yihecode-server本项目基于ai场景而开发，提供算法模型管理、摄像头管理、告警管理、数
【最全基础知识1】机器视觉系统硬件组成之工业相机篇 51camera 工业相机工业相机机器视觉机器视觉硬件工业照相机 1024程序员节
工业相机是一种非常重要的机器视觉器件，它能够将被采集的图像信息通过电路转换成电信号，再通过模数转换器（ADC）将其转化为数字信号，最后以标准的视频信号输出。工业相机在机器视觉领域得到了广泛应用，包括质量控制、工业检测、医疗诊断、安全监控以及交通管理等诸多领域。目录机器视觉是通过光学装置和非接触传感器自动地接收和处理一个真实物体的图像，以获得所需信息或用于控制机器人运动的装置。简单来说，机器视觉是用
基于Java的自助多张图片合成拼接实战夜郎king java Java多图片合成 Java图片合成实战
目录前言一、图片合成需求描述二、图片合成设计与实现1、编程语言2、基础数据准备3、图片合成流程4、图片合成实现三、总结前言在当今数字化时代，图像处理技术在各个领域都发挥着至关重要的作用。从社交媒体到电子商务，从在线教育到虚拟现实，图像的展示和处理方式直接影响着用户体验和信息传递的效率。而图片合成拼接技术作为图像处理中的一个重要分支，其应用范围广泛，需求也日益增长。在实际开发中，图片合成拼接的需求多
使用opencv实现深度学习的图片与视频的超分辨率人工智能研究所人工智能之计算机视觉 opencv 深度学习视频超分辨率图片超分辨率
图片超分辨率什么是视频与图片的超分辨率，总结一下便是给一张分辨率比较低的图片，进行超分辨率的处理后，生成比较清晰的高分辨率的图片，上图图片完美解释了超分辨率的过程，由于不同的算法不同，处理的结果也不相同，本期我们介绍一下如何进行图片的超分辨率的处理。·EDSR模型图像超分辨率EDSR：EnhancedDeepResidualNetworksforSingleImageSuper-Resolutio
c语言%.4f,4f,4F法则是什么满天乱走 c语言%.4f
4F法则是什么KISS是keepitSimpleStupid，即“使之简单笨拙”。是指广告创意的简洁原则，广告创意主题要突出，信息要凝练，无关紧要的要删去。电视广告镜头要破除繁琐，反映主信息；平面广告要讲究视觉流程，突显主题，越单纯越易为受众接受。4F是指优秀的...c语言中.4f是什么意思.4f是用于输出浮点数的格式字符串，输出时保留四位小数，输出宽度为10位，不足十位右侧补空格，超过十位按实际
OpenCV 简介奇点创客 OpenCV
OpenCV（OpenSourceComputerVisionLibrary，开源计算机视觉库：http://opencv.org）是一个开放源代码库，其中包含数百种计算机视觉算法。本文档介绍所谓的OpenCV2.xAPI，与基于C的OpenCV1.xAPI相比，该API本质上是一套C++API（自OpenCV2.4发行以来，不推荐再使用CAPI，并且不使用“C”编译器进行测试）。OpenCV具有
OpenCV机器学习（1）人工神经网络 - 多层感知器类cv::ml::ANN_MLP 村北头的码农 OpenCV opencv 机器学习人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::ml::ANN_MLP是OpenCV库中的一部分，用于实现人工神经网络-多层感知器（ArtificialNeuralNetwork-Multi-LayerPerceptron,ANN-MLP）。它提供了一种方式来创建和训练多层感知器模型，以解决分类、回归等
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f

opencv学 之图像傅里叶变换dft

一、前言

二、关键函数解析

2.1copyMakeBorder() 扩展图片尺寸

2.2getOptimalDFTSize() 获取最佳计算尺寸

2.3dft()傅里叶变换计算

2.4magnitude()计算二维矢量幅值

2.5log()自然对数计算

2.6normalize()矩阵归一化

三、代码及结果分享

四、注意事项

4.1Mat对象类型问题

4.2clone()与copyTo()的差异问题

Opencv 实现图像的离散傅里叶变换（DFT）、卷积运算（相关滤波）

你可能感兴趣的:(图像处理,OpenCv,视觉)

opencv学之图像傅里叶变换dft