傅里叶变换:任一函数都可以表示成无数个正弦和余弦函数的和的形式。
对一张图像应用DFT可将其分解成正弦和余弦两部分,即将图像从空间域转换到频域。
对于二维图像的傅里叶变换可用如下公式表达:
F ( k , l ) = ∑ i = 0 N − 1 ∑ j = 0 N − 1 f ( i , j ) e − i 2 π ( k i N + l j N ) F(k, l)=\sum_{i=0}^{N-1} \sum_{j=0}^{N-1} f(i, j) \mathrm{e}^{-\mathrm{i} 2 \pi\left(\frac{k i}{N}+\frac{l j}{N}\right)} F(k,l)=i=0∑N−1j=0∑N−1f(i,j)e−i2π(Nki+Nlj)
e i x = cos x + i sin x \mathrm{e}^{\mathrm{i} x}=\cos x+\mathrm{i} \sin x eix=cosx+isinx
where, f f f是空间域值,F是频域值,转换之后的频域值是复数。
显示傅里叶变换之后的结果需要使用实数图像+虚数图像,或者幅度图像+相位图像的形式。
通常幅度图像包含了原图像的几乎所有几何信息,但如果想通过修改幅度图像/相位图像的方法来间接修改原空间的图像,需使用逆傅里叶变换得到修改后的空间图像,此时必须同时保留幅度图像和相位图像。
在频域中,高频部分代表了图像的细节和纹理信息,而低频部分代表图像的轮廓信息。因此,对一幅图像使用低通滤波器得到的是图像的轮廓。
dft()函数:对一维或二维浮点数数组进行正向或反向离散傅里叶变换。
void dft(InputArray src, OutputArray dst, int flags=0, int nonzeroRows=0);
getOptimalDFTSize()函数:返回给定向量尺寸的DFT最优尺寸大小
// 参数vecsize为向量尺寸,即图片的rows、cols
int getOptimalDFTSize(int vecsize);
copyMakeBorder()函数:扩充图像边界
void copyMakeBorder(InputArray src, OutputArray dst, int top, int bottom, int left, int right, int borderType, const Scalar& value=Scalar());
magnitude()函数:计算二维矢量的幅值
void magnitude(InputArray x, InputArray y, OutputArray magnitude);
log()函数:计算每个数组元素绝对值的自然对数
void log(InputArray src, OutputArray dst);
原理公式:
dst ( I ) = { log ∣ src ( I ) ∣ if src ( I ) ≠ 0 C oterwise \operatorname{dst}(\mathrm{I})=\left\{\begin{array}{ll}{\log |\operatorname{src}(\mathrm{I})|} & {\text { if } \operatorname{src}(\mathrm{I}) ≠ 0} \\ {\mathrm{C}} & {\text { oterwise }}\end{array}\right. dst(I)={log∣src(I)∣C if src(I)̸=0 oterwise
normalize()函数:矩阵归一化
void normalize(InputArray src, OutputArray dst, double alpha=1, double beta=0, int norm_type=NORM_L2, int dtype=-1, InputArray mask=noArray());
// By:浅墨_毛星云
//---------------------------------【头文件、命名空间包含部分】-----------------------------
// 描述:包含程序所使用的头文件和命名空间
//-------------------------------------------------------------------------------------------------
#include "opencv2/opencv.hpp"
#include
using namespace cv;
//--------------------------------------【main( )函数】-----------------------------------------
// 描述:控制台应用程序的入口函数,我们的程序从这里开始执行
//-------------------------------------------------------------------------------------------------
int main( )
{
//【1】以灰度模式读取原始图像并显示
Mat srcImage = imread("1.jpg", 0);
if(!srcImage.data ) { printf("读取图片错误,请确定目录下是否有imread函数指定图片存在~! \n"); return false; }
imshow("原始图像" , srcImage);
//【2】将输入图像延扩到最佳的尺寸,边界用0补充
int m = getOptimalDFTSize( srcImage.rows );
int n = getOptimalDFTSize( srcImage.cols );
//将添加的像素初始化为0.
Mat padded;
copyMakeBorder(srcImage, padded, 0, m - srcImage.rows, 0, n - srcImage.cols, BORDER_CONSTANT, Scalar::all(0));
//【3】为傅立叶变换的结果(实部和虚部)分配存储空间。
//将planes数组组合合并成一个多通道的数组complexI
Mat planes[] = {Mat_<float>(padded), Mat::zeros(padded.size(), CV_32F)};
Mat complexI;
merge(planes, 2, complexI);
//【4】进行就地离散傅里叶变换
dft(complexI, complexI);
//【5】将复数转换为幅值,即=> log(1 + sqrt(Re(DFT(I))^2 + Im(DFT(I))^2))
split(complexI, planes); // 将多通道数组complexI分离成几个单通道数组,planes[0] = Re(DFT(I), planes[1] = Im(DFT(I))
magnitude(planes[0], planes[1], planes[0]);// planes[0] = magnitude
Mat magnitudeImage = planes[0];
//【6】进行对数尺度(logarithmic scale)缩放
magnitudeImage += Scalar::all(1);
log(magnitudeImage, magnitudeImage);//求自然对数
//【7】剪切和重分布幅度图象限
//若有奇数行或奇数列,进行频谱裁剪
magnitudeImage = magnitudeImage(Rect(0, 0, magnitudeImage.cols & -2, magnitudeImage.rows & -2));
//重新排列傅立叶图像中的象限,使得原点位于图像中心
int cx = magnitudeImage.cols/2;
int cy = magnitudeImage.rows/2;
Mat q0(magnitudeImage, Rect(0, 0, cx, cy)); // ROI区域的左上
Mat q1(magnitudeImage, Rect(cx, 0, cx, cy)); // ROI区域的右上
Mat q2(magnitudeImage, Rect(0, cy, cx, cy)); // ROI区域的左下
Mat q3(magnitudeImage, Rect(cx, cy, cx, cy)); // ROI区域的右下
//交换象限(左上与右下进行交换)
Mat tmp;
q0.copyTo(tmp);
q3.copyTo(q0);
tmp.copyTo(q3);
//交换象限(右上与左下进行交换)
q1.copyTo(tmp);
q2.copyTo(q1);
tmp.copyTo(q2);
//【8】归一化,用0到1之间的浮点值将矩阵变换为可视的图像格式
//此句代码的OpenCV2版为:
//normalize(magnitudeImage, magnitudeImage, 0, 1, CV_MINMAX);
//此句代码的OpenCV3版为:
normalize(magnitudeImage, magnitudeImage, 0, 1, NORM_MINMAX);
//【9】显示效果图
imshow("频谱幅值", magnitudeImage);
waitKey();
return 0;
}