OpenCV3 之 离散傅里叶变换

1. 离散傅里叶变换(DFT)原理

傅里叶变换:任一函数都可以表示成无数个正弦和余弦函数的和的形式。

对一张图像应用DFT可将其分解成正弦和余弦两部分,即将图像从空间域转换到频域。

对于二维图像的傅里叶变换可用如下公式表达:
F ( k , l ) = ∑ i = 0 N − 1 ∑ j = 0 N − 1 f ( i , j ) e − i 2 π ( k i N + l j N ) F(k, l)=\sum_{i=0}^{N-1} \sum_{j=0}^{N-1} f(i, j) \mathrm{e}^{-\mathrm{i} 2 \pi\left(\frac{k i}{N}+\frac{l j}{N}\right)} F(k,l)=i=0N1j=0N1f(i,j)ei2π(Nki+Nlj)
e i x = cos ⁡ x + i sin ⁡ x \mathrm{e}^{\mathrm{i} x}=\cos x+\mathrm{i} \sin x eix=cosx+isinx

where, f f f是空间域值,F是频域值,转换之后的频域值是复数。

显示傅里叶变换之后的结果需要使用实数图像+虚数图像,或者幅度图像+相位图像的形式。

通常幅度图像包含了原图像的几乎所有几何信息,但如果想通过修改幅度图像/相位图像的方法来间接修改原空间的图像,需使用逆傅里叶变换得到修改后的空间图像,此时必须同时保留幅度图像和相位图像。

在频域中,高频部分代表了图像的细节和纹理信息,而低频部分代表图像的轮廓信息。因此,对一幅图像使用低通滤波器得到的是图像的轮廓。

2. 常用函数

  • dft()函数:对一维或二维浮点数数组进行正向或反向离散傅里叶变换。

    void dft(InputArray src, OutputArray dst, int flags=0, int nonzeroRows=0);
    
    • 参数1:输入矩阵,可为实数/虚数
    • 参数2:输出结果,尺寸及类型取决于参数3的标识符
    • 参数3:默认值为0,取值如下:
      OpenCV3 之 离散傅里叶变换_第1张图片
    • 参数4:默认值为0,当此参数设为非零时,函数会假设只有输入矩阵的第一个非零行包含非零元素,或只有输出矩阵的第一个非零行包含非零元素。
  • getOptimalDFTSize()函数:返回给定向量尺寸的DFT最优尺寸大小

    // 参数vecsize为向量尺寸,即图片的rows、cols
    int getOptimalDFTSize(int vecsize);
    
  • copyMakeBorder()函数:扩充图像边界

    void copyMakeBorder(InputArray src, OutputArray dst, int top, int bottom, int left, int right, int borderType, const Scalar& value=Scalar());
    
    • 参数1:输入图像,Mat类型即可
    • 参数2:输出结果,与原图像同尺寸同类型
    • 参数3、4、5、6:上下左右扩展的像素宽度
    • 参数7:borderType类型的边界类型,常见取值为BORDER_CONSTANT
    • 参数8:默认值Scalar(),当borderType = BORDER_CONSTANT时,此参数表示边界值
  • magnitude()函数:计算二维矢量的幅值

    void magnitude(InputArray x, InputArray y, OutputArray magnitude);
    
    • 参数1:表示矢量的浮点型X坐标值,即实部
    • 参数2:表示矢量的浮点型Y坐标系,即虚部
    • 参数3:输出的幅值,与参数1同尺寸同类型
      原理公式:
      d s t ( I ) = x ( I ) 2 + y ( I ) 2 d s t(I)=\sqrt{x(I)^{2}+y(I)^{2}} dst(I)=x(I)2+y(I)2
  • log()函数:计算每个数组元素绝对值的自然对数

    void log(InputArray src, OutputArray dst);
    
    • 参数1:输入图像
    • 参数2:得到的对数值

    原理公式:
    dst ⁡ ( I ) = { log ⁡ ∣ src ⁡ ( I ) ∣  if  src ⁡ ( I ) ≠ 0 C  oterwise  \operatorname{dst}(\mathrm{I})=\left\{\begin{array}{ll}{\log |\operatorname{src}(\mathrm{I})|} & {\text { if } \operatorname{src}(\mathrm{I}) ≠ 0} \\ {\mathrm{C}} & {\text { oterwise }}\end{array}\right. dst(I)={logsrc(I)C if src(I)̸=0 oterwise 

  • normalize()函数:矩阵归一化

    void normalize(InputArray src, OutputArray dst, double alpha=1, double beta=0, int norm_type=NORM_L2, int dtype=-1, InputArray mask=noArray());
    
    • 参数1:输入图像
    • 参数2:输出结果,与输入图像同尺寸同类型
    • 参数3:归一化后的最大值,默认值为1
    • 参数4:归一化后的最小值,默认值为0
    • 参数5:归一化类型,有NORM_INF、NORM_L1、NORM_L2、NORM_MINMAX等参数可选,默认为NORM_L2
    • 参数6:默认值为-1,此参数为负时输出矩阵和输入图像有相同类型,否则其与输入图像有相同通道数,但此时图像深度为CV_MAT_DEPTH
    • 参数7:可选的操作掩膜,默认值为noArray()

3. 示例

// By:浅墨_毛星云

//---------------------------------【头文件、命名空间包含部分】-----------------------------
//		描述:包含程序所使用的头文件和命名空间
//-------------------------------------------------------------------------------------------------
#include "opencv2/opencv.hpp"
#include 
using namespace cv;

//--------------------------------------【main( )函数】-----------------------------------------
//          描述:控制台应用程序的入口函数,我们的程序从这里开始执行
//-------------------------------------------------------------------------------------------------
int main( )
{

	//【1】以灰度模式读取原始图像并显示
	Mat srcImage = imread("1.jpg", 0);
	if(!srcImage.data ) { printf("读取图片错误,请确定目录下是否有imread函数指定图片存在~! \n"); return false; } 
	imshow("原始图像" , srcImage);   

	//【2】将输入图像延扩到最佳的尺寸,边界用0补充
	int m = getOptimalDFTSize( srcImage.rows );
	int n = getOptimalDFTSize( srcImage.cols ); 
	//将添加的像素初始化为0.
	Mat padded;  
	copyMakeBorder(srcImage, padded, 0, m - srcImage.rows, 0, n - srcImage.cols, BORDER_CONSTANT, Scalar::all(0));

	//【3】为傅立叶变换的结果(实部和虚部)分配存储空间。
	//将planes数组组合合并成一个多通道的数组complexI
	Mat planes[] = {Mat_<float>(padded), Mat::zeros(padded.size(), CV_32F)};
	Mat complexI;
	merge(planes, 2, complexI);         

	//【4】进行就地离散傅里叶变换
	dft(complexI, complexI);           

	//【5】将复数转换为幅值,即=> log(1 + sqrt(Re(DFT(I))^2 + Im(DFT(I))^2))
	split(complexI, planes); // 将多通道数组complexI分离成几个单通道数组,planes[0] = Re(DFT(I), planes[1] = Im(DFT(I))
	magnitude(planes[0], planes[1], planes[0]);// planes[0] = magnitude  
	Mat magnitudeImage = planes[0];

	//【6】进行对数尺度(logarithmic scale)缩放
	magnitudeImage += Scalar::all(1);
	log(magnitudeImage, magnitudeImage);//求自然对数

	//【7】剪切和重分布幅度图象限
	//若有奇数行或奇数列,进行频谱裁剪      
	magnitudeImage = magnitudeImage(Rect(0, 0, magnitudeImage.cols & -2, magnitudeImage.rows & -2));
	//重新排列傅立叶图像中的象限,使得原点位于图像中心  
	int cx = magnitudeImage.cols/2;
	int cy = magnitudeImage.rows/2;
	Mat q0(magnitudeImage, Rect(0, 0, cx, cy));   // ROI区域的左上
	Mat q1(magnitudeImage, Rect(cx, 0, cx, cy));  // ROI区域的右上
	Mat q2(magnitudeImage, Rect(0, cy, cx, cy));  // ROI区域的左下
	Mat q3(magnitudeImage, Rect(cx, cy, cx, cy)); // ROI区域的右下
	//交换象限(左上与右下进行交换)
	Mat tmp;                           
	q0.copyTo(tmp);
	q3.copyTo(q0);
	tmp.copyTo(q3);
	//交换象限(右上与左下进行交换)
	q1.copyTo(tmp);                 
	q2.copyTo(q1);
	tmp.copyTo(q2);

	//【8】归一化,用0到1之间的浮点值将矩阵变换为可视的图像格式
	//此句代码的OpenCV2版为:
	//normalize(magnitudeImage, magnitudeImage, 0, 1, CV_MINMAX); 
	//此句代码的OpenCV3版为:
	normalize(magnitudeImage, magnitudeImage, 0, 1, NORM_MINMAX); 

	//【9】显示效果图
	imshow("频谱幅值", magnitudeImage);    
	waitKey();

	return 0;
}

你可能感兴趣的:(▶,CV相关)