opencv3/C++ 离散余弦变换DCT

离散余弦变换/Discrete cosine transform,

根据离散傅里叶变换的性质,实偶函数的傅里叶变换只含实的余弦项,而数字图像都是实数矩阵,因此构造了一种实数域的变换——离散余弦变换(DCT)。
离散余弦变换具有很强的”能量集中”特性,左上方称为低频数据,右下方称为高频数据。而大多数的自然信号(包括声音和图像)的能量都集中在离散余弦变换后的低频部分。因此也可以在图像压缩算法中用来进行有损压缩。(如JPEG压缩编码)

OpenCV中dct()

在OpenCV中有专门进行离散余弦变换的函数dct()。
dct()函数执行1D或2D浮点数组的正向或反向离散余弦变换(DCT):
N个元素的一维向量的正余弦变换:
Y=C(N)X Y = C ( N ) ⋅ X
此处 C(N)jk=αj/Ncos(π(2k+1)j2N) C j k ( N ) = α j / N cos ⁡ ( π ( 2 k + 1 ) j 2 N ) αj=2 α j = 2 j>0 j > 0

  • N个元素的一维矢量的逆余弦变换:
    X=(C(N))1Y=(C(N))TYC(N) X = ( C ( N ) ) − 1 ⋅ Y = ( C ( N ) ) T ⋅ Y C ( N )
    由于 CN C ( N ) 是一个正交矩阵,因此 C(N)(C(N))T=I C ( N ) ⋅ ( C ( N ) ) T = I
  • M×N矩阵的正向2D余弦变换:
    Y=C(N)X(C(N))T Y = C ( N ) ⋅ X ⋅ ( C ( N ) ) T
  • M×N矩阵的逆二维余弦变换:
    X=(C(N))TXC(N) X = ( C ( N ) ) T ⋅ X ⋅ C ( N )

该函数通过查看输入数组的标志和大小来选择操作模式:

  • 如果(flags&DCT_INVERSE)== 0,则函数执行向前的1D或2D变换。否则是一个逆1D或2D变换。
  • 如果(flags&DCT_ROWS)!= 0,则函数执行每行的一维变换。
  • 如果数组是单列或单行,则该函数执行一维变换。
  • 如果以上都不是,则该函数执行2D变换。

目前dct支持偶数大小的数组(2,4,6 …)。对于数据分析和逼近,可以在必要时填充数组。另外,函数性能对数组大小的依赖性非常大,而不是单调的。在当前实现中,大小为N的矢量的DCT通过大小为N / 2的矢量的DFT来计算。因此,最佳DCT大小N1 > = N可以计算为:

size_t getOptimalDCTSize(size_t N{return 2 * getOptimalDFTSize((N + 1)/ 2); }
N1 = getOptimalDCTSize(N);

dct()参数

  • src 输入浮点数组。
  • dst 输出与src大小和类型相同的数组。
  • flags 转换标志

opencv示例

#include   
#include 
#include 
#include   
using namespace std;  
using namespace cv;  
int main()
{
    Mat src = imread("E:\\image\\sophie.jpg", 0); 
    if(src.empty())
    {
        cout << "the image is not exist" << endl;  
        return -1;
    }
    resize(src, src, Size(512, 512));
    src.convertTo(src, CV_32F, 1.0/255);
    Mat srcDCT; 
    dct(src, srcDCT);

    imshow("src", src);
    imshow("dct", srcDCT);
    waitKey();
    return 0;
}

可以看到因为第一幅图像的细节较少,因此DFT变换数据主要集中在左上方(低频区域),高频区域大部分为0:
opencv3/C++ 离散余弦变换DCT_第1张图片opencv3/C++ 离散余弦变换DCT_第2张图片

而第二幅图像相对而言具有较为丰富的细节,因此相对于第一幅图像中间区域出现了大量的非0值:
opencv3/C++ 离散余弦变换DCT_第3张图片
opencv3/C++ 离散余弦变换DCT_第4张图片


wikipedia:Discrete cosine transform

你可能感兴趣的:(OpenCV)