特征变换(6)小波历史

   小波分析的发展历程

一、    小波分析

1910年,Haar提出了L2(R)中第一个小波规范正交基,即Haar正交基。

(1)操作过程:Haar正交基是以一个简单的二值函数作为母小波经平移和伸缩而形成的。

(2)优点:Haar小波变换具有最优的时(空)域分辨率。

(3)缺点:Haar小波基是非连续函数,因而Haar小波变换的频域分辨率非常差。

1936年,Littlewood和Paley对傅立叶级数建立了二进制频率分量分组理论,(即L-P理论:按二进制频率成分分组,其傅立叶变换的相位并不影响函数的大小和形状),这是多尺度分析思想的最早起源。

1952年~1962年,Calderon等人将L-P理论推广到高维,建立了奇异积分算子理论。

1965年,Calderon发现了著名的再生公式,给出了抛物型空间上H1的原子分解。

1974年,Coifman实现了对一维空间和高维空间的原子分解。

1976年,Peetre在用L-P理论对Besov空间进行统一描述的同时,给出了Besov空间的一组基。

1981年,Stromberg引入了Sobolev空间Hp的正交基,对Haar正交基进行了改造,证明了小波函数的存在性。

1981年,法国地球物理学家Morlet提出了小波的正式概念。

1985年,法国数学家Meyer提出了连续小波的容许性条件及其重构公式。

1986年,Meyer在证明不可能存在同时在时频域都具有一定正则性(即光滑性)的正交小波基时,意外发现具有一定衰减性的光滑性函数以构造L2(R)的规范正交基(即Meyer基),从而证明了正交小波系的存在。

         1984年~1988年,Meyer、Battle和Lemarie分别给出了具有快速衰减特性的小波基函数:Meyer小波、Battle-Lemarie样条小波。

1987年,Mallat将计算机视觉领域中的多尺度分析思想引入到小波分析中,提出了多分辨率分析的概念,统一了在此前的所有具体正交小波的构造,给出了构造正交小波基的一般方法,提出了快速小波变换(即Mallat算法)。它标志着第一代小波的开始?

(1)操作过程:先滤波,再进行抽二采样。

(2)优点:Mallat算法在小波分析中的地位相当于FFT在经典傅立叶分析中的地位。它是小波分析从纯理论走向实际应用。

(3)缺点:以傅立叶变换为基础,直接在时(空)域中设计滤波器比较困难,并且计算量大。

1988年,Daubechies基于多项式方式构造出具有有限支集的光滑正交小波基(即Daubechies基)。

Chui 和中国学者王建忠基于样条函数构造出单正交小波函数,并提出了具有最优局部化性能的尺度函数和小波函数的一般性构造方法。1988 年,Daubechies在美国NSF/CBMS主办的小波专题研讨会上进行了10次演讲,引起了广大数学家、物理学家、工程师以及企业家的重视,将小波 理论发展与实际应用推向了一个高潮。

1992年,Daubechies对这些演讲内容进行了总结和扩展形成了小波领域的经典著作――小波十讲《Ten Lectures on Wavelet》。

       1992年3月,国际权威杂志《IEEE Transactions on Information Theory》专门出版了“小波分析及其应用”专刊,全面介绍了此前的小波分析理论和应用及其在不同学科领域的发展,从此小波分析开始进入了全面应用阶段。

1992年,Kovacevic和Vetterli提出了双正交小波的概念。

1992年,Cohen、Daubechies和Feauveau构造出具有对称性、紧支撑、消失矩、正则性等性质的双正交小波。

(1)操作过程:利用两组互为对偶的尺度函数和小波函数实现函数的分解与重构。

(2) 优点:具有正交小波无法同时满足的对称性、紧支撑、消失矩、正则性等性质。

1992年,Coifman和Wickerhauser提出了小波包(Wavelet Packet,WP)分析。

(1)操作过程:不仅对低通子带进行分解,而且也对高通分量分解,从而聚焦到感兴趣的任意频段。

(2)优点:突破了小波分析对信号频带进行等Q划分的局限性。

(3)缺点:最优基的搜索问题

1992年,Zou等提出了多带小波(M-band Wavelet)理论,将人们对小波变换的研究从“二带”推广到“多带”情况。

       基于“二带”小波变换的多分辨率分析中,尺度函数对应一个低通滤波器,而小波函数对应一个高通滤波器。“二带”小波变换把信号分解成不同的通道,而这些通道的带宽相对于尺度函数的对数是相同的,因此高频通道具有较宽的带宽,而低频通道具有较窄的带宽。 

1993年,Goodman等基于r阶多尺度函数及多分辨率分析建立了多小波(Multi-Wavelet)理论框架。

(1)操作过程:将单小波中由多个尺度函数生成的多分辨率空间扩展为由多个尺度函数生成,以此获得更大的自由度。

(2)优点:

1994年,Geronimo等提出了多小波变换(Multi-Wavelet Transform,MWT),将单尺度小波变换推广到多尺度小波变换。

(1)操作过程:小波函数的构造是由多个尺度函数完成的。

(2)优点:与二带小波、小波包、多带小波等单尺度小波相比,多小波在非常窄的紧支范围内同时具有光滑性、正交性、对称性、利普希茨Lipschitz连续性(消失矩)等特性。――发展中

         1991年,Alpert用多项式构造了第一个多小波。

               Geronimo等利用分形插值函数构造了正交、对称、紧支撑、逼近阶位2的GHM多小波。

1995年,Sweldens等提出了一种新的小波构造算法――提升方案(Lifting Scheme)。它标志着第二代小波的开始。

(1)操作过程:先将原始离散样本信号进行奇偶剖分,然后对奇偶样本点进行滤波处理。

(2)优点:所有的第一代小波都可以用提升方案构造出来。具有运算速度快、对内存需求量小、能实现整-整变换等特点。

(3)缺点:对于边缘、轮廓和纹理等具有高维奇异性的几何特征,小波不是表示图像的最优基。

 

小波变换的局限性:

1)二维小波变换只有2.5个方向选择性。

小波是表示具有点奇异性目标函数的最优基(能有效表示信号的零维奇异特征,反映奇异点的位置和特性),但是难以表示更高维的几何特征。

2)二维小波变换的基函数都是各向同性的。

 

非自适应多尺度几何分析――指图像变换的基函数与图像内容无关

1998年,Candès和Donoho提出了连续脊波(Ridgelet)变换。

(1)操作过程:利用Radon变换将一维奇异特征(线奇异)映射为零维奇异特征(点奇异),然后再进行小波变换。

(2)优点:Ridgelet变换是表示具有线奇异性的多变量函数的最优基。

(3)缺点:对于图像曲线边缘的描述,其逼近性能只相当于小波变换。

  1998年,Donoho提出了正交Ridgelet变换的构造方法。

1999年,Candès提出的单尺度Ridgelet变换实现了含曲线奇异的多变量函数的构造方法。

2000年,Do和Vetterli提出了一种离散Ridgelet变换。

 

1999年,Candès和Donoho在Ridgelet变换的基础上提出了连续曲波(Curvelet)变换――第一代Curvelet变换中的Curvelet99。

操作过程:子带滤波+多尺度局部Ridgelet变换。

2002年,Strack、Candès和Donoho提出了第一代Curvelet变换中的Curvelet02。

操作过程:频域子带滤波+离散局部Ridgelet变换(由算法简单的伪极坐标(Pseudo-polar)FFT变换实现)。

第一代Curvelet变换的共同点:

(1)优点:对于具有光滑奇异性曲线的目标函数提供了近乎最优的表示。

            Curvelet能够达到的MSE衰减率为O(N-2(logN)1/2)。

(2)缺点:在实现时首先用子带分解算法对原始图像进行分解,完成对图像子带滤波的功能;然后对不同的子带图像进行分块,再对每个分块进Ridgelet变换。为了避免分块效应,块与块之间必须有重叠,因此其实现算法的冗余度较高。并且,没有基于临界采样的滤波器组。

 

2002年,Candès等人提出了第二代Curvelet变换。

(1)操作过程:无需分块操作和Ridgelet变换。

(2)优点:实现简单、便于理解、算法快速。

(3)缺点:没有基于临界采样的滤波器组。

2005年,Candès提出了两种基于第二代Curvelet变换理论的快速离散实现方法:1)非均匀空间抽样的二维FFT算法(Unequally-Spaced Fast Fourier Transform,USFFT);2)Wrap算法(Wrapping-Based Transform)

 

2002年,Do和Vetterli提出了Contourlet变换。

(1)操作过程:多尺度分解+方向滤波器(Directional Filter Banks,DFB,也即2D-DFB)。首先采用拉普拉斯金字塔(Laplacian Pyramid,LP)式结构对图像进行多尺度分解以捕获奇异点,再由DFB将各尺度的细节子带进行多方向分解,从而将分布在同一尺度同一方向的奇异点合并成一个系数。为满足各向异性尺度关系,各尺度的方向子带的数量应取不同值,每隔一个尺度,方向数加倍。

(2)优点:它能用不同尺度、不同频率的自带更准确地捕获图像中的分段二次连续曲线,从而使表示图像边缘的Contourlet系数能量更加集中。

            Contourlet能够达到的MSE衰减率为O(N-2(logN)3)。

(3)缺点:没有基于临界采样的滤波器组。

 

2007年,Yue Lu和M.N. Do提出了多维方向滤波器组(N-dimensional Directional Filter Banks,NDFB)的Surfacelet变换。

(1)操作过程:多尺度分解(采用新的塔式结构)+NDFB(三维信号时为3D-DFB)。首先对信号进行多尺度分解以捕获奇异变化,接着由NDFB将同一方向上的奇异变化合成为一个系数。

(2)优点:有效地捕捉和表示高维信号中的曲面奇异。

1992年,Bamberger和Smith提出无冗余且能完全重构的方向滤波器(Directional Filter Banks,DFB,也即2D-DFB),DFB能有效地对二维信号进行方向分解。具有不可分性,把DFB从二维扩展多维,至今没有完美的实现方法。

 

2007年,Yue Lu和M.N. Do提出了多维方向滤波器组设计方法――NDFB。采用一种简单、高效的树状结构,能够对任意维的信号进行方向分解

 

Contourlet变换概述和基本原理
目前,图像增强的方法分为空域处理和频域处理两大类。空域处理是在原图像上直接进行数据运算,常见的处理方法有:线性拉伸、直方图均衡化等。对于实际低对 比度红外图像,这些方法都不可避免地会带来噪声增强过度和图像细节增强不足的现象。频域处理方法主要有基于傅里叶变换的算法、基于小波变换的算法等。二者 在图像增强时都易产生“振铃”现象。此外,基于傅里叶变换的算法会造成细节信息损失,基于小波变换的增强方法通过在变换域中对小波系数进行处理,增强图像 部分细节的同时有效地抑制了图像噪声。但是由一维小波张成的二维可分离小波基只有有限的方向,不能很好地表示图像中的方向信息,细节信息的增强明显不足。 多尺度几何分析理论(MGA)的提出和发展弥补了小波变换的这一缺陷。2002年Do和Vetterli在继承小波多尺度分析思想的基础上提出一种新的非 自适应的方向多尺度分析方法――Contourlet变换,它能在任意尺度上实现任意方向的分解,擅长描述图像中的轮廓和方向性纹理信息,很好地弥补了小 波变换的不足。  Contourlet变换是一种新的图像二维表示方法,具有多分辨率、局部定位、多方向性、近邻界采样和各向异性等性质,其基函数分布 于多尺度、多方向上,少量系数即可有效地捕捉图像中的边缘轮廓,而边缘轮廓正是自然图像中的主要特征。  Contourlet变换滤波器组结构及频率分解
Contourlet变换的基本思想是首先用一个类似小波的多尺度分解捕捉边缘奇异点,再根据方向信息将位置相近的奇异点汇集成轮廓段。选用Burr和 Adelson于1983年提出的拉普拉斯塔式滤波器结构(LP)对图像多分辨率分解来捕捉奇异点。LP分解首先产生原始信号的一个低通采样逼近及原始图 像与低通预测图像之间的一个差值图像,对得到的低通图像继续分解得到下一层的低通图像和差值图像,如此逐步滤波得到图像的多分辨率分解。二维方向滤波器组 (DFB)应用于LP分解得到的每一级高频分量上,在任意尺度上可分解得到2的n次方数目的方向子带。图像每次经LP子带分解产生的高通子带输入DFB, 逐渐将点奇异连成线形结构,从而捕获图像中的轮廓。LP与DFB结合形成双层滤波器组结构,称为塔形方向滤波器组(PDFB),由于该变换以轮廓段形式的 基函数逼近原始图像,因此也称为离散Contourlet变换。DFB的优点是对于高频部分的表现更加优秀,而LP分解的每一层将图像分解为高频部分和低 频部分,Contourlet变换很好地结合了两者的共同优点。图1给出了离散Contourlet变换的滤波器组结构图,原始粗糙图像经PDFB结构多 层分解可得到多尺度多方向的子带图像。图2则给出了一种Contourlet频域分解图(Z=3,2^3=8),在实际应用中,方向数一般随着尺度增大而 增多。相比临界采样小波方案,LP分解在高维情况下每层仅产生一个带通图像,避免了扰频现象(因为LP滤波器组仅对低通图像进行了下采样),因此 Contourlet变换能有效地应用在图像增强领域。

 

 

 

 

新小波Wedgelet(楔波)--又一个有意思的东西

新年将至。祝各位思友学习、工作顺利,阖家幸福!最近一段时间,实在是忙于自身专业电磁场的研究,无暇关心太多小波进展。唯一做的工作就是用Visual C++开发了简单的楔波程序。特写文章一篇,粗略谈谈体会,以便大家相互讨论,共同进步。

1。小波的末路
千万别被此吓倒。因为当我看到这个小波广告牌的时候,也有些晕。实际上它刻画的是小波在二维图像处理中的致命伤。图象处理的要素被大师概括为:局部性,多分辨率,严格采样,方向性,各相异性(anisotropy)。关于前三者小波无疑是优秀的,但后两者就略显不足了。小波是点奇异的或是灰度奇异的,所以在一维信号处理中它绝对可以称得上是:powerful tool。但在二维图像处理中,小波对于图像几何特性的刻画就不那么令人振奋了。例如,一张黑色背景上面的白色实心圆,标准的cartoon PIC。(这里请注意悲剧的始作俑者:光滑的圆环边界。)如采用小波作压缩的话,你会发现必须采用多层小波分解,并且在明暗交接的边缘处很多高频分量的幅度是无法忽略或容忍的。回想起在图像处理中,小波也只有水平、垂直、对角线、低频四个方向信息,这也是远远不够的。数学上,对于光滑的二维C^2曲线(contour),取最明显的N个小波系数逼近,它的收敛是N^(-1)而不是N^(-2)。所以,我们需要找到更多的反映图像光滑边界或边缘信息,并且找到反映图像多方向性信息的新小波。

2。两个方向
时域和频域永远是那么奇妙。Idea永远来源于这两端。在频域,一场在频谱上方向性正交分割的游戏开始了。 ridgelet->curvelet->contourlet,我个人喜欢最后的。因为它是离散化的东西,更重要的是它告诉我们一个快被人 遗忘的名字--方向性滤波器。于是fan filter,multirate system,polyphase domain,等的一切东西开始发热。包括完美滤波器的构造,广义的PR条件,梅花5点采样,二维提升,这些也给很多人造成了最大的麻烦--代码。于是, 大家开始下载大师们提供的toolbox,这点无可厚非,只要是目的纯良。我个人仍然是桀骜不驯,从不喜欢拿来主义。但对于这个方向的难度,也深知不易, 所以也就稍稍回避,有时间再战不迟,毕竟我的博士论文与小波毫无关系。在这时,另外一种新的时域基―Wedgelet,开始引起我的重视。熟悉的自适应四 叉树,简单的直线分割,还有些说怪不怪的名字:dyadic square,rate-distortion (R-D) problem。毕竟我的专业不是图像处理。但觉得它的难度还行,核心程序估计不会超过3000行左右,也就开始新的挑战。

3。MATLAB V.S. Visual C++
这是至关重要的,想做Wedgelet的同学,记住C++是最好的选择。Why? 数据结构。C++的精髓实质上也就是数据结构。树这个东西,一定要用Link或Stack实现它。(但.net好像有了这个结构。)还有一个原因,速度。不怕告诉大家,在我初期写这个程序的时候,运行的时间是可怕的。但最终我优化后,也就控制在20秒左右了。

4。Wedgelet新基
什么是Wedgelet?说白了,就是在一个图像子块(dyadic square)画条线段,把它分成两个楔块,每一个楔块用唯一的灰度值表示。线的位置,两个灰度值,就近似刻画了这个子块的性质。

5。灰度的确定
我们把问题分开。假设线固定,我们怎样找出最好的灰度,让它能和子块最接近呢?大家都知道数学上是最小二乘拟和;物理上这个灰度其实就是那个被分割而成的楔块包含的所有像素的平均灰度值。

6。线段的噩梦
怎样能找到最佳的线段。每个人都知道穷举。但怎么穷举?如果盲目的对整个图像穷举,我们考虑到任何n*n大小的子块或划分,那它的工作量实际上是O(n^4)。所以,谁也不会傻到这样。

7。问题开始
任何东西,有得有失。我们把整个图像当作分解对象,我们会找到一条最优的长长的线段,把图像分成两块,同时找到最优的灰度。我们花很少的Bit就可以代表 整个图像了,但后果是美女没有了,开个玩笑。就是说误差太大了,或者是PSNR太大了。但我们如果把图像弄成1*1的小块,连Wedgelet分解都不需 要(每个子块就一个灰度),还没有误差,但谁如果这样想,不就什么也没干嘛!所以我们要把PSNR和Bit率结合起来看,这就是fidelity vs. complexity 或者rate-distortion (R-D) 问题。写成数学就是A+factor*B问题,A就是误差,B就是Bit率,factor就是惩罚因子。上式就是代价函数。当 factror->0,我们就只考虑误差最小,于是我们得到是整个完美的图像,但是没有进行任何的压缩。当factror->inf,我们只 考虑Bit率,我们最终得到只有一个灰度级的图像,这个灰度级就是这个图像的灰度均值。所以有了factor,一切是可控的。问题就是给定factor, 我们找到上面表达式的最小值。最后再说一句,A我们可以用绝对平方误差表示。B呢?实际上B我们可以用分解的块数表示。这是显然的,因为图像的Bit率是 和块的多少成正比的。

8。解决方案
最优多树字典(multitree dictionary)。这个名词,我不想谈太多。我只谈它的特例,自适应四叉树。把大的子块分成四个小的子块,找到每子块的均值。比较四个小子块的代价 函数之和与大子块的代价函数的大小。如果,前者小,分解进行。否则,分解中止。有人会问,这不就是自适应小波包算法吗?是的,除了代价函数小波包一般是 “熵”外,其他的应该是一模一样的。最终分解的结果可以想象,在图像的平坦区(直流分量多)子块较大,在图像的纹理区(交流分量多)子块较小。

9。线段的解决
噩梦中止。其实穷举的线段应该和子块联系起来,在子块周界上离散化搜索。拿n*n子块而言,我们有4*n个离散的周界点。因此,穷举的复杂度 O(n*n)。也就是说,我们先在整个图像上进行四叉树分解,然后再进行Wedgelet分解。这时,我们仍需判断分解的必要性。即若分解后的两个楔块的 代价函数之和小于对应子块的代价函数,则分解进行。否则保留子块,不采用楔波代表。这里,我还要说一句,我们穷举所有直线的时候,必须判断像素和直线的关 系,也就是说我们必须把属于不同楔块的像素分成两类,来获得每个楔块的均值。这里像素的中心点的位置,是判断的标准。有了直线方程,和每个像素中心点的位 置,不会有人还说不能把像素分成两类了吧。呵呵,是不是有些像神经网络里面最简单的感知器,科学就是如此的相似与奇妙。

10。加速再加速
不要以为,噩梦中止后就不会有麻烦。即使这样,速度仍然慢的让你头晕,乃至痛哭流涕。于是,批处理开始了。换句话说,我们把同样大小的子块看作同一个子 块,我们可以把线段的穷举一次完成,因为同样大小子块的周界有着相同的相对索引,构成它们的像素点也有着相同的相对坐标。所以,所有像素点的分类是一次完 成的。这就是Key Point。

11。最后的话
这里,四叉树是可以扩展的。因为,我们分解图像的时候,可以不是一下分成四块,可以是两块。在横向或纵向的划分中找到最优的分割。如果这种分割,是正好把 图像分成面积相等的两块,就是dyadic tree。如果是任意的话,就是多树字典了。关于编码,大家可以想想,这里我就不说了,但压缩绝对是Wedgelet的一个优势,甚至超过了 JPEG2000。还有,小波域的Wedgelet是更有优势的东西,论文IEEE也出来了,大家可以看看。还有就是自适应的Wedgelet,采用马尔 科夫预测的方法就更是神奇了,我由于专业所限,也就不深入研究了。希望大家,可以写写这个程序,会很有意思的。

你可能感兴趣的:(特征变换(6)小波历史)