基变换和图像压缩

实际应用中经常会碰到从一组基变换到另一组基的情况,例如压缩(compressing),压缩的本质就是基变换,例如对一副512*512的静态图像(still image)进行压缩,图像原本采用的基是标准基,在标准基下每个像素一个灰度值。正因为相邻像素间相互关联,使得对图像压缩变成可能。将图像看成是一个5122长度的向量x,在压缩中常用的一个很好的基向量就是所有元素都为1的向量 ,当整幅图像比较平滑,各处都基本一致(solid image)时,只要这样一个全1的向量基本就能完整给出整张图像的信息,当然通常情况下图像不可能完全一致,很有可能其中混杂了一些其他信号,如噪声等,因此还需要一个可以描述这种情况的基,极端情况下,这个基向量可以设为 ,如果图像中有频繁交替的亮暗变换,则此向量可很好的表示出这种变化,还有一种比较常见的情况是图像一半偏暗,另一半偏亮,因此还需要一组一半1一半-1的基向量 ,上面的这3个基 就是傅里叶基。对于一副512*512的图像,在基变换之前,首先将其分解成一个个8*8的块(8*8比较常用,也可分解成其他大小的块),因为如果一次直接对原图像处理,计算量太大,在原来使用的标准基中,每个8*8的小块里有64个像素,采用64个基向量,则会产生64个系数,也就是图像灰度值,现对每个小块做基变换,比如改用傅里叶基来表示每个小块,这是一组比标准基更好的基,在傅里叶基下得到其对应的系数c,然后就是压缩,设定一个人眼无法看出差别的阈值,适当扔掉比阈值小的系数,一般情况下,全1向量的系数会比较大,正负1频繁交替的向量在平滑信号中系数会比较小,因为频繁交替的向量代表的是高频,例如噪音或抖动等,全1向量是低频信号,代表频率为0,用经过阈值化的傅里叶基下的系数来重构信号,信号等于这些系数乘上各自对应的基向量,由于进行了基变换,因此求和项不再是标准基下的64项,而是有可能只有两三项,假设有三项,从64减到3,则压缩比是21比1。

除了傅里叶基,小波基也是实际应用中常用的基向量。

基变换和图像压缩_第1张图片

上面这是R8空间中的8个基向量,也称小波(wavelets),当然这一组是较简单的小波,还可以有更精密的选择。假设现有8个连续像素值组成的向量P= ,这些像素值是标准基的系数,现将其用上述的8个小波表示,即P=c1w1+…+c8w8,用矩阵表示就是基变换和图像压缩_第2张图片 ,前面由小波组成的矩阵称为小波矩阵W,进行基变换就是求取小波对应的系数c,从上面的方程P=Wc中可得系数为c=W-1P,从这里可以看出什么样的基才能称为性质好:

1、性质好的基不仅本身计算速度快,而且能快速求逆,并且其逆参与计算的速度也快,性质好的基首先要计算快,小波矩阵W很容易求逆,因为组成这个矩阵的8个基向量之间是相互正交的,虽然不是标准正交,但标准化只是除以一个系数即可,如果列向量标准正交,那么矩阵的逆等于其转置,所以小波基通过了上面提出的“3快“要求。

2:性质好的基要具有良好的压缩性。如果压缩采用标准基,想扔掉90%的信息量,也就是说压缩比10:1,那就是扔掉了大量的像素值,再还原时图像就会变黑,但如果基性质好,像小波基或傅里叶基,如果扔掉几个基对应的系数,扔掉的也只是很少的信息量,因此这些基具有良好的压缩性,因此总结一下基向量的性质好主要体现在2点:1、必须计算快2、少量基向量就能接近信号,就能够重现图像。 

以上是基变换对向量坐标的影响,已知在标准系下的向量x,将其转换成新基下的向量c,则两者满足关系x=Wc,其中矩阵W是新基向量组成的矩阵,接下来分析一下基变换对变换矩阵的影响。假设某线性变换T,其在原基中对应的变换矩阵为A,在新基中对应的变换矩阵为B,那么可得到A和B是相似的,这里不给出证明,只给出结论。因此当发生基变换后,一是向量坐标会发生改变,x=Wc描述了向量新旧坐标间的关系;二是变换矩阵发生改变,B=M-1AM描述了新旧变换矩阵之间的关系。

你可能感兴趣的:(基变换)