图像缩放算法

上周小胖突然打电话来要我帮忙找找图片缩放的算法,上网查了查,一般采用插值法,有如下几种插值算法:
 
最邻近插值(近邻取样法):
  最临近插值的的思想很简单。对于通过反向变换得到的的一个浮点坐标,对其进行简单的取整,得到一个整数型坐标,这个整数型坐标对应的像素值就是目的像素的像素值,也就是说,取浮点坐标最邻近的左上角点(对于DIB是右上角,因为它的扫描行是逆序存储的)对应的像素值。可见,最邻近插值简单且直观,但得到的图像质量不高。

 

双线性内插值:
  对于一个目的像素,设置坐标通过反向变换得到的浮点坐标为(i+u,j+v),其中i、j均为非负整数,u、v为[0,1)区间的浮点数,则这个像素得值 f(i+u,j+v) 可由原图像中坐标为 (i,j)、(i+1,j)、(i,j+1)、(i+1,j+1)所对应的周围四个像素的值决定,即:

    f(i+u,j+v) = (1-u)(1-v)f(i,j) + (1-u)vf(i,j+1) + u(1-v)f(i+1,j) + uvf(i+1,j+1)

其中f(i,j)表示源图像(i,j)处的的像素值,以此类推
  这就是双线性内插值法。双线性内插值法计算量大,但缩放后图像质量高,不会出现像素值不连续的的情况。由于双线性插值具有低通滤波器的性质,使高频分量受损,所以可能会使图像轮廓在一定程度上变得模糊

 

  三次卷积法能够克服以上两种算法的不足,计算精度高,但计算量大,他考虑一个浮点坐标(i+u,j+v)周围的16个邻点,目的像素值f(i+u,j+v)可由如下插值公式得到:

    f(i+u,j+v) = [A] * [B] * [C]

[A]=[ S(u + 1)  S(u + 0)  S(u - 1)  S(u - 2) ]

  ┏ f(i-1, j-1)  f(i-1, j+0)  f(i-1, j+1)  f(i-1, j+2) ┓
[B]=┃ f(i+0, j-1)  f(i+0, j+0)  f(i+0, j+1)  f(i+0, j+2) ┃
  ┃ f(i+1, j-1)  f(i+1, j+0)  f(i+1, j+1)  f(i+1, j+2) ┃
  ┗ f(i+2, j-1)  f(i+2, j+0)  f(i+2, j+1)  f(i+2, j+2) ┛

  ┏ S(v + 1) ┓
[C]=┃ S(v + 0) ┃
  ┃ S(v - 1) ┃
  ┗ S(v - 2) ┛

   ┏ 1-2*Abs(x)^2+Abs(x)^3           , 0<=Abs(x)<1
S(x)={ 4-8*Abs(x)+5*Abs(x)^2-Abs(x)^3  , 1<=Abs(x)<2
   ┗ 0                               , Abs(x)>=2
S(x)是对 Sin(x*Pi)/x 的逼近(Pi是圆周率——π)

 

最邻近插值(近邻取样法)、双线性内插值、三次卷积法 等插值算法对于旋转变换、错切变换、一般线性变换 和 非线性变换 都适用。

补充:
一、对于24位DIB,需要分别对RGB分量进行处理;
二、对于f(x,y)中没有对应值的坐标,应该用最邻近坐标的值(比如f(-1,-1)用f(0,0)的值)。

不好意思上面算法是kiang来的,不过我还是自己按照以上算法写了一个程序,实现了双线形插值和三次卷积法,从效果来看,的确三次卷积法比线形插值效果清晰,但是计算量相比线形插值来讲要大得多,800*600图片放大三倍用线形插值只需10来秒,而三次卷积则需要1分多钟。不过程序没有作专门的优化,效率应该还有提高的空间。

有一个问题是,在选取特定的缩放比例和特定的图片大小时(如800*600,缩放比例1.2,1.4...),缩放后的图片会出现错位,调查发现是由于bmp图片要求每行必须是4字节对齐的,如果不足需要填0补齐,由于在做的时候没有考虑这个问题,所以在特定的缩放比例下由于未能做到对齐而使得图片产生错位。

你可能感兴趣的:(图像缩放算法)