housisong

图形图像处理－之－任意角度的高质量的快速的图像旋转中篇高质量的旋转

图形图像处理－之－任意角度的高质量的快速的图像旋转中篇高质量的旋转
[email protected] 2007.06.26

(2009.03.09 可以到这里下载旋转算法的完整的可以编译的项目源代码: http://blog.csdn.net/housisong/archive/2009/03/09/3970925.aspx )

(2007.09.14 修正三次卷积的MMX版本中表的精度太低(7bit),造成卷积结果误差较大的问题,该版本提高了插值质量,并且速度加快约15-20%)

tag:图像旋转,任意角度,图像缩放,速度优化,定点数优化,近邻取样插值,二次线性插值,
三次卷积插值,MipMap链,三次线性插值,MMX/SSE优化,CPU缓存优化,AlphaBlend,颜色混合,并行

摘要:首先给出一个基本的图像旋转算法，然后一步一步的优化其速度和旋转质量,打破不能软件旋转的神话!

任意角度的高质量的快速的图像旋转全文分为:
     上篇纯软件的任意角度的快速旋转
     中篇高质量的旋转
     下篇补充话题(完整AlphaBlend旋转、旋转函数并行化、针对大图片的预读缓冲区优化)

正文：
为了便于讨论，这里只处理32bit的ARGB颜色；
代码使用C++;涉及到汇编优化的时候假定为x86平台;使用的编译器为vc2005;
为了代码的可读性,没有加入异常处理代码;
测试使用的CPU为AMD64x2 4200+(2.37G),测试时使用的单线程执行;
(一些基础代码和插值原理的详细说明参见作者的《图形图像处理－之－高质量的快速的图像缩放》系列文章
旋转原理和基础参考《图形图像处理－之－任意角度的高质量的快速的图像旋转上篇纯软件的任意角度的快速旋转》)

速度测试说明:
只测试内存数据到内存数据的缩放
测试图片都是800*600旋转到1004*1004，测试成绩取各个旋转角度的平均速度值; fps表示每秒钟的帧数,值越大表示函数越快

A:一些颜色和图片的数据定义:

#define asm __asm

typedef unsigned char TUInt8; // [0..255]
struct TARGB32      //32 bit color
{
    TUInt8  b,g,r,a;          //a is alpha
};

struct TPicRegion  //一块颜色数据区的描述，便于参数传递
{
    TARGB32*    pdata;         //颜色数据首地址
    long        byte_width;    // 一行数据的物理宽度(字节宽度)；
                //abs(byte_width)有可能大于等于width*sizeof(TARGB32);
    long        width;         //像素宽度
    long        height;        //像素高度
};

  inline TARGB32& Pixels(TARGB32* pcolor,const long byte_width,const long x,const long y)
  {
    return ( (TARGB32*)((TUInt8*)pcolor+byte_width* y) )[x];
  }

//那么访问一个点的函数可以写为：
inline TARGB32& Pixels(const TPicRegion& pic,const long x,const long y)
{
    return Pixels(pic.pdata,pic.byte_width,x,y);
}
//判断一个点是否在图片中
inline bool PixelsIsInPic(const TPicRegion& pic,const long x,const long y)
{
    return ( (x>=0)&&(x<pic.width) && (y>=0)&&(y< pic.height) );
}

//访问一个点的函数，(x,y)坐标可能超出图片边界； //边界处理模式:边界饱和
inline TARGB32& Pixels_Bound(const TPicRegion& pic,long x,long y)
{
    //assert((pic.width>0)&&(pic.height>0));
    if (x<0) x=0; else if (x>=pic.width ) x=pic.width -1 ;
    if (y<0) y=0; else if (y>=pic.height) y=pic.height-1 ;
    return Pixels(pic,x,y);
}

inline TARGB32& Pixels_Bound(const TPicRegion& pic,long x,long y,bool& IsInPic)
{
    //assert((pic.width>0)&&(pic.height>0));
    IsInPic=true ;
    if (x<0) {x=0; IsInPic=false; } else if (x>=pic.width ) {x=pic.width -1; IsInPic=false ; }
    if (y<0) {y=0; IsInPic=false; } else if (y>=pic.height) {y=pic.height-1; IsInPic=false ; }
    return Pixels(pic,x,y);
}

B:实现二次线性插值的旋转

(插值原理参见我的blog文章《图形图像处理－之－高质量的快速的图像缩放中篇二次线性插值和三次卷积插值》)

a.首先改写用于边界扫描的类TRotaryClipData；在图片边缘插值的时候，插值的颜色数据可能
部分在图片外，部分颜色数据在图片内,所以TRotaryClipData需要同时找出“插值边界以外”、
“插值边界”、“插值边界以内”
扫描线图示: 外 | 边界 | 内 | 边界 | 外

struct TRotaryClipData{
public :
    long src_width;
    long src_height;
    long dst_width;
    long dst_height;
    long Ax_16;
    long Ay_16;
    long Bx_16;
    long By_16;
    long Cx_16;
    long Cy_16;
    long border_width;//插值边界宽度
private :
    long cur_dst_up_x0;
    long cur_dst_up_x1;
    long cur_dst_down_x0;
    long cur_dst_down_x1;
    inline bool is_border_src(long src_x_16,long src_y_16)
    {
         return ( ( (src_x_16>=(-(border_width<<16)))&&((src_x_16>>16)<(src_width + border_width)) )
               && ( (src_y_16>=(-(border_width<<16)))&&((src_y_16>>16)<(src_height+ border_width)) ) );
    }
    inline bool is_in_src(long src_x_16,long src_y_16)
    {
         return ( ( (src_x_16>=(border_width<<16))&&((src_x_16>>16)<(src_width- border_width) ) )
               && ( (src_y_16>=(border_width<<16))&&((src_y_16>>16)<(src_height- border_width)) ) );
    }
    void find_begin_in(long dst_y,long& out_dst_x,long& src_x_16,long& src_y_16)
    {
        src_x_16-= Ax_16;
        src_y_16-= Ay_16;
        while (is_border_src(src_x_16,src_y_16))
        {
            -- out_dst_x;
            src_x_16-= Ax_16;
            src_y_16-= Ay_16;
        }
        src_x_16+= Ax_16;
        src_y_16+= Ay_16;
    }
    bool find_begin(long dst_y,long& out_dst_x0,long dst_x1)
    {
        long test_dst_x0=out_dst_x0-1 ;
        long src_x_16=Ax_16*test_dst_x0 + Bx_16*dst_y + Cx_16;
        long src_y_16=Ay_16*test_dst_x0 + By_16*dst_y + Cy_16;
        for (long i=test_dst_x0;i<=dst_x1;++ i)
        {
            if (is_border_src(src_x_16,src_y_16))
            {
                out_dst_x0= i;
                if (i== test_dst_x0)
                    find_begin_in(dst_y,out_dst_x0,src_x_16,src_y_16);
                if (out_dst_x0<0 )
                {
                    src_x_16-=(Ax_16* out_dst_x0);
                    src_y_16-=(Ay_16* out_dst_x0);
                }
                out_src_x0_16= src_x_16;
                out_src_y0_16= src_y_16;
                return true ;
            }
            else
            {
                src_x_16 += Ax_16;
                src_y_16+= Ay_16;
            }
        }
        return false ;
    }
    void find_end(long dst_y,long dst_x0,long& out_dst_x1)
    {
        long test_dst_x1= out_dst_x1;
        if (test_dst_x1<dst_x0) test_dst_x1= dst_x0;

        long src_x_16=Ax_16*test_dst_x1 + Bx_16*dst_y + Cx_16;
        long src_y_16=Ay_16*test_dst_x1 + By_16*dst_y + Cy_16;
        if (is_border_src(src_x_16,src_y_16))
        {
            ++ test_dst_x1;
            src_x_16+= Ax_16;
            src_y_16+= Ay_16;
            while (is_border_src(src_x_16,src_y_16))
            {
                ++ test_dst_x1;
                src_x_16+= Ax_16;
                src_y_16+= Ay_16;
            }
            out_dst_x1= test_dst_x1;
        }
        else
        {
            src_x_16 -= Ax_16;
            src_y_16-= Ay_16;
            while (! is_border_src(src_x_16,src_y_16))
            {
                -- test_dst_x1;
                src_x_16-= Ax_16;
                src_y_16-= Ay_16;
            }
            out_dst_x1= test_dst_x1;
        }
    }

    inline void update_out_dst_x_in()
    {
        if ((0==border_width)||(out_dst_x0_boder>= out_dst_x1_boder) )
        {
            out_dst_x0_in= out_dst_x0_boder;
            out_dst_x1_in= out_dst_x1_boder;
        }
        else
        {
             long src_x_16= out_src_x0_16;
            long src_y_16= out_src_y0_16;
            long i= out_dst_x0_boder;
            while (i< out_dst_x1_boder)
            {
                if (is_in_src(src_x_16,src_y_16)) break ;
                src_x_16+= Ax_16;
                src_y_16+= Ay_16;
                ++ i;
            }
            out_dst_x0_in= i;

            src_x_16=out_src_x0_16+(out_dst_x1_boder-out_dst_x0_boder)* Ax_16;
            src_y_16=out_src_y0_16+(out_dst_x1_boder-out_dst_x0_boder)* Ay_16;
            i= out_dst_x1_boder;
            while (i> out_dst_x0_in)
            {
                src_x_16-= Ax_16;
                src_y_16-= Ay_16;
                if (is_in_src(src_x_16,src_y_16)) break ;
                -- i;
            }
            out_dst_x1_in= i;
        }
    }
    inline void update_out_dst_up_x()
    {
        if (cur_dst_up_x0<0 )
            out_dst_x0_boder=0 ;
        else
            out_dst_x0_boder = cur_dst_up_x0;
        if (cur_dst_up_x1>= dst_width)
            out_dst_x1_boder= dst_width;
        else
            out_dst_x1_boder = cur_dst_up_x1;
        update_out_dst_x_in();
    }
    inline void update_out_dst_down_x()
    {
        if (cur_dst_down_x0<0 )
            out_dst_x0_boder=0 ;
        else
            out_dst_x0_boder = cur_dst_down_x0;
        if (cur_dst_down_x1>= dst_width)
            out_dst_x1_boder= dst_width;
        else
            out_dst_x1_boder = cur_dst_down_x1;
        update_out_dst_x_in();
    }

public :
    long out_src_x0_16;
    long out_src_y0_16;

    long out_dst_up_y;
    long out_dst_down_y;

    long out_dst_x0_boder;
    long out_dst_x0_in;
    long out_dst_x1_in;
    long out_dst_x1_boder;

public :
    bool inti_clip(double move_x,double move_y,unsigned long aborder_width)
    {
        border_width= aborder_width;

        //计算src中心点映射到dst后的坐标
        out_dst_down_y=(long)(src_height*0.5+ move_y);
        cur_dst_down_x0=(long)(src_width*0.5+ move_x);
        cur_dst_down_x1= cur_dst_down_x0;
        //得到初始扫描线
        if (find_begin(out_dst_down_y,cur_dst_down_x0,cur_dst_down_x1))
            find_end(out_dst_down_y,cur_dst_down_x0,cur_dst_down_x1);
        out_dst_up_y= out_dst_down_y;
        cur_dst_up_x0= cur_dst_down_x0;
        cur_dst_up_x1= cur_dst_down_x1;
        update_out_dst_up_x();
        return (cur_dst_down_x0< cur_dst_down_x1);
    }
    bool next_clip_line_down()
    {
        ++ out_dst_down_y;
        if (!find_begin(out_dst_down_y,cur_dst_down_x0,cur_dst_down_x1)) return false ;
        find_end(out_dst_down_y,cur_dst_down_x0,cur_dst_down_x1);
        update_out_dst_down_x();
        return (cur_dst_down_x0< cur_dst_down_x1);
    }
    bool next_clip_line_up()
    {
        -- out_dst_up_y;
        if (!find_begin(out_dst_up_y,cur_dst_up_x0,cur_dst_up_x1)) return false ;
        find_end(out_dst_up_y,cur_dst_up_x0,cur_dst_up_x1);
        update_out_dst_up_x();
        return (cur_dst_up_x0< cur_dst_up_x1);
    }
};

b. 边界插值的特殊处理
      对于“插值边界以外”很简单，不用处理直接跳过插值；
      对于“插值边界以内”，也比较容易处理，直接调用快速的差值算法就可以了，不用担心内存访问问题；
        插值实现：
（从《图形图像处理－之－高质量的快速的图像缩放中篇二次线性插值和三次卷积插值》文章来的，后面不再说明）

    inline void BilInear_Fast(const TPicRegion& pic,const long x_16,const long y_16,TARGB32* result)
    {
        TARGB32* PColor0=&Pixels(pic,x_16>>16,y_16>>16 );
        TARGB32* PColor1=(TARGB32*)((TUInt8*)PColor0+ pic.byte_width);
        unsigned long u_8=(unsigned char)(x_16>>8 );
        unsigned long v_8=(unsigned char)(y_16>>8 );
        unsigned long pm3_8=(u_8*v_8)>>8 ;
        unsigned long pm2_8=u_8- pm3_8;
        unsigned long pm1_8=v_8- pm3_8;
        unsigned long pm0_8=256-pm1_8-pm2_8- pm3_8;

        unsigned long Color=*(unsigned long* )(PColor0);
        unsigned long BR=(Color & 0x00FF00FF)* pm0_8;
        unsigned long GA=((Color & 0xFF00FF00)>>8)* pm0_8;
                      Color=((unsigned long*)(PColor0))[1 ];
                      GA+=((Color & 0xFF00FF00)>>8)* pm2_8;
                      BR+=(Color & 0x00FF00FF)* pm2_8;
                      Color=*(unsigned long* )(PColor1);
                      GA+=((Color & 0xFF00FF00)>>8)* pm1_8;
                      BR+=(Color & 0x00FF00FF)* pm1_8;
                      Color=((unsigned long*)(PColor1))[1 ];
                      GA+=((Color & 0xFF00FF00)>>8)* pm3_8;
                      BR+=(Color & 0x00FF00FF)* pm3_8;

        *(unsigned long*)result=(GA & 0xFF00FF00)|((BR & 0xFF00FF00)>>8 );
    }

      对于“插值边界”，就需要特殊处理了，很多插值旋转的实现可能都在这里打了折扣；要想完美的解决
   这块区域，可以引入AlphaBlend(带Alpha通道的颜色混合) ；

      其实AlphaBlend的原理也很简单，就是按不同的比例混合两种颜色:
         new_color=dst_color*(1-alpha)+src_color*alpha;
      对于ARGB32bit颜色，需要用该公式分别处理4个颜色通道，并假设Alpha为[0..255]的整数，那么完整的实现函数为:

    inline TARGB32 AlphaBlend(TARGB32 dst,TARGB32 src)
    {
        // AlphaBlend颜色混合公式(对其中的每个颜色分量分别处理)：
        // new_color=(dst_color*(255-src_color.alpha)+src_color*src_color.alpha)/255

        //提示：除法指令是很慢的操作，但vc2005可以把x/255编译为完全等价的"(x*M)>>N"类似的快速计算代码；
        unsigned long a= src.a;
        // if (a==0) return dst;
        //else if (a==255) return src;
        unsigned long ra=255- a;
        unsigned long result_b=(dst.b*ra+src.b*a)/255 ;
        unsigned long result_g=(dst.g*ra+src.g*a)/255 ;
        unsigned long result_r=(dst.r*ra+src.r*a)/255 ;
        unsigned long result_a=(dst.a*ra+a*a)/255 ;
        unsigned long result=(result_b) | (result_g<<8) | (result_r<<16) | (result_a<<24 );
        return *(TARGB32*)& result;
    }

优化AlphaBlend，颜色处理中，也可以这样近似计算: x/255 => x>>8 ，所以有:

    inline TARGB32 AlphaBlend(TARGB32 dst,TARGB32 src)
    {
        unsigned long a= src.a;
        unsigned long ra=255- a;
        unsigned long result_b=(dst.b*ra+src.b*a)>>8 ;
        unsigned long result_g=(dst.g*ra+src.g*a)>>8 ;
        unsigned long result_r=(dst.r*ra+src.r*a)>>8 ;
        unsigned long result_a=(dst.a*ra+a*a)>>8 ;
        unsigned long result=(result_b) | (result_g<<8) | (result_r<<16) | (result_a<<24 );
        return *(TARGB32*)& result;
    }

(dst*(255-alpha)+src*alpha)>>8 可以近似为:(dst*(256-alpha)+src*alpha)>>8
即 (dst<<8+(src-dst)*alpha)>>8 从而用一个移位代替一个乘法 (*256会被优化为移位)

    inline TARGB32 AlphaBlend(TARGB32 dst,TARGB32 src)
    {
        long a= src.a;
        unsigned long result_b=((unsigned long)(((long)dst.b)*256+((long)src.b-(long)dst.b)*a))>>8 ;
        unsigned long result_g=((unsigned long)(((long)dst.g)*256+((long)src.g-(long)dst.g)*a))>>8 ;
        unsigned long result_r=((unsigned long)(((long)dst.r)*256+((long)src.r-(long)dst.r)*a))>>8 ;
        unsigned long result_a=((unsigned long)(((long)dst.a)*256+((long)a-(long)dst.a)*a))>>8 ;
        unsigned long result=(result_b) | (result_g<<8) | (result_r<<16) | (result_a<<24 );
        return *(TARGB32*)& result;
    }

继续优化，同时运算两路颜色分量的AlphaBlend实现:

    inline TARGB32 AlphaBlend(TARGB32 dst,TARGB32 src)
    {
        unsigned long Src_ARGB=*(unsigned long*)& src;
        unsigned long Dst_ARGB=*(unsigned long*)& dst;
        unsigned long a=Src_ARGB>>24 ;
        unsigned long ra=255- a;
        unsigned long result_RB=((Dst_ARGB & 0x00FF00FF)*ra + (Src_ARGB & 0x00FF00FF)* a);
        unsigned long result_AG=(((Dst_ARGB & 0xFF00FF00)>>8)*ra + ((Src_ARGB & 0xFF00FF00)>>8)* a);
        unsigned long result=((result_RB & 0xFF00FF00)>>8) | (result_AG & 0xFF00FF00 );
        return *(TARGB32*)& result;
    }

    回到我们的主线：完美解决“旋转插值边界”
    怎么利用AlphaBlend呢？我们可以在处理边界的时候，对于颜色数据在图片内的颜色，把Alpha通道分量设置为255，
在图片外的颜色数据(使用Pixels_Bound会返回最接近的一个内部颜色）的Alpha通道分量设置为0；
    这个任务就交给边界插值函数了:

    inline void BilInear_Border(const TPicRegion& pic,const long x_16,const long y_16,TARGB32* result)
    {
        unsigned long x0=(x_16>>16 );
        unsigned long y0=(y_16>>16 );

        TARGB32 pixel[4 ];
        bool IsInPic;
        pixel[0]= Pixels_Bound(pic,x0,y0,IsInPic);
        if (!IsInPic) pixel[0].a=0; else pixel[0].a=255 ;
        pixel[2]=Pixels_Bound(pic,x0,y0+1 ,IsInPic);
        if (!IsInPic) pixel[2].a=0; else pixel[2].a=255 ;
        pixel[1]=Pixels_Bound(pic,x0+1 ,y0,IsInPic);
        if (!IsInPic) pixel[1].a=0; else pixel[1].a=255 ;
        pixel[3]=Pixels_Bound(pic,x0+1,y0+1 ,IsInPic);
        if (!IsInPic) pixel[3].a=0; else pixel[3].a=255 ;

        TPicRegion npic;
        npic.pdata     =&pixel[0 ];
        npic.byte_width=2*sizeof (TARGB32);
        // npic.width     =2;
        //npic.height    =2;
        BilInear_Fast(npic,(unsigned short)x_16,(unsigned short )y_16,result);
    }

    返回的颜色中的Alpha的值就代表了颜色的有效强度(一般介于0..255之间)；
    那么，对边界上的插值就可以用类似这样的代码处理好了:
        TARGB32 tmp_color;
        BilInear_Border(SrcPic,srcx0_16,srcy0_16,&tmp_color);
        pDstLine[x]=AlphaBlend(pDstLine[x],tmp_color);

c. OK,给出完整的函数:

void PicRotary_BilInear_CopyLine(TARGB32* pDstLine,long dst_border_x0,long dst_in_x0,long dst_in_x1,long dst_border_x1,
                        const TPicRegion& SrcPic,long srcx0_16,long srcy0_16,long Ax_16,long Ay_16)
{
    long x;
    for (x=dst_border_x0;x<dst_in_x0;++ x)
    {
        TARGB32 src_color;
        BilInear_Border(SrcPic,srcx0_16,srcy0_16,& src_color);
        pDstLine[x]= AlphaBlend(pDstLine[x],src_color);
        srcx0_16+= Ax_16;
        srcy0_16+= Ay_16;
    }
    for (x=dst_in_x0;x<dst_in_x1;++ x)
    {
        BilInear_Fast(SrcPic,srcx0_16,srcy0_16,& pDstLine[x]);
        srcx0_16+= Ax_16;
        srcy0_16+= Ay_16;
    }
    for (x=dst_in_x1;x<dst_border_x1;++ x)
    {
        TARGB32 src_color;
        BilInear_Border(SrcPic,srcx0_16,srcy0_16,& src_color);
        pDstLine[x]= AlphaBlend(pDstLine[x],src_color);
        srcx0_16+= Ax_16;
        srcy0_16+= Ay_16;
    }
}

void PicRotaryBilInear(const TPicRegion& Dst,const TPicRegion& Src,double RotaryAngle,double ZoomX,double ZoomY,double move_x,double move_y)
{
    if ( (fabs(ZoomX*Src.width)<1.0e-4) || (fabs(ZoomY*Src.height)<1.0e-4) ) return; //太小的缩放比例认为已经不可见
    double tmprZoomXY=1.0/(ZoomX* ZoomY);
    double rZoomX=tmprZoomXY* ZoomY;
    double rZoomY=tmprZoomXY* ZoomX;
    double sinA,cosA;
    SinCos(RotaryAngle,sinA,cosA);
    long Ax_16=(long)(rZoomX*cosA*(1<<16 ));
    long Ay_16=(long)(rZoomX*sinA*(1<<16 ));
    long Bx_16=(long)(-rZoomY*sinA*(1<<16 ));
    long By_16=(long)(rZoomY*cosA*(1<<16 ));
    double rx0=Src.width*0.5;  //(rx0,ry0)为旋转中心
    double ry0=Src.height*0.5 ;
    long Cx_16=(long)((-(rx0+move_x)*rZoomX*cosA+(ry0+move_y)*rZoomY*sinA+rx0)*(1<<16 ));
    long Cy_16=(long)((-(rx0+move_x)*rZoomX*sinA-(ry0+move_y)*rZoomY*cosA+ry0)*(1<<16 ));

    TRotaryClipData rcData;
    rcData.Ax_16= Ax_16;
    rcData.Bx_16= Bx_16;
    rcData.Cx_16= Cx_16;
    rcData.Ay_16= Ay_16;
    rcData.By_16= By_16;
    rcData.Cy_16= Cy_16;
    rcData.dst_width= Dst.width;
    rcData.dst_height= Dst.height;
    rcData.src_width= Src.width;
    rcData.src_height= Src.height;
    if (!rcData.inti_clip(move_x,move_y,1)) return ;

    TARGB32* pDstLine= Dst.pdata;
    ((TUInt8*&)pDstLine)+=(Dst.byte_width* rcData.out_dst_down_y);
    while (true) //to down
    {
        long y= rcData.out_dst_down_y;
        if (y>=Dst.height) break ;
        if (y>=0 )
        {
            PicRotary_BilInear_CopyLine(pDstLine,rcData.out_dst_x0_boder,rcData.out_dst_x0_in,
                rcData.out_dst_x1_in,rcData.out_dst_x1_boder,Src,rcData.out_src_x0_16,rcData.out_src_y0_16,Ax_16,Ay_16);
        }
        if (!rcData.next_clip_line_down()) break ;
        ((TUInt8*&)pDstLine)+= Dst.byte_width;
    }

    pDstLine= Dst.pdata;
    ((TUInt8*&)pDstLine)+=(Dst.byte_width* rcData.out_dst_up_y);
    while (rcData.next_clip_line_up()) //to up
    {
        long y= rcData.out_dst_up_y;
        if (y<0) break ;
        ((TUInt8*&)pDstLine)-= Dst.byte_width;
        if (y< Dst.height)
        {
            PicRotary_BilInear_CopyLine(pDstLine,rcData.out_dst_x0_boder,rcData.out_dst_x0_in,
                rcData.out_dst_x1_in,rcData.out_dst_x1_boder,Src,rcData.out_src_x0_16,rcData.out_src_y0_16,Ax_16,Ay_16);
        }
    }
}

//注：测试图片都是800*600的图片旋转到1004*1004的图片中心测试成绩取各个旋转角度的平均速度值
////////////////////////////////////////////////////////////////////////////////
//速度测试:
//==============================================================================
// PicRotaryBilInear 68.9 fps
////////////////////////////////////////////////////////////////////////////////

二次线性插值旋转结果图示：

30度 60度 90度

120度 150度 180度

210度 240度 270度

300度 330度 360度

C:用MMX指令来改进二次线性插值的旋转

    inline TARGB32 AlphaBlend_MMX(TARGB32 dst,TARGB32 src)
    {
        unsigned long result;
        asm
        {
            PXOR      MM7,MM7
            MOVD      MM0,src
            MOVD      MM2,dst
            PUNPCKLBW MM0,MM7
            PUNPCKLBW MM2,MM7
            MOVQ      MM1,MM0
            PUNPCKHWD MM1,MM1
            PSUBW     MM0,MM2
            PUNPCKHDQ MM1,MM1
            PSLLW     MM2,8
            PMULLW    MM0,MM1
            PADDW     MM2,MM0
            PSRLW     MM2, 8
            PACKUSWB  MM2,MM7
            MOVD      result,MM2
        }
         return *(TARGB32*)& result;
    }

    void __declspec(naked) __stdcall BilInear_Fast_MMX(const TPicRegion& pic,const long x_16,const long y_16,TARGB32* result)
    {
        asm
        {
              mov       edx,[esp+12] //y_16
              mov       eax,[esp+8]  //x_16
              PXOR      mm7,mm7
              shl       edx,16
              shl       eax, 16
              shr       edx, 24 //edx=v_8
              shr       eax,24 //eax=u_8
              MOVD      MM6,edx
              MOVD      MM5,eax
              mov       ecx,[esp+4]//pic
              mov       edx,[esp+12]//y_16
              mov       eax,[ecx]TPicRegion.byte_width
              sar       edx,16
              imul      edx,eax
              add       edx,[ecx]TPicRegion.pdata
              add       eax,edx

              mov       ecx,[esp +8] //x_16
              sar       ecx,16     //srcx_16>>16

              MOVD         MM2,dword ptr [eax +ecx*4]  //MM2=Color1
              MOVD         MM0,dword ptr [eax+ecx*4+4]//MM0=Color3
              PUNPCKLWD    MM5,MM5
              PUNPCKLWD    MM6,MM6
              MOVD         MM3,dword ptr [edx+ecx*4]  //MM3=Color0
              MOVD         MM1,dword ptr [edx+ecx*4+4]//MM1=Color2
              PUNPCKLDQ    MM5,MM5 //mm5=u_8
              PUNPCKLBW    MM0,MM7
              PUNPCKLBW    MM1,MM7
              PUNPCKLBW    MM2,MM7
              PUNPCKLBW    MM3,MM7
              PSUBw        MM0,MM2
              PSUBw        MM1,MM3
              PSLLw        MM2,8
              PSLLw        MM3, 8
              PMULlw       MM0,MM5
              PMULlw       MM1,MM5
              PUNPCKLDQ    MM6,MM6 //mm6=v_8
              PADDw        MM0,MM2
              PADDw        MM1,MM3

              PSRLw        MM0,8
              PSRLw        MM1, 8
              PSUBw        MM0,MM1
              PSLLw        MM1, 8
              PMULlw       MM0,MM6
              mov       eax,[esp +16]//result
              PADDw        MM0,MM1

              PSRLw        MM0,8
              PACKUSwb     MM0,MM7
              movd      [eax],MM0

               //emms
              ret 16
        }
    }

     void BilInear_Border_MMX(const TPicRegion& pic,const long x_16,const long y_16,TARGB32* result)
    {
        unsigned long x0=(x_16>>16 );
        unsigned long y0=(y_16>>16 );

        TARGB32 pixel[4 ];
        bool IsInPic;
        pixel[0]= Pixels_Bound(pic,x0,y0,IsInPic);
        if (!IsInPic) pixel[0].a=0; else pixel[0].a=255 ;
        pixel[2]=Pixels_Bound(pic,x0,y0+1 ,IsInPic);
        if (!IsInPic) pixel[2].a=0; else pixel[2].a=255 ;
        pixel[1]=Pixels_Bound(pic,x0+1 ,y0,IsInPic);
        if (!IsInPic) pixel[1].a=0; else pixel[1].a=255 ;
        pixel[3]=Pixels_Bound(pic,x0+1,y0+1 ,IsInPic);
        if (!IsInPic) pixel[3].a=0; else pixel[3].a=255 ;

        TPicRegion npic;
        npic.pdata     =&pixel[0 ];
        npic.byte_width=2*sizeof (TARGB32);
        // npic.width     =2;
        //npic.height    =2;
        BilInear_Fast_MMX(npic,(unsigned short)x_16,(unsigned short )y_16,result);
    }

void PicRotary_BilInear_CopyLine_MMX(TARGB32* pDstLine,long dst_border_x0,long dst_in_x0,long dst_in_x1,long dst_border_x1,
                        const TPicRegion& SrcPic,long srcx0_16,long srcy0_16,long Ax_16,long Ay_16)
{
    long x;
    for (x=dst_border_x0;x<dst_in_x0;++ x)
    {
        TARGB32 src_color;
        BilInear_Border_MMX(SrcPic,srcx0_16,srcy0_16,& src_color);
        pDstLine[x]= AlphaBlend_MMX(pDstLine[x],src_color);
        srcx0_16+= Ax_16;
        srcy0_16+= Ay_16;
    }
    for (x=dst_in_x0;x<dst_in_x1;++ x)
    {
        BilInear_Fast_MMX(SrcPic,srcx0_16,srcy0_16,& pDstLine[x]);
        srcx0_16+= Ax_16;
        srcy0_16+= Ay_16;
    }
    for (x=dst_in_x1;x<dst_border_x1;++ x)
    {
        TARGB32 src_color;
        BilInear_Border_MMX(SrcPic,srcx0_16,srcy0_16,& src_color);
        pDstLine[x]= AlphaBlend_MMX(pDstLine[x],src_color);
        srcx0_16+= Ax_16;
        srcy0_16+= Ay_16;
    }
    asm  emms
}

void PicRotaryBilInear_MMX(const TPicRegion& Dst,const TPicRegion& Src,double RotaryAngle,double ZoomX,double ZoomY,double move_x,double move_y)
{
    if ( (fabs(ZoomX*Src.width)<1.0e-4) || (fabs(ZoomY*Src.height)<1.0e-4) ) return; //太小的缩放比例认为已经不可见
    double tmprZoomXY=1.0/(ZoomX* ZoomY);
    double rZoomX=tmprZoomXY* ZoomY;
    double rZoomY=tmprZoomXY* ZoomX;
    double sinA,cosA;
    SinCos(RotaryAngle,sinA,cosA);
    long Ax_16=(long)(rZoomX*cosA*(1<<16 ));
    long Ay_16=(long)(rZoomX*sinA*(1<<16 ));
    long Bx_16=(long)(-rZoomY*sinA*(1<<16 ));
    long By_16=(long)(rZoomY*cosA*(1<<16 ));
    double rx0=Src.width*0.5;  //(rx0,ry0)为旋转中心
    double ry0=Src.height*0.5 ;
    long Cx_16=(long)((-(rx0+move_x)*rZoomX*cosA+(ry0+move_y)*rZoomY*sinA+rx0)*(1<<16 ));
    long Cy_16=(long)((-(rx0+move_x)*rZoomX*sinA-(ry0+move_y)*rZoomY*cosA+ry0)*(1<<16 ));

    TRotaryClipData rcData;
    rcData.Ax_16= Ax_16;
    rcData.Bx_16= Bx_16;
    rcData.Cx_16= Cx_16;
    rcData.Ay_16= Ay_16;
    rcData.By_16= By_16;
    rcData.Cy_16= Cy_16;
    rcData.dst_width= Dst.width;
    rcData.dst_height= Dst.height;
    rcData.src_width= Src.width;
    rcData.src_height= Src.height;
    if (!rcData.inti_clip(move_x,move_y,1)) return ;

    TARGB32* pDstLine= Dst.pdata;
    ((TUInt8*&)pDstLine)+=(Dst.byte_width* rcData.out_dst_down_y);
    while (true) //to down
    {
        long y= rcData.out_dst_down_y;
        if (y>=Dst.height) break ;
        if (y>=0 )
        {
            PicRotary_BilInear_CopyLine_MMX(pDstLine,rcData.out_dst_x0_boder,rcData.out_dst_x0_in,
                rcData.out_dst_x1_in,rcData.out_dst_x1_boder,Src,rcData.out_src_x0_16,rcData.out_src_y0_16,Ax_16,Ay_16);
        }
        if (!rcData.next_clip_line_down()) break ;
        ((TUInt8*&)pDstLine)+= Dst.byte_width;
    }

    pDstLine= Dst.pdata;
    ((TUInt8*&)pDstLine)+=(Dst.byte_width* rcData.out_dst_up_y);
    while (rcData.next_clip_line_up()) //to up
    {
        long y= rcData.out_dst_up_y;
        if (y<0) break ;
        ((TUInt8*&)pDstLine)-= Dst.byte_width;
        if (y< Dst.height)
        {
            PicRotary_BilInear_CopyLine_MMX(pDstLine,rcData.out_dst_x0_boder,rcData.out_dst_x0_in,
                rcData.out_dst_x1_in,rcData.out_dst_x1_boder,Src,rcData.out_src_x0_16,rcData.out_src_y0_16,Ax_16,Ay_16);
        }
    }
}

//注：测试图片都是800*600的图片旋转到1004*1004的图片中心测试成绩取各个旋转角度的平均速度值
////////////////////////////////////////////////////////////////////////////////
//速度测试:
//==============================================================================
// PicRotaryBilInear_MMX 100.2 fps
////////////////////////////////////////////////////////////////////////////////

D:三次卷积插值的旋转
(实现就比较简单了，几乎就是拷贝代码，然后稍微改写几个单词:)
（很多代码从《图形图像处理－之－高质量的快速的图像缩放中篇二次线性插值和三次卷积插值》文章来的）

        inline double SinXDivX(double x)
        {
            //该函数计算插值曲线sin(x*PI)/(x*PI)的值 // PI=3.1415926535897932385;
            //下面是它的近似拟合表达式
            const float a = -1; //a还可以取 a=-2,-1,-0.75,-0.5等等，起到调节锐化或模糊程度的作用

             if (x<0) x=-x; //x=abs(x);
            double x2=x* x;
            double x3=x2* x;
            if (x<=1 )
              return (a+2)*x3 - (a+3)*x2 + 1 ;
            else if (x<=2 )
              return a*x3 - (5*a)*x2 + (8*a)*x - (4* a);
            else
               return 0 ;
        }
        inline TUInt8 ColorBound(long Color)
        {
            if (Color<=0 )
                return 0 ;
            else if (Color>=255 )
                return 255 ;
            else
                 return Color;
        }

    static long SinXDivX_Table_8[(2<<8)+1 ];
    class _CAutoInti_SinXDivX_Table {
    private :
        void _Inti_SinXDivX_Table()
        {
            for (long i=0;i<=(2<<8);++ i)
                SinXDivX_Table_8[i]=long(0.5+256*SinXDivX(i*(1.0/(256 ))));
        };
    public :
        _CAutoInti_SinXDivX_Table() { _Inti_SinXDivX_Table(); }
    };
    static _CAutoInti_SinXDivX_Table __tmp_CAutoInti_SinXDivX_Table;

    void ThreeOrder_Fast(const TPicRegion& pic,const long x_16,const long y_16,TARGB32* result)
    {
        long u_8=(unsigned char)((x_16)>>8 );
        long v_8=(unsigned char)((y_16)>>8 );
        const TARGB32* pixel=&Pixels(pic,(x_16>>16)-1,(y_16>>16)-1 );
        long pic_byte_width= pic.byte_width;

        long au_8[4],av_8[4 ];
         //
        au_8[0]=SinXDivX_Table_8[(1<<8)+ u_8];
        au_8[1]= SinXDivX_Table_8[u_8];
        au_8[2]=SinXDivX_Table_8[(1<<8)- u_8];
        au_8[3]=SinXDivX_Table_8[(2<<8)- u_8];
        av_8[0]=SinXDivX_Table_8[(1<<8)+ v_8];
        av_8[1]= SinXDivX_Table_8[v_8];
        av_8[2]=SinXDivX_Table_8[(1<<8)- v_8];
        av_8[3]=SinXDivX_Table_8[(2<<8)- v_8];

        long sR=0,sG=0,sB=0,sA=0 ;
        for (long i=0;i<4;++ i)
        {
            long aA=au_8[0]*pixel[0].a + au_8[1]*pixel[1].a + au_8[2]*pixel[2].a + au_8[3]*pixel[3 ].a;
            long aR=au_8[0]*pixel[0].r + au_8[1]*pixel[1].r + au_8[2]*pixel[2].r + au_8[3]*pixel[3 ].r;
            long aG=au_8[0]*pixel[0].g + au_8[1]*pixel[1].g + au_8[2]*pixel[2].g + au_8[3]*pixel[3 ].g;
            long aB=au_8[0]*pixel[0].b + au_8[1]*pixel[1].b + au_8[2]*pixel[2].b + au_8[3]*pixel[3 ].b;
            sA+=aA* av_8[i];
            sR+=aR* av_8[i];
            sG+=aG* av_8[i];
            sB+=aB* av_8[i];
            ((TUInt8*&)pixel)+= pic_byte_width;
        }

        *(unsigned long*)result=ColorBound(sB>>16) | (ColorBound(sG>>16)<<8) | (ColorBound(sR>>16)<<16)| (ColorBound(sA>>16)<<24 );
    }

    void ThreeOrder_Border(const TPicRegion& pic,const long x_16,const long y_16,TARGB32* result)
    {
        unsigned long x0_sub1=(x_16>>16)-1 ;
        unsigned long y0_sub1=(y_16>>16)-1 ;
        long u_16_add1=((unsigned short)(x_16))+(1<<16 );
        long v_16_add1=((unsigned short)(y_16))+(1<<16 );

        TARGB32 pixel[16 ];
        long i,j;

        for (i=0;i<4;++ i)
        {
            long y=y0_sub1+ i;
            for (j=0;j<4;++ j)
            {
                long x=x0_sub1+ j;
                bool IsInPic;
                pixel[i*4+j]= Pixels_Bound(pic,x,y,IsInPic);
                if (!IsInPic) pixel[i*4+j].a=0; else pixel[i*4+j].a=255 ;
            }
        }

        TPicRegion npic;
        npic.pdata     =&pixel[0 ];
        npic.byte_width=4*sizeof (TARGB32);
        // npic.width     =4;
        //npic.height    =4;
        ThreeOrder_Fast(npic,u_16_add1,v_16_add1,result);
    }

void PicRotary_ThreeOrder_CopyLine(TARGB32* pDstLine,long dst_border_x0,long dst_in_x0,long dst_in_x1,long dst_border_x1,
                        const TPicRegion& SrcPic,long srcx0_16,long srcy0_16,long Ax_16,long Ay_16)
{
    long x;
    for (x=dst_border_x0;x<dst_in_x0;++ x)
    {

        TARGB32 src_color;
        ThreeOrder_Border(SrcPic,srcx0_16,srcy0_16,& src_color);
        pDstLine[x]= AlphaBlend(pDstLine[x],src_color);
        srcx0_16+= Ax_16;
        srcy0_16+= Ay_16;
    }
    for (x=dst_in_x0;x<dst_in_x1;++ x)
    {
        ThreeOrder_Fast(SrcPic,srcx0_16,srcy0_16,& pDstLine[x]);
        srcx0_16+= Ax_16;
        srcy0_16+= Ay_16;
    }
    for (x=dst_in_x1;x<dst_border_x1;++ x)
    {
        TARGB32 src_color;
        ThreeOrder_Border(SrcPic,srcx0_16,srcy0_16,& src_color);
        pDstLine[x]= AlphaBlend(pDstLine[x],src_color);
        srcx0_16+= Ax_16;
        srcy0_16+= Ay_16;
    }
}

void PicRotaryThreeOrder(const TPicRegion& Dst,const TPicRegion& Src,double RotaryAngle,double ZoomX,double ZoomY,double move_x,double move_y)
{
    if ( (fabs(ZoomX*Src.width)<1.0e-4) || (fabs(ZoomY*Src.height)<1.0e-4) ) return; //太小的缩放比例认为已经不可见
    double tmprZoomXY=1.0/(ZoomX* ZoomY);
    double rZoomX=tmprZoomXY* ZoomY;
    double rZoomY=tmprZoomXY* ZoomX;
    double sinA,cosA;
    SinCos(RotaryAngle,sinA,cosA);
    long Ax_16=(long)(rZoomX*cosA*(1<<16 ));
    long Ay_16=(long)(rZoomX*sinA*(1<<16 ));
    long Bx_16=(long)(-rZoomY*sinA*(1<<16 ));
    long By_16=(long)(rZoomY*cosA*(1<<16 ));
    double rx0=Src.width*0.5;  //(rx0,ry0)为旋转中心
    double ry0=Src.height*0.5 ;
    long Cx_16=(long)((-(rx0+move_x)*rZoomX*cosA+(ry0+move_y)*rZoomY*sinA+rx0)*(1<<16 ));
    long Cy_16=(long)((-(rx0+move_x)*rZoomX*sinA-(ry0+move_y)*rZoomY*cosA+ry0)*(1<<16 ));

    TRotaryClipData rcData;
    rcData.Ax_16= Ax_16;
    rcData.Bx_16= Bx_16;
    rcData.Cx_16= Cx_16;
    rcData.Ay_16= Ay_16;
    rcData.By_16= By_16;
    rcData.Cy_16= Cy_16;
    rcData.dst_width= Dst.width;
    rcData.dst_height= Dst.height;
    rcData.src_width= Src.width;
    rcData.src_height= Src.height;
    if (!rcData.inti_clip(move_x,move_y,2)) return ;

    TARGB32* pDstLine= Dst.pdata;
    ((TUInt8*&)pDstLine)+=(Dst.byte_width* rcData.out_dst_down_y);
    while (true) //to down
    {
        long y= rcData.out_dst_down_y;
        if (y>=Dst.height) break ;
        if (y>=0 )
        {
            PicRotary_ThreeOrder_CopyLine(pDstLine,rcData.out_dst_x0_boder,rcData.out_dst_x0_in,
                rcData.out_dst_x1_in,rcData.out_dst_x1_boder,Src,rcData.out_src_x0_16,rcData.out_src_y0_16,Ax_16,Ay_16);
        }
        if (!rcData.next_clip_line_down()) break ;
        ((TUInt8*&)pDstLine)+= Dst.byte_width;
    }

    pDstLine= Dst.pdata;
    ((TUInt8*&)pDstLine)+=(Dst.byte_width* rcData.out_dst_up_y);
    while (rcData.next_clip_line_up()) //to up
    {
        long y= rcData.out_dst_up_y;
        if (y<0) break ;
        ((TUInt8*&)pDstLine)-= Dst.byte_width;
        if (y< Dst.height)
        {
            PicRotary_ThreeOrder_CopyLine(pDstLine,rcData.out_dst_x0_boder,rcData.out_dst_x0_in,
                rcData.out_dst_x1_in,rcData.out_dst_x1_boder,Src,rcData.out_src_x0_16,rcData.out_src_y0_16,Ax_16,Ay_16);
        }
    }
}

//注：测试图片都是800*600的图片旋转到1004*1004的图片中心测试成绩取各个旋转角度的平均速度值
////////////////////////////////////////////////////////////////////////////////
//速度测试:
//==============================================================================
// PicRotaryThreeOrder       22.8 fps
////////////////////////////////////////////////////////////////////////////////

三次卷积插值旋转结果图示：

30度 60度 90度

120度 150度 180度

210度 240度 270度

300度 330度 360度

E:用MMX优化三次卷积插值的旋转

//注：测试图片都是800*600的图片旋转到1004*1004的图片中心测试成绩取各个旋转角度的平均速度值
////////////////////////////////////////////////////////////////////////////////
//速度测试:
//==============================================================================
// PicRotaryThreeOrder_MMX   44.2 fps
////////////////////////////////////////////////////////////////////////////////

    typedef   unsigned long TMMXData32;
    static TMMXData32 SinXDivX_Table_MMX[(2<<8)+1 ];
    class _CAutoInti_SinXDivX_Table_MMX {
    private :
        void _Inti_SinXDivX_Table_MMX()
        {
            for (long i=0;i<=(2<<8);++ i)
            {
                unsigned short t=long(0.5+(1<<14)*SinXDivX(i*(1.0/(256 ))));
                unsigned long tl=t | (((unsigned long)t)<<16 );
                SinXDivX_Table_MMX[i]= tl;
            }
        };
    public :
        _CAutoInti_SinXDivX_Table_MMX() { _Inti_SinXDivX_Table_MMX(); }
    };
    static _CAutoInti_SinXDivX_Table_MMX __tmp_CAutoInti_SinXDivX_Table_MMX;

    void __declspec(naked) _private_ThreeOrder_Fast_MMX()
    {
        asm
        {
            movd        mm1,dword ptr [edx]
            movd        mm2,dword ptr [edx+4 ]
            movd        mm3,dword ptr [edx+8 ]
            movd        mm4,dword ptr [edx+12 ]
            movd        mm5,dword ptr [(offset SinXDivX_Table_MMX)+256*4+eax*4 ]
            movd        mm6,dword ptr [(offset SinXDivX_Table_MMX)+eax*4 ]
            punpcklbw   mm1,mm7
            punpcklbw   mm2,mm7
            punpcklwd   mm5,mm5
            punpcklwd   mm6,mm6
            psllw       mm1,7
            psllw       mm2, 7
            pmulhw      mm1,mm5
            pmulhw      mm2,mm6
            punpcklbw   mm3,mm7
            punpcklbw   mm4,mm7
            movd        mm5,dword ptr [(offset SinXDivX_Table_MMX) +256*4+ecx*4 ]
            movd        mm6,dword ptr [(offset SinXDivX_Table_MMX)+512*4+ecx*4 ]
            punpcklwd   mm5,mm5
            punpcklwd   mm6,mm6
            psllw       mm3,7
            psllw       mm4, 7
            pmulhw      mm3,mm5
            pmulhw      mm4,mm6
            paddsw      mm1,mm2
            paddsw      mm3,mm4
            movd        mm6,dword ptr [ebx] //v
            paddsw      mm1,mm3
            punpcklwd   mm6,mm6

            pmulhw      mm1,mm6
            add     edx,esi  //+pic.byte_width
            paddsw      mm0,mm1

            ret
        }
    }

    inline void ThreeOrder_Fast_MMX(const TPicRegion& pic,const long x_16,const long y_16,TARGB32* result)
    {
        asm
        {
            mov     ecx,pic
            mov     eax,y_16
            mov     ebx,x_16
            movzx   edi,ah //v_8
            mov     edx,[ecx+ TPicRegion.pdata]
            shr     eax,16
            mov     esi,[ecx + TPicRegion.byte_width]
            dec     eax
            movzx   ecx,bh //u_8
            shr     ebx,16
            imul    eax,esi
            lea     edx,[edx +ebx*4-4 ]
            add     edx,eax //pixel

            mov     eax,ecx
            neg     ecx

            pxor    mm7,mm7   // 0
            //mov     edx,pixel
            pxor    mm0,mm0  // result=0
            //lea     eax,auv_7

            lea    ebx,[(offset SinXDivX_Table_MMX) +256*4+edi*4 ]
            call  _private_ThreeOrder_Fast_MMX
            lea    ebx,[(offset SinXDivX_Table_MMX)+edi*4 ]
            call  _private_ThreeOrder_Fast_MMX
            neg    edi
            lea    ebx,[(offset SinXDivX_Table_MMX)+256*4+edi*4 ]
            call  _private_ThreeOrder_Fast_MMX
            lea    ebx,[(offset SinXDivX_Table_MMX)+512*4+edi*4 ]
            call  _private_ThreeOrder_Fast_MMX

            psraw     mm0,3
            mov       eax,result
            packuswb  mm0,mm7
            movd      [eax],mm0

            emms
        }
    }

     void ThreeOrder_Border_MMX(const TPicRegion& pic,const long x_16,const long y_16,TARGB32* result)
    {
        unsigned long x0_sub1=(x_16>>16)-1 ;
        unsigned long y0_sub1=(y_16>>16)-1 ;
        long u_16_add1=((unsigned short)(x_16))+(1<<16 );
        long v_16_add1=((unsigned short)(y_16))+(1<<16 );

        TARGB32 pixel[16 ];
        long i,j;

        for (i=0;i<4;++ i)
        {
            long y=y0_sub1+ i;
            for (j=0;j<4;++ j)
            {
                long x=x0_sub1+ j;
                bool IsInPic;
                pixel[i*4+j]= Pixels_Bound(pic,x,y,IsInPic);
                if (!IsInPic) pixel[i*4+j].a=0; else pixel[i*4+j].a=255 ;
            }
        }

        TPicRegion npic;
        npic.pdata     =&pixel[0 ];
        npic.byte_width=4*sizeof (TARGB32);
        // npic.width     =4;
        //npic.height    =4;
        ThreeOrder_Fast_MMX(npic,u_16_add1,v_16_add1,result);
    }

void PicRotary_ThreeOrder_CopyLine_MMX(TARGB32* pDstLine,long dst_border_x0,long dst_in_x0,long dst_in_x1,long dst_border_x1,
                        const TPicRegion& SrcPic,long srcx0_16,long srcy0_16,long Ax_16,long Ay_16)
{
    long x;
    for (x=dst_border_x0;x<dst_in_x0;++ x)
    {
        TARGB32 src_color;
        ThreeOrder_Border_MMX(SrcPic,srcx0_16,srcy0_16,& src_color);
        pDstLine[x]= AlphaBlend_MMX(pDstLine[x],src_color);
        srcx0_16+= Ax_16;
        srcy0_16+= Ay_16;
    }
    for (x=dst_in_x0;x<dst_in_x1;++ x)
    {
        ThreeOrder_Fast_MMX(SrcPic,srcx0_16,srcy0_16,& pDstLine[x]);
        srcx0_16+= Ax_16;
        srcy0_16+= Ay_16;
    }
    for (x=dst_in_x1;x<dst_border_x1;++ x)
    {
        TARGB32 src_color;
        ThreeOrder_Border_MMX(SrcPic,srcx0_16,srcy0_16,& src_color);
        pDstLine[x]= AlphaBlend_MMX(pDstLine[x],src_color);
        srcx0_16+= Ax_16;
        srcy0_16+= Ay_16;
    }
    asm  emms
}

void PicRotaryThreeOrder_MMX(const TPicRegion& Dst,const TPicRegion& Src,double RotaryAngle,double ZoomX,double ZoomY,double move_x,double move_y)
{
    if ( (fabs(ZoomX*Src.width)<1.0e-4) || (fabs(ZoomY*Src.height)<1.0e-4) ) return; //太小的缩放比例认为已经不可见
    double tmprZoomXY=1.0/(ZoomX* ZoomY);
    double rZoomX=tmprZoomXY* ZoomY;
    double rZoomY=tmprZoomXY* ZoomX;
    double sinA,cosA;
    SinCos(RotaryAngle,sinA,cosA);
    long Ax_16=(long)(rZoomX*cosA*(1<<16 ));
    long Ay_16=(long)(rZoomX*sinA*(1<<16 ));
    long Bx_16=(long)(-rZoomY*sinA*(1<<16 ));
    long By_16=(long)(rZoomY*cosA*(1<<16 ));
    double rx0=Src.width*0.5;  //(rx0,ry0)为旋转中心
    double ry0=Src.height*0.5 ;
    long Cx_16=(long)((-(rx0+move_x)*rZoomX*cosA+(ry0+move_y)*rZoomY*sinA+rx0)*(1<<16 ));
    long Cy_16=(long)((-(rx0+move_x)*rZoomX*sinA-(ry0+move_y)*rZoomY*cosA+ry0)*(1<<16 ));

    TRotaryClipData rcData;
    rcData.Ax_16= Ax_16;
    rcData.Bx_16= Bx_16;
    rcData.Cx_16= Cx_16;
    rcData.Ay_16= Ay_16;
    rcData.By_16= By_16;
    rcData.Cy_16= Cy_16;
    rcData.dst_width= Dst.width;
    rcData.dst_height= Dst.height;
    rcData.src_width= Src.width;
    rcData.src_height= Src.height;
    if (!rcData.inti_clip(move_x,move_y,2)) return ;

    TARGB32* pDstLine= Dst.pdata;
    ((TUInt8*&)pDstLine)+=(Dst.byte_width* rcData.out_dst_down_y);
    while (true) //to down
    {
        long y= rcData.out_dst_down_y;
        if (y>=Dst.height) break ;
        if (y>=0 )
        {
            PicRotary_ThreeOrder_CopyLine_MMX(pDstLine,rcData.out_dst_x0_boder,rcData.out_dst_x0_in,
                rcData.out_dst_x1_in,rcData.out_dst_x1_boder,Src,rcData.out_src_x0_16,rcData.out_src_y0_16,Ax_16,Ay_16);
        }
        if (!rcData.next_clip_line_down()) break ;
        ((TUInt8*&)pDstLine)+= Dst.byte_width;
    }

    pDstLine= Dst.pdata;
    ((TUInt8*&)pDstLine)+=(Dst.byte_width* rcData.out_dst_up_y);
    while (rcData.next_clip_line_up()) //to up
    {
        long y= rcData.out_dst_up_y;
        if (y<0) break ;
        ((TUInt8*&)pDstLine)-= Dst.byte_width;
        if (y< Dst.height)
        {
            PicRotary_ThreeOrder_CopyLine_MMX(pDstLine,rcData.out_dst_x0_boder,rcData.out_dst_x0_in,
                rcData.out_dst_x1_in,rcData.out_dst_x1_boder,Src,rcData.out_src_x0_16,rcData.out_src_y0_16,Ax_16,Ay_16);
        }
    }
}

F 效果图:
//程序使用的调用参数:
    const long testcount=2000;
    long dst_wh=1004;
    for (int i=0;i    {
        double zoom=rand()*(1.0/RAND_MAX)+0.5;
        PicRotary_XXX(ppicDst,ppicSrc,rand()*(PI*2/RAND_MAX),zoom,zoom,((dst_wh+ppicSrc.width)*rand()*(1.0/RAND_MAX)-ppicSrc.width),(dst_wh+ppicSrc.height)*rand()*(1.0/RAND_MAX)-ppicSrc.height);
    }

近邻取样插值旋转效果图:

二次线性插值旋转效果图:

三次卷积插值旋转效果图:

G:旋转测试的结果放到一起：

//注：测试图片都是800*600的图片旋转到1004*1004的图片中心，测试成绩取各个旋转角度的平均速度值
////////////////////////////////////////////////////////////////////////////////
//速度测试: (测试CPU为AMD64x2 4200+(2.37G),单线程)
//==============================================================================
// PicRotary3               280.9 fps
// PicRotarySEE             306.3 fps
// PicRotarySEE2            304.2 fps
//
// PicRotaryBilInear         68.9 fps
// PicRotaryBilInear_MMX    100.2 fps
// PicRotaryThreeOrder       22.8 fps
// PicRotaryThreeOrder_MMX   44.2 fps
////////////////////////////////////////////////////////////////////////////////

补充Intel Core2 4400上的测试成绩:

////////////////////////////////////////////////////////////////////////////////
//速度测试: (测试CPU为Intel Core2 4400(2.00G)单线程)
//==============================================================================
// PicRotary3               334.9 fps
// PicRotarySEE             463.1 fps
// PicRotarySEE2            449.3 fps
//
// PicRotaryBilInear         68.9 fps
// PicRotaryBilInear_MMX    109.5 fps
// PicRotaryThreeOrder       24.0 fps
// PicRotaryThreeOrder_MMX   45.9 fps
////////////////////////////////////////////////////////////////////////////////

(针对大图片的预读缓冲区优化的旋转请参见《下篇补充话题》中的优化版本)

(对于旋转的MipMap处理和三次线性插值，可以参考《图形图像处理－之－高质量的快速的图像缩放下篇三次线性插值和MipMap链》文章)

(这里为了函数的独立性和容易理解，都是拷贝代码然后稍作修改；实际的程序中，建议把他们合并到同一个函数中,
减少代码量，提高可维护性；对于MMX、SSE、SSE2等的使用建议用CPUID指令测试看CPU是否支持这些指令，
动态决定调用不同的实现)

(欢迎指出文章中的错误、我没有做到的优化、改进意见等)

你可能感兴趣的:(图形图像)

OpenHarmony 5.0.2 Release来了！ MardaWang
版本概述OpenHarmony5.0.2Release版本对标准系统的能力进行持续完善，以快速迭代的方式推出API14，相比5.0.1Release版本，重点做出了如下特性新增或增强：进一步增强ArkUI、图形图像的能力，提供更多组件的高级属性设置，支持更多精致动效；进一步增强Web能力，满足更多应用诉求；针对2in1设备特点，新增一系列窗口管理和控制的能力及窗口生命周期行为管理；新增一批企业定制
Android 11.0 camera2关于拍照预览方向旋转90度和拍照图片镜像功能实现安卓兼职framework应用工程师 android 11.0 Rom定制化高级进阶 android 旋转拍照方向旋转90度拍照拍照旋转90度拍照镜像
1.前言在11.0的系统rom产品定制化开发中，在camera2的一些图形图像中有些是不正常的功能，比如在拍照和预览画面和手机屏幕不一致，或者在保存拍照图片的时候发现图片翻转保存了等问题，所以就需要分析下相关的问题来解决实现功能2.camera2关于拍照预览方向旋转90度和拍照图片镜像功能实现的核心类packages\apps\Camera2\src\com\android\camera\one\
C# 图形图像技术（通过Graphics绘制图像）萨达大 c#开发语言
文章目录创建Graphics对象画笔与画刷画笔画刷SolidBrush类HatchBrush类LinerGradientBrush类基本图形绘制矩形椭圆圆弧扇形创建Graphics对象privatevoidForm1_Load(objectsender,Eventargse){Graphicsghs=this.CreateGraphics();}画笔与画刷画笔构造函数publicPen(Color
OpenGL ES基本概念 Irino
OpenGLES的版本OpenGLES1.X：用于固定功能流水管线硬件OpenGLES2.X：用于可编程功能流水管线硬件OpenGLES3.X：OpenGLES2.0的拓展EGL（EmbeddedGraphicsLibrary）OpenGLES命令需要渲染上下文和绘制表面才能完成图形图像的绘制渲染上下文：存储相关OpenGLES状态绘制表面：是用于绘制图元的表面，它指定渲染所需要的缓存区类型，例如
培养一两项无用的兴趣爱好，一定有用霖小姐慢半拍
图片发自App学习Photoshop（一款图形图像处理软件）是今年年初定下的计划之一，直到最近才开始付诸行动，之所以拖到现在，是因为PS对于我来说，暂时是项「没用」的技能。又之所以决定赶在跨年前学会它的基本操作，一方面是因为年初定下过计划，我有一定程度的强迫症状，计划列表里的事情没完成，心里会觉得各种别扭。另一方面，更重要的一个原因，是因为它「没用」，所以我要去学。是的，你没看错，我年初定下学习P
计算机科学引论2021英文,计算机科学引论= Computing Essentials : 英文弗雷德里克·雷蒙德计算机科学引论2021英文
摘要：本书概括地介绍了计算机科学与信息技术的主要领域,各种应用及其对社会的影响.全书由15章和一些附录组成,主要内容包括:信息技术概述;因特网,万维网与电子商务;基本应用软件(包括字处理,表处理,数据库管理系统,文字和图形演示,集成化软件包等);专用软件(包括图形图像处理,音频与视频,多媒体,Web创作以及虚拟现实和专家系统等新兴应用);操作系统等系统软件;计算机系统组成部件;输入/输出及相关外部
图形图像处理算法(1) ---- HDR 技术简介小猪佩奇TONY 图像处理算法
随着HDR技术的发展，越来越多的视频平台和技术厂商持续推动HDR内容的制作和传播，HDR可以提供更加丰富的细节，更宽广的色域和更加自然的色彩过度，为了呈现更高的图像品质，给体验者带来更加沉浸的感受，HDR的概念既可以是指显示设备，表示显示设备支持更高的色深，更广的色域范围，能显示更高和更低的亮度，也可以是指数字媒体内容，比如视频，表示视频的编码使用了更高的色深，更广的色域范围，支持更高更低的亮度并
图形图像处理算法(2) ---- ToneMapping 技术小猪佩奇TONY 图像处理
1.色调映射（ToneMapping）定义1.1视觉的形成和特点影像系统的核心功能之一就是图像显示，好的显示效果能真实的再现原始场景，给人的感觉就是和直接观察原始场景一样。色调映射使影像再现系统的一个重要组成部分，它能将原始场景的光照映射成显示设备的发光强度。一个好的影像系统需要考虑人的视觉系统是如何处理光线的，场景辐射的光线被人类视网膜上是视杆细胞和视锥细胞捕捉，形成电信号，并传递到视觉神经通道
【图形图像的C++ 实现 01/20】 2D 和 3D 贝塞尔曲线无水先生 BOOST C++人工智能 c++3d 人工智能
目录一、说明二、贝塞尔曲线特征三、模拟四、全部代码如下五、资源和下载一、说明以下文章介绍了用C++计算和绘制的贝塞尔曲线（2D和3D）。贝塞尔曲线具有出色的数学能力来计算路径（从起点到目的地点的曲线）。曲线的形状由“控制点”决定。所讨论的曲线最重要的特征是平滑度。在许多应用和领域中，平滑度是不可或缺的。我们可以考虑机器人或其他机器的运动，其中运动必须是可预测的，以确保人员和硬件的安全（
OpenGL-01-常见专业名词解析宇宙那么大丶
一、图形API首先我们要知道什么是OpenGL以及其他相关的API有哪些。OpenGL：（OpenGraphicsLibrary）是一个跨平台、夸编程语言的编程图形程序接口，它将计算机的资源抽象称为一个个OpenGL的对象，对这些资源的操作抽象为一个个OpenGL指令。【针对PC端（Mac、Windows）的图形图像渲染处理】OpenGLES：（OpenGLforEmbeddedSystems）是
计算机图形学复习玛卡巴卡_qin 课程学习
第一章绪论1.什么是计算机图形学计算机图形学是借助计算机生成图形图像的艺术或科学2.计算机图形学研究内容图形生成、图形变换、交互技术3.计算机图形学与数字图像处理的异同相同点：像素层面图像和图形是一致的不同点：处理过程是互逆的计算机图形学是从目标描述产生图形显示数值图像处理是对图像进行描述第三章图元生成1.直线生成算法：思路、判别参数定义DDA算法y=mx+byk+1=yk+msetpixel(x
js,java中的无符号右移位符,左移位符,有符号右移位符 ABCDEF_7c48
移位运算就是对二进制进行有规律低移位。移位运算可以设计很多奇妙的效果，在图形图像编程中应用广泛。“>”运算符“>>”运算符执行有符号右移位运算。与左移运算操作相反，它把32位数字中的所有有效位整体右移，再使用符号位的值填充空位。移动过程中超出的值将被丢弃。把数值1000向右移8位，则返回值为3。console.log(1000>>8);//返回值3用算式进行演示，如图所示。在这里插入图片描述把数值
OpenGL(七)-图形图像渲染中的深度缓冲区 king_jensen
logo.jpg什么是深度?深度其实就是该像素点在3D世界中距离摄像机的距离,Z值什么是深度缓冲区?**深度缓存区**,就是⼀块内存区域,专门存储着每个像素点(绘制在屏幕上的)深度值.深度值(Z值)越⼤大,则离摄像机就越远.为什么需要深度缓冲区?在不使用深度测试的时候,如果我们先绘制一个距离比较近的物理理,再绘制距离较远的物体,则距离远的位图因为后绘制,会把距离近的物体覆盖掉.有了深度缓冲区后,绘
建模、动画、材质、渲染到音频处理、视频剪辑的开源软件Blender，开源免费！开源免费！开源免费！小兔子烧包谷材质音视频 blender
一、简介Blender是一款免费开源的三维图形图像软件，提供了从建模、动画、材质、渲染到音频处理、视频剪辑等一系列的动画短片制作解决方案。以下是关于Blender软件的详细介绍：用户界面：Blender拥有方便且适用于不同工作环境的多种用户界面，让用户能够更加高效地进行创作。高级影视解决方案：Blender内置了绿屏抠像、摄像机反向跟踪、遮罩处理、后期结点合成等高级影视解决方案，为专业影视制作提供
内推几何建模与图形渲染职位卢石碧图形渲染几何学 c++qt
最近（可能也会是长期的）公司在大力招兵买马，急缺几何、图形方面的人才。初级、高级、专家或有致力于图形领域方面开发都欢迎。当然其他方面的也有，包括BIM相关的开发，可直接内推。具体职位列表如下，薪资open可谈，坐标：上海、深圳、武汉三地均可。几何算法工程师图形图像开发工程师C++开发工程师BIM软件架构师BIM产品经理UED设计师测试开发工程师建筑业务专家期待能跟您共事！有认识的周边朋友想要换工作
ARKit 图像检测不凡的凡计算机视觉人工智能
2D图像检测跟踪图像跟踪技术，是指通过图像处理技术对摄像机中拍摄到的2D图像进行检测、识别、定位，并对其姿态进行跟踪的技术。图像跟踪技术的基础是图像识别，图像识别是指检测和识别出数字图像或视频中的对象或特征的技术，图像识别技术是信息时代的一门重要技术，其产生的目的是为了让计算机代替人类处理大量的图形图像及真实物体信息，是其他众多技术的基础。ARKit具备对2D图像检测、识别、跟踪的能力，其能实时检
1、OpenGL快速入门 Jack__Lee
OpenGL/OpenGLES/Metal在任何项⽬目中解决问题的本质就是利用GPU芯片来高效渲染图形图像.图形API是iOS开发者唯一接近GPU的⽅方式.图形API简介OpenGL(OpenGraphicsLibrary)是一个跨编程语⾔言、跨平台的编程图形程序接⼝，它将计算机的资源抽象称为⼀个个OpenGL的对象，对这些资源的操作抽象为一个个的OpenGL指令。OpenGLES(OpenGLf
C# Bitmap类学习1 bcbobo21cn .Net 图像处理和识别 c#开发语言 SetPixel Bitmap
Bitmap对象封装了GDI+中的一个位图，此位图由图形图像及其属性的像素数据组成.因此Bitmap是用于处理由像素数据定义的图像的对象。usingSystem;usingSystem.Collections.Generic;usingSystem.ComponentModel;usingSystem.Data;usingSystem.Drawing;usingSystem.Linq;usingS
【QT+VTK 学习笔记】13:VTK图形处理2 法向量、曲率计算、网格平滑 jbyyy、 QT+VTK学习笔记 qt 学习几何学
前言“VTK图形图像开发进阶_张晓东_罗火灵”的学习笔记。东灵工作室教程系列导航：http://blog.csdn.net/www_doling_net/article/details/8763686学习资料VTK官网学习地址：https://vtk.org/doc/nightly/html/2.1法向量计算法向量的定义法向量，是空间解析几何的一个概念，垂直于平面的直线所表示的向量为该平面的法向量
新手入门C语言基础学习：C语言编程预备知识小辰带你看世界
一、C语言的特点优点：代码量小，速度快，功能强大缺点：危险性高，开发周期长，可移植性弱二、C的应用领域系统软件开发操作系统：Windows,Linux,Unix驱动程序：主板驱动，显卡驱动，摄像头驱动数据库：DB2，Oracle,Sqlserver应用软件开发办公软件：Wps图形图像多媒体：ACDSee,Photoshop,MediaPlayer嵌入式软件开发：智能手机，掌上电脑游戏开发：2D,3
平面设计作图应该用什么？是软件用的越多越好吗？ c5f93ea1d435
最常用的软件有Photoshop,Illustrator,Coreldraw他们之间的区别与联系：Photoshop:Photoshop是Adobe公司旗下最为出名的图像处理软件之一，集图像扫描、编辑修改、图像制作、广告创意，图像输入与输出于一体的图形图像处理软件，深受广大平面设计人员和电脑美术爱好者的喜爱。正常作图，抠图，修图都使用Photoshop。Illustrator:Illustrato
怎么将几张pdf合并成一张_如何将多个pdf文件合并成一个pdf文件？光启元怎么将几张pdf合并成一张
原标题：如何将多个pdf文件合并成一个pdf文件？我很喜欢使用PDF文件格式，为什么呢？因为PDF具有许多其他电子文档格式无法相比的优点。PDF文件格式可以将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件中。该格式文件还可以包含超文本链接、声音和动态影像等电子信息，支持特长文件，集成度和安全可靠性都较高。所以在平时办公的时候我和同事都会用到PDf，但是由于PDF过多会造成很多
Android-图形图像与动画之Animation实现图像的渐变、缩放、位移、旋转的代码饭团院长
把代码过程重要的一些代码做个记录，下面代码是关于Android-图形图像与动画之Animation实现图像的渐变、缩放、位移、旋转的代码。实现本实例的源代码如下：publicclassAnimations_ActivityextendsActivity{privateButtonbutton1;privateButtonbutton2;privateButtonbutton3;privateBut
12. VTK上选取点（VTK7版本+VTK9版本）梦里花乡 VTK项目代码学习 c++vtk 计算机视觉学习
这个专栏是用于记录我在学习VTK过程中的一些心得体会。参考的资料主要有以下三个：1.张晓东罗火灵《VTK图形图像开发进阶》2.https://examples.vtk.org/site/3.沈子恒《VTK三维数据渲染进阶》遇到的一个大问题就是由于版本更新，这些资料中很多代码无法正常运行，需要进行一定的修改，所以这个专栏会记录下来我修改后的程序代码，以便于我之后温习。也希望能给和我有同样困扰的小伙伴
5_1_2多媒体基础知识快乐无极限
多媒体系统基础知识一、音频和图形图像的相关概念音频声音的带宽：声音信号的频率范围1）人耳能够听到范围：20Hz-20kHz，次声波和超声波人耳都听不到低于20Hz的声波为次声波高于20000Hz的声波为超声波乐器的音频范围：20Hz-20kHz2）人的说话声音范围：300-3400Hz音量：声音的强弱程度音调：男高音女高音（声音的频率高）音色：由混入基音的泛音决定采样、采样频率、采样精度1）采样：
计算机导论06-人机交互 D0ublecl1ck 计算机导论人机交互 stm32 嵌入式硬件
文章目录人机交互基础人机交互概述人机交互及其发展人机交互方式人机界面新型人机交互技术显示屏技术跟踪与识别（技术）脑-机接口多媒体技术多媒体技术基础多媒体的概念多媒体技术及其特性多媒体技术的应用多媒体技术发展趋势多媒体应用技术文字（语言的符号化）处理技术音频（语言的信号化）处理技术声音的数字化MIDI合成音频（计算机合成的数字声音、音乐）图形图像处理技术图像的数字化图形影像处理技术多媒体数据压缩技术
线程池及红黑树复习--Apple的学习笔记 applecai
FFmpeg也算是入门了。回顾我之前理解的流媒体开发就是指FFmpeg是错误的，因为流媒体开发主要是指网络视频，否则就是视频播放编辑器了。但是我的主攻方向还是围绕图形图像，而网络方面的协议RTSP,RTMP等，更加侧重于服务器开发。所以我决定网络协议方面暂不做探究。之前学习过协程，我应该用不到，所以我想先复习下线程池，其实我认为也是服务器要用到的，估计我也用不到。作为基础复习下。因为最基础的东西才
2020.04.18读曹培英《跨越断层，走出误区：“数学课程标准”核心词的解读与实践研究》收获章贡1157杨晓娟
数学符号恰是数学抽象最重要的表征。符号，通常是指具有某种代表意义的记号、标识，它源于规定或约定俗成。符号具有两方面的内涵。一方面，它承载着意义、精神；另一方面，它有着能被感知的特定表现形式，可以是图形图像、文字组合，也可以是声音信号、建筑造型，甚至是一种思想文化、一个时事人物。数学世界，罗素说过：“什么是数学？数学就是符号加逻辑。”可以说，没有符号，就没有近代数学、现代数学。数学符号的特殊性。数学
阿里云gpu云服务器产品知识、常见问题及官方解答资料阿里云最新优惠和活动汇总
作为阿里云弹性计算家族的一员，GPU云服务器结合了GPU计算力与CPU计算力，满足您在人工智能、高性能计算、专业图形图像处理等场景中的需求。下面是阿里云GPU云服务器的一些产品知识和常见问题及官方解答资料，以供大家参考和了解阿里云GPU云服务器。阿里云gpu云服务器图.png一、什么是GPU云服务器GPU云服务器（GPUCloudComputing，GPU）是提供GPU算力的弹性计算服务，具有超强
GPU领域相关基础概念介绍 runafterhit 音视频领域业务人工智能硬件架构深度学习
做图形图像领域始终绕不开对gpu相关业务接触，虽然没有直接做过gpu相关驱动项目，但是了解一些典型概念还是非常有必要的。文章目录一、GPU基础概念GPU基本定义---GPU/GPGPU/CUDA从图形处理器发展到并行计算平台GPU厂商盘点---Nvidia、AMD、Intel、ARM游戏、游戏引擎（如Unity）、图形API（如OpenGL）与GPU（驱动driver）的关联图形API之OpenG
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。

图形图像处理－之－任意角度的高质量的快速的图像旋转 中篇 高质量的旋转

你可能感兴趣的:(图形图像)

图形图像处理－之－任意角度的高质量的快速的图像旋转中篇高质量的旋转