housisong

YUV视频格式到RGB32格式转换的速度优化中篇

                  YUV视频格式到RGB32格式转换的速度优化中篇
                    [email protected]   2007.11.05

tag: YUV,YCbCr,YUV到RGB颜色转换,YUV解码,VFW,视频,MMX,SSE,多核优化

摘要: 我们得到的很多视频数据(一些解码器的输出或者摄像头的输出等)都使用了一种
叫YUV的颜色格式；本文介绍了常见的YUV视频格式(YUY2/YVYU/UYVY/I420/YV12等)到
RGB颜色格式的转换,并尝试对转化的速度进行优化；
全文分为:
    《上篇》文章首先介绍了YUV颜色格式，并介绍了YUV颜色格式和RGB颜色格式之
间的相互转换；然后重点介绍了YUYV视频格式到RGB32格式的转化，并尝试进行了一
些速度优化；
    《中篇》尝试使用MMX/SSE指令对前面实现的解码器核心进行速度优化；然
后简要介绍了一个使用这类CPU特殊指令时的代码框架，使得解码程序能够根据运行时
的CPU指令支持情况动态调用最佳的实现代码；并最终提供一个多核并行的优化版本；
    《下篇》介绍YUV类型的其他种类繁多的视频数据编码格式；并将前面实现的解码
器核心(在不损失代码速度的前提下)进行必要的修改，使之适用于这些YUV视频格式
的解码；

    (2007.11.25 优化了一下DECODE_YUYV_SSE，使用预读优化;调整了一下MMX指令的定义方式，结构更好一些)
    (2007.11.13 修正了一下颜色转换公式中的系数)
    (2007.11.05 修改函数DECODE_YUYV_AutoEx中的一个bug)

正文:
代码使用C++,编译器:VC2005
涉及到汇编的时候假定为x86平台；
现在的高清视频帧尺寸越来越大，所以本文测试的图片大小将使用1024x576和
1920x1080两种常见的帧尺寸来测试解码器速度；
测试平台:(CPU:AMD64x2 4200+(2.37G);   内存:DDR2 677(双通道); 编译器:VC2005)
测试平台:(CPU:Intel Core2 4400(2.00G);内存:DDR2 667(双通道); 编译器:VC2005)

请先参看《YUV视频格式到RGB32格式转换的速度优化上篇》，
本文章将继续成倍的提高其速度!


A:使用MMX指令来继续优化YUYV视频格式到RGB32格式的转换函数
现在绝大多数的x86CPU都支持MMX指令，它是一种单指令多数据流的指令集(SIMD)；
MMX指令能够同时操作8个byte或者4个short等; 在YUV转换到RGB的运算中,为了保持精
度选用一次运算4个short数据类型；那外考虑如果在一个寄存器中保存YUYV四个数据，
整个运算写起来会较麻烦，且算法受到Y、U、V三个颜色存放位置的影响严重；而且考
虑到除了packed模式外很多YUV视频数据都为planar模式，所以想把Y、U、V先分离到
各自的寄存器再运算，看起来舒服得多，那么运算核心将用一个寄存器保存4个U，一
个寄存器保存4个V，对应8个Y，也就是说核心转换代码运行一遍可以输出8个RGB32比
特颜色；
所以我们先来实现一个通用的MMX实现的转换核心：
我们约定输入:
        mm0 = Y7 Y6 Y5 Y4 Y3 Y2 Y1 Y0
        mm1 = 00 u3 00 u2 00 u1 00 u0
        mm2 = 00 v3 00 v2 00 v1 00 v0
通过edx指向的内存输出:
        [edx -- edx+8*4]

由于主要的计算使用short精度，那些系数就不能使用16位的定点数了；为了不超出short的
范围可以使用13位的定点数(再大就会溢出了)；

MMX实现的转换核心(使用了宏来实现)：YUV422ToRGB32_MMX:
(系数的由来/数据在MMX寄存器的大致流动都有较详细的注释；
如果有人进一步改进了这个核心,请告诉我:)

typedef unsigned __int64  UInt64;

const   UInt64   csMMX_16_b       = 0x1010101010101010 ; // byte{16,16,16,16,16,16,16,16}
const   UInt64   csMMX_128_w      = 0x0080008000800080 ; // short{  128,  128,  128,  128}
const   UInt64   csMMX_0x00FF_w   = 0x00FF00FF00FF00FF ; // 掩码
const   UInt64   csMMX_Y_coeff_w = 0x2543254325432543 ; // short{ 9539, 9539, 9539, 9539} =1.164383*(1<<13)
const   UInt64   csMMX_U_blue_w   = 0x408D408D408D408D ; // short{16525,16525,16525,16525} =2.017232*(1<<13)
const   UInt64   csMMX_U_green_w = 0xF377F377F377F377 ; // short{-3209,-3209,-3209,-3209} =(-0.391762)*(1<<13)
const   UInt64   csMMX_V_green_w = 0xE5FCE5FCE5FCE5FC ; // short{-6660,-6660,-6660,-6660} =(-0.812968)*(1<<13)
const   UInt64   csMMX_V_red_w    = 0x3313331333133313 ; // short{13075,13075,13075,13075} =1.596027*(1<<13)

// 一次处理8个颜色输出
#define YUV422ToRGB32_MMX(out_RGB_reg,WriteCode)                                                 /
    /* input :  mm0 = Y7 Y6 Y5 Y4 Y3 Y2 Y1 Y0     */                                                 /
    /*          mm1 = 00 u3 00 u2 00 u1 00 u0     */                                                 /
    /*          mm2 = 00 v3 00 v2 00 v1 00 v0     */                                                 /
    /* output : [out_RGB_reg -- out_RGB_reg+8*4]                  */                                 /
                                                                                                 /
          asm   psubusb     mm0,csMMX_16_b         /* mm0 : Y -= 16                        */       /
          asm   psubsw      mm1,csMMX_128_w        /* mm1 : u -= 128                       */       /
          asm   movq        mm7,mm0                                                              /
          asm   psubsw      mm2,csMMX_128_w        /* mm2 : v -= 128                       */       /
          asm   pand        mm0,csMMX_0x00FF_w     /* mm0 = 00 Y6 00 Y4 00 Y2 00 Y0        */       /
          asm   psllw       mm1, 3                   /* mm1 : u *= 8                         */       /
          asm   psllw       mm2, 3                   /* mm2 : v *= 8                         */       /
          asm   psrlw       mm7, 8                   /* mm7 = 00 Y7 00 Y5 00 Y3 00 Y1        */       /
          asm   movq        mm3,mm1                                                              /
          asm   movq        mm4,mm2                                                              /
                                                                                                 /
          asm   pmulhw      mm1,csMMX_U_green_w    /* mm1 = u * U_green                    */       /
          asm   psllw       mm0, 3                   /* y*=8                                 */       /
          asm   pmulhw      mm2,csMMX_V_green_w    /* mm2 = v * V_green                    */       /
          asm   psllw       mm7, 3                   /* y*=8                                 */       /
          asm   pmulhw      mm3,csMMX_U_blue_w                                                   /
          asm   paddsw      mm1,mm2                                                              /
          asm   pmulhw      mm4,csMMX_V_red_w                                                    /
          asm   movq        mm2,mm3                                                              /
          asm   pmulhw      mm0,csMMX_Y_coeff_w                                                  /
          asm   movq        mm6,mm4                                                              /
          asm   pmulhw      mm7,csMMX_Y_coeff_w                                                  /
          asm   movq        mm5,mm1                                                              /
          asm   paddsw      mm3,mm0                /* mm3 = B6 B4 B2 B0        */                   /
          asm   paddsw      mm2,mm7                /* mm2 = B7 B5 B3 B1        */                   /
          asm   paddsw      mm4,mm0                /* mm4 = R6 R4 R2 R0        */                   /
          asm   paddsw      mm6,mm7                /* mm6 = R7 R5 R3 R1        */                   /
          asm   paddsw      mm1,mm0                /* mm1 = G6 G4 G2 G0        */                   /
          asm   paddsw      mm5,mm7                /* mm5 = G7 G5 G3 G1        */                   /
                                                                                                 /
          asm   packuswb    mm3,mm4                /* mm3 = R6 R4 R2 R0 B6 B4 B2 B0 to [0-255] */ /
          asm   packuswb    mm2,mm6                /* mm2 = R7 R5 R3 R1 B7 B5 B3 B1 to [0-255] */ /
          asm   packuswb    mm5,mm1                /* mm5 = G6 G4 G2 G0 G7 G5 G3 G1 to [0-255] */ /
          asm   movq        mm4,mm3                                                              /
          asm   punpcklbw   mm3,mm2                /* mm3 = B7 B6 B5 B4 B3 B2 B1 B0      */         /
          asm   punpckldq   mm1,mm5                /* mm1 = G7 G5 G3 G1 xx xx xx xx      */         /
          asm   punpckhbw   mm4,mm2                /* mm4 = R7 R6 R5 R4 R3 R2 R1 R0      */         /
          asm   punpckhbw   mm5,mm1                /* mm5 = G7 G6 G5 G4 G3 G2 G1 G0      */         /
                                                                                                 /
                 /* out */                                                                           /
          asm   pcmpeqb     mm2,mm2                /* mm2 = FF FF FF FF FF FF FF FF      */         /
                                                                                                 /
          asm   movq        mm0,mm3                                                              /
          asm   movq        mm7,mm4                                                              /
          asm   punpcklbw   mm0,mm5              /* mm0 = G3 B3 G2 B2 G1 B1 G0 B0        */         /
          asm   punpcklbw   mm7,mm2              /* mm7 = FF R3 FF R2 FF R1 FF R0        */         /
          asm   movq        mm1,mm0                                                              /
          asm   movq        mm6,mm3                                                              /
          asm   punpcklwd   mm0,mm7              /* mm0 = FF R1 G1 B1 FF R0 G0 B0        */         /
          asm   punpckhwd   mm1,mm7              /* mm1 = FF R3 G3 B3 FF R2 G2 B2        */         /
          asm   WriteCode   [out_RGB_reg],mm0                                                    /
          asm   movq        mm7,mm4                                                              /
          asm   punpckhbw   mm6,mm5              /* mm6 = G7 B7 G6 B6 G5 B5 G4 B4        */         /
          asm   WriteCode   [out_RGB_reg + 8 ],mm1                                                  /
          asm   punpckhbw   mm7,mm2              /* mm7 = FF R7 FF R6 FF R5 FF R4       */          /
          asm   movq        mm0,mm6                                                              /
          asm   punpcklwd   mm6,mm7              /* mm6 = FF R5 G5 B5 FF R4 G4 B4       */          /
          asm   punpckhwd   mm0,mm7              /* mm0 = FF R7 G7 B7 FF R6 G6 B6       */          /
          asm   WriteCode  [out_RGB_reg + 8 * 2 ],mm6                                                 /
          asm   WriteCode  [out_RGB_reg + 8 * 3 ],mm0

YUV视频格式到RGB32格式的转换函数，MMX指令实现版本

     #define YUYV_Loader_MMX(in_yuv_reg)                                                         /
          asm   movq        mm0,[in_yuv_reg  ] /* mm0=V1 Y3 U1 Y2 V0 Y1 U0 Y0   */                 /
          asm   movq        mm4,[in_yuv_reg + 8 ] /* mm4=V3 Y7 U3 Y6 V2 Y5 U2 Y4   */                 /
          asm   movq        mm1,mm0                                                             /
          asm   movq        mm5,mm4                                                             /
          asm   psrlw       mm1, 8                /* mm1=00 V1 00 U1 00 V0 00 U0   */                 /
          asm   psrlw       mm5, 8                /* mm5=00 V3 00 U3 00 V2 00 U2   */                 /
          asm   pand        mm0,csMMX_0x00FF_w /* mm0=00 Y3 00 Y2 00 Y1 00 Y0   */                 /
          asm   pand        mm4,csMMX_0x00FF_w /* mm4=00 Y7 00 Y6 00 Y5 00 Y4   */                 /
          asm   packuswb    mm1,mm5             /* mm1=V3 U3 V2 U2 V1 U1 V0 U0   */                 /
          asm   movq        mm2,mm1                                                             /
          asm   packuswb    mm0,mm4             /* mm0=Y7 Y6 Y5 Y4 Y3 Y2 Y1 Y0   */                 /
          asm   psllw       mm1, 8                /* mm1=U3 00 U2 00 U1 00 U0 00   */                 /
          asm   psrlw       mm2, 8                /* mm2=00 V3 00 V2 00 V1 00 V0   */                 /
          asm   psrlw       mm1, 8                /* mm1=00 U3 00 U2 00 U1 00 U0   */


     void DECODE_YUYV_MMX_line(TARGB32 * pDstLine, const TUInt8 * pYUYV, long width)
    {
         long expand8_width = (width >> 3 ) << 3 ;

         if (expand8_width > 0 )
        {
            asm
            {
                mov     ecx,expand8_width
                mov     eax,pYUYV
                mov     edx,pDstLine
                lea     eax,[eax + ecx * 2 ]
                lea     edx,[edx + ecx * 4 ]
                neg     ecx

              loop_beign:
                YUYV_Loader_MMX(eax + ecx * 2 )
                YUV422ToRGB32_MMX(edx + ecx * 4 ,movq)

                add     ecx, 8
                jnz     loop_beign

                mov     pYUYV,eax
                mov     pDstLine,edx
            }
        }

         // 处理边界
        DECODE_YUYV_Common_line(pDstLine,pYUYV,width - expand8_width);
    }

void DECODE_YUYV_MMX( const TUInt8 * pYUYV, const TPicRegion & DstPic)
{
    assert((DstPic.width & 1 ) == 0 );

     long YUV_byte_width = (DstPic.width >> 1 ) << 2 ;
    TARGB32 * pDstLine = DstPic.pdata;
     for ( long y = 0 ;y < DstPic.height; ++ y)
    {
        DECODE_YUYV_MMX_line(pDstLine,pYUYV,DstPic.width);
        pYUYV += YUV_byte_width;
        ((TUInt8 *& )pDstLine) += DstPic.byte_width;
    }
    asm emms
}

速度测试:
////////////////////////////////////////////////////////////////////////////////
//==============================================================================
//                       |        1024x576       |       1920x1080       |
//------------------------------------------------------------------------------
//                       | AMD64x2 |   Core2   | AMD64x2 |   Core2   |
//------------------------------------------------------------------------------
//DECODE_YUYV_MMX          585.4 FPS 569.8 FPS    169.8 FPS 160.4 FPS
////////////////////////////////////////////////////////////////////////////////

B.使用SSE中的软件预取和禁止写缓存来改进MMX版本

这里的改动其实很小，只是把YUV422ToRGB32_MMX中颜色数据保存操作
movq [mem],mmx_reg 修改成 movntq [mem],mmx_reg
然后再处理完成后调用sfence缓存刷新指令。
完整代码如下:

     // 使用软件预读和禁止写缓存优化
     #define   YUV422ToRGB32_SSE(out_RGB_reg) YUV422ToRGB32_MMX(out_RGB_reg,movntq)

     void DECODE_YUYV_SSE_line(TARGB32 * pDstLine, const TUInt8 * pYUYV, long width)
    {
         long expand8_width = (width >> 3 ) << 3 ;

         if (expand8_width > 0 )
        {
            asm
            {
                mov     ecx,expand8_width
                mov     eax,pYUYV
                mov     edx,pDstLine
                lea     eax,[eax + ecx * 2 ]
                lea     edx,[edx + ecx * 4 ]
                neg     ecx

              loop_beign:
                YUYV_Loader_MMX(eax + ecx * 2 )
                prefetchnta [eax + ecx * 2 + 64 * 4 ]   // 预读
                YUV422ToRGB32_SSE(edx + ecx * 4 )

                add     ecx, 8
                jnz     loop_beign

                mov     pYUYV,eax
                mov     pDstLine,edx
            }
        }

         // 处理边界
        DECODE_YUYV_Common_line(pDstLine,pYUYV,width - expand8_width);
    }

void DECODE_YUYV_SSE( const TUInt8 * pYUYV, const TPicRegion & DstPic)
{
    assert((DstPic.width & 1 ) == 0 );

     long YUV_byte_width = (DstPic.width >> 1 ) << 2 ;
    TARGB32 * pDstLine = DstPic.pdata;
     for ( long y = 0 ;y < DstPic.height; ++ y)
    {
        DECODE_YUYV_SSE_line(pDstLine,pYUYV,DstPic.width);
        pYUYV += YUV_byte_width;
        ((TUInt8 *& )pDstLine) += DstPic.byte_width;
    }
    asm sfence
    asm emms
}

速度测试:
////////////////////////////////////////////////////////////////////////////////
//==============================================================================
//                       |        1024x576       |       1920x1080       |
//------------------------------------------------------------------------------
//                       | AMD64x2 |   Core2   | AMD64x2 |   Core2   |
//------------------------------------------------------------------------------
//DECODE_YUYV_SSE          770.3 FPS   741.9 FPS   220.0 FPS 209.7 FPS
////////////////////////////////////////////////////////////////////////////////

C.使用CPU特殊指令的一般框架
我的blog文章中，经常使用MMX/SSE等特殊指令，都是只给出代码实现；它们离实际项目代
码还有一点距离；在实际的项目中需要一种机制使得开发的软件能够根据运行的CPU的特性动
态的决定调用最优化的实现版本；
在x86CPU上可以使用CPUID指令来得到各种关于当前CPU的特性，包括制造商、CPU家族号、
缓存信息、是否支持MMX/SSE/SSE2指令集等等；
要使用CPUID指令，首先应该判断CPU是否支持该指令；方法是判断EFLAGS寄存器的第21位
是否可以改写；如果可以改写，那么说明这块CPU支持CPUID指令；函数实现如下:

     bool   _CPUSupportCPUID()
    {
         long int CPUIDInfOld = 0 ;
         long int CPUIDInfNew = 0 ;

       try
      {
        asm
        {
            pushfd                    // 保存原 EFLAGS
            pop     eax
            mov     edx,eax
            mov     CPUIDInfOld,eax   //

            xor     eax,00200000h     // 改写第21位
            push    eax
            popfd                     // 改写 EFLAGS

            pushfd                    // 保存新 EFLAGS
            pop     eax
            mov     CPUIDInfNew,eax

            push    edx               // 恢复原 EFLAGS
            popfd
        }
         return (CPUIDInfOld != CPUIDInfNew);   // EFLAGS 第21位可以改写
      }
       catch (...)
      {
      return false ;
      }
    }

//那么判断CPU是否支持MMX指令的函数如下:

     bool   _CPUSupportMMX()   // 判断CPU是否支持MMX指令
    {

       if ( ! _CPUSupportCPUID())
         return false ;

       long int MMXInf = 0 ;

       try
      {
        asm
     {
          push  ebx
          mov   eax, 1
          cpuid
          mov   MMXInf,edx
          pop   ebx
        }
        MMXInf = MMXInf & ( 1 << 23 );   // 检测edx第23位
         return (MMXInf == ( 1 << 23 ));
      }
       catch (...)
      {
         return false ;
      }
    }

//判断CPU是否支持SSE指令的函数如下:

     bool   _CPUSupportSSE()   // 判断CPU是否支持SSE指令
    {

       if ( ! _CPUSupportCPUID())
         return false ;

       long int SSEInf = 0 ;
       try
      {
        asm
     {
          push  ebx
          mov   eax, 1
          cpuid
          mov   SSEInf,edx
          pop   ebx
        }
        SSEInf = SSEInf & ( 1 << 25 );   // 检测edx第25位
         return   (SSEInf == ( 1 << 25 ));
      }
       catch (...)
      {
         return false ;
      }
    }

// 由于SSE的寄存器是比较后期加入的，某些较老的操作系统可能不支持这些寄存器
//的任务切换保存；可以用触发异常的方式来判断操作系统是否支持SSE;

     bool   _SystemSupportSSE()   // 判断操作系统是否支持SSE指令
    {
       // 触发异常来判断
       try
      {
        asm
        {
             // movups     xmm0,xmm0
            asm _emit 0x0F asm _emit 0x10 asm _emit 0xC0
        }
         return true ;
      }
       catch (...)
      {
         return false ;
      }
    }

//定义常量，用以在程序作为分支条件

const bool _IS_MMX_ACTIVE = _CPUSupportMMX();
const bool _IS_SSE_ACTIVE = _CPUSupportSSE() && _SystemSupportSSE();

D.根据运行的CPU支持的指令集来动态调用不同的解码器实现

typedef void ( * TDECODE_YUYV_line_proc)(TARGB32 * pDstLine, const TUInt8 * pYUYV, long width);

const TDECODE_YUYV_line_proc DECODE_YUYV_Auto_line =
        ( _IS_MMX_ACTIVE ? (_IS_SSE_ACTIVE ? DECODE_YUYV_SSE_line : DECODE_YUYV_MMX_line) : DECODE_YUYV_Common_line );

__forceinline void DECODE_filish()
{
     if (_IS_MMX_ACTIVE)
    {
         if (_IS_SSE_ACTIVE) {  asm sfence }
        asm emms
    }
}

void DECODE_YUYV_Auto( const TUInt8 * pYUYV, const TPicRegion & DstPic)
{
    assert((DstPic.width & 1 ) == 0 );

     long YUV_byte_width = (DstPic.width >> 1 ) << 2 ;
    TARGB32 * pDstLine = DstPic.pdata;
     for ( long y = 0 ;y < DstPic.height; ++ y)
    {
        DECODE_YUYV_Auto_line(pDstLine,pYUYV,DstPic.width);
        pYUYV += YUV_byte_width;
        ((TUInt8 *& )pDstLine) += DstPic.byte_width;
    }
    DECODE_filish();
}

在我的两台测试电脑上速度同DECODE_YUYV_SSE，因为它们都支持MMX和SSE;

E.YUYV视频格式解码器的并行化实现
这个比较简单，将图像分为多个块交给多个CPU同时执行就可以了；代码如下:
( 这里利用CWorkThreadPool类来并行执行任务; 参见我的Blog文
章《并行计算简介和多核CPU编程Demo》,里面有CWorkThreadPool类的完整源代码)

#include " WorkThreadPool.h "

struct TDECODE_YUYV_Parallel_WorkData
{
     const TUInt8 * pYUYV;
    TPicRegion    DstPic;
};

void DECODE_YUYV_Parallel_callback( void * wd)
{
    TDECODE_YUYV_Parallel_WorkData * WorkData = (TDECODE_YUYV_Parallel_WorkData * )wd;
    DECODE_YUYV_Auto(WorkData -> pYUYV,WorkData -> DstPic);
}

void DECODE_YUYV_Parallel( const TUInt8 * pYUYV, const TPicRegion & DstPic)
{
     long work_count = CWorkThreadPool::best_work_count();
    std::vector < TDECODE_YUYV_Parallel_WorkData >    work_list(work_count);
    std::vector < TDECODE_YUYV_Parallel_WorkData *>   pwork_list(work_count);
     long cheight = DstPic.height / work_count;
     for ( long i = 0 ;i < work_count; ++ i)
    {
        work_list[i].pYUYV = pYUYV + i * cheight * (DstPic.width * 2 );
        work_list[i].DstPic.pdata = DstPic.pixel_pos( 0 ,cheight * i);
        work_list[i].DstPic.byte_width = DstPic.byte_width;
        work_list[i].DstPic.width = DstPic.width;
        work_list[i].DstPic.height = cheight;
        pwork_list[i] =& work_list[i];
    }
    work_list[work_count - 1 ].DstPic.height = DstPic.height - cheight * (work_count - 1 );
    CWorkThreadPool::work_execute(DECODE_YUYV_Parallel_callback,( void ** ) & pwork_list[ 0 ],work_count);
}

速度测试:
////////////////////////////////////////////////////////////////////////////////
//==============================================================================
//                       |        1024x576       |       1920x1080       |
//------------------------------------------------------------------------------
//                       | AMD64x2 |   Core2   | AMD64x2 |   Core2   |
//------------------------------------------------------------------------------
//DECODE_YUYV_Parallel    1433.9 FPS  1417.1 FPS    414.1 FPS  286.3 FPS
////////////////////////////////////////////////////////////////////////////////

F.另一种更灵活的任务分配方案
我的Blog文章中，涉及到并行的时候，一般都是前面那种简单的平均任务分配模式；
这里再实现一种复杂一点的分配方案：线程执行完自己分配的任务后，尝试帮助其它
线程执行没有完成的任务；(以单行为最小可分配任务粒度)；这有一个优点，就是
在多任务环境下，能够更好地利用全部的CPU资源; 实现如下:

    __forceinline void DECODE_YUYV_AutoLock_line(TARGB32 * pDstLine, const TUInt8 * pYUYV, long width, volatile long *   Lock)
    {
         // 任务领取
         if (( * Lock) != 0 ) return ;
         long lock_value = InterlockedIncrement(Lock); // 也可以用带lock前缀的inc指令来代替这个windows调用
         // 警告: 在以后更多个核的电脑上，这里的lock造成的潜在冲突没有测试过
         if (lock_value >= 2 ) return ;
         // lock_value==1时，任务领取成功

         // 执行任务
        DECODE_YUYV_Auto_line(pDstLine,pYUYV,width);
    }

    __forceinline void DECODE_YUYV_AutoEx( const TUInt8 * pYUYV, const TPicRegion & DstPic, volatile long * LockList, long   begin_y0)
    {
        assert((DstPic.width & 1 ) == 0 );

         long YUV_byte_width = (DstPic.width >> 1 ) << 2 ;
        TARGB32 * pDstLine = DstPic.pdata;
         long y;

         const TUInt8 * pYUYV_b = pYUYV + (YUV_byte_width * begin_y0);
        TARGB32 * pDstLine_b = (TARGB32 * )(((TUInt8 * )DstPic.pdata) + (DstPic.byte_width * begin_y0));
         for (y = begin_y0;y < DstPic.height; ++ y)
        {
            DECODE_YUYV_AutoLock_line(pDstLine_b,pYUYV_b,DstPic.width, & LockList[y]);
            pYUYV_b += YUV_byte_width;
            ((TUInt8 *& )pDstLine_b) += DstPic.byte_width;
        }
         for (y = 0 ;y < begin_y0; ++ y)
        {
            DECODE_YUYV_AutoLock_line(pDstLine,pYUYV,DstPic.width, & LockList[y]);
            pYUYV += YUV_byte_width;
            ((TUInt8 *& )pDstLine) += DstPic.byte_width;
        }
        DECODE_filish();
    }

struct TDECODE_YUYV_ParallelEx_WorkData
{
     const TUInt8 *    pYUYV;
    TPicRegion      DstPic;
     long *            LockList;
     long             begin_y0;
};

void DECODE_YUYV_ParallelEx_callback( void * wd)
{
    TDECODE_YUYV_ParallelEx_WorkData * WorkData = (TDECODE_YUYV_ParallelEx_WorkData * )wd;
    DECODE_YUYV_AutoEx(WorkData -> pYUYV,WorkData -> DstPic,( volatile long * )WorkData -> LockList,WorkData -> begin_y0);
}

void DECODE_YUYV_ParallelEx( const TUInt8 * pYUYV, const TPicRegion & DstPic)
{
     long work_count = CWorkThreadPool::best_work_count();
    std::vector < TDECODE_YUYV_ParallelEx_WorkData >    work_list(work_count);
    std::vector < TDECODE_YUYV_ParallelEx_WorkData *>   pwork_list(work_count);
    std::vector < long >   lock_list(DstPic.height);
     for ( long y = 0 ;y < DstPic.height; ++ y)
        lock_list[y] = 0 ;

     long cheight = DstPic.height / work_count;
     for ( long i = 0 ;i < work_count; ++ i)
    {
        work_list[i].pYUYV = pYUYV;
        work_list[i].DstPic = DstPic;
        work_list[i].begin_y0 = i * cheight;
        work_list[i].LockList =& lock_list[ 0 ];
        pwork_list[i] =& work_list[i];
    }
    CWorkThreadPool::work_execute(DECODE_YUYV_ParallelEx_callback,( void ** ) & pwork_list[ 0 ],work_count);
}

速度测试:
////////////////////////////////////////////////////////////////////////////////
//==============================================================================
//                       |        1024x576       |       1920x1080       |
//------------------------------------------------------------------------------
//                       | AMD64x2 |   Core2   | AMD64x2 |   Core2   |
//------------------------------------------------------------------------------
//DECODE_YUYV_ParallelEx 1387.5 FPS   1359.2 FPS    409.9 FPS  287.4 FPS
////////////////////////////////////////////////////////////////////////////////

G:把测试成绩放在一起

////////////////////////////////////////////////////////////////////////////////
//测试平台:(CPU:AMD64x2 4200+(2.37G);   内存:DDR2 677(双通道); 编译器:VC2005)
//测试平台:(CPU:Intel Core2 4400(2.00G);内存:DDR2 667(双通道); 编译器:VC2005)
////////////////////////////////////////////////////////////////////////////////
//==============================================================================
//                       |        1024x576       |       1920x1080       |
//------------------------------------------------------------------------------
//                       | AMD64x2 |   Core2   | AMD64x2 |   Core2   |
//------------------------------------------------------------------------------
//DECODE_YUYV_Float         55.0 FPS   63.7 FPS     15.6 FPS   18.0 FPS
//DECODE_YUYV_Int          137.1 FPS 131.9 FPS     39.0 FPS   37.1 FPS
//DECODE_YUYV_RGBTable     164.8 FPS 152.9 FPS     47.1 FPS   43.7 FPS
//DECODE_YUYV_Table        146.1 FPS 151.3 FPS     41.8 FPS   43.5 FPS
//DECODE_YUYV_TableEx      236.5 FPS 300.5 FPS     68.1 FPS   85.0 FPS
//DECODE_YUYV_Common       250.7 FPS 287.1 FPS     71.9 FPS   80.7 FPS
//DECODE_YUYV_MMX          585.4 FPS  569.8 FPS    169.8 FPS 160.4 FPS
//DECODE_YUYV_SSE          770.3 FPS  741.9 FPS    220.0 FPS 209.7 FPS
//DECODE_YUYV_Auto                    (同DECODE_YUYV_SSE)
//DECODE_YUYV_Parallel    1433.9 FPS 1417.1 FPS    414.1 FPS 286.3 FPS
//DECODE_YUYV_ParallelEx 1387.5 FPS 1359.2 FPS    409.9 FPS  287.4 FPS
////////////////////////////////////////////////////////////////////////////////

(欢迎提出不足和改进意见；文章下篇将开始支持更多类型的YUV视频数据格式)

你可能感兴趣的:(优化,list,vector,测试,byte,parallel)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
WPF中的ComboBox控件几种数据绑定的方式互联网打工人no1 wpf c#
一、用字典给ItemsSource赋值（此绑定用的地方很多，建议熟练掌握）在XMAL中：在CS文件中privatevoidBindData(){DictionarydicItem=newDictionary();dicItem.add(1,"北京");dicItem.add(2,"上海");dicItem.add(3,"广州");cmb_list.ItemsSource=dicItem;cmb_l
网易严选官方旗舰店，优质商品，卓越服务高省_飞智666600
网易严选官方旗舰店是网易旗下的一家电商平台，以提供优质商品和卓越服务而闻名。作为一名SEO优化师，我将为您详细介绍网易严选官方旗舰店，并重点强调其特点和优势。大家好！我是高省APP最大团队&联合创始人飞智导师。相较于其他返利app，高省APP的佣金更高，模式更好，最重要的是，终端用户不会流失！高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
398顺境，逆境戴骁勇
2018.11.27周二雾霾最近儿子进入了一段顺境期，今天表现尤其不错。今天的数学测试成绩喜人，没有出现以往的计算错误，整个卷面书写工整，附加题也在规定时间内完成且做对。为迎接体育测试的锻炼有了质的飞跃。坐位体前屈成绩突飞猛进，估测成绩能达到12cm，这和上次测试的零分来比，简直是逆袭。儿子还在不断锻炼和提升，唯恐到时候掉链子。跑步姿势在我的调教下，逐渐正规起来，速度随之也有了提升。今晚测试的50
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
SpringBlade dict-biz/list 接口 SQL 注入漏洞文章永久免费只为良心 oracle 数据库
SpringBladedict-biz/list接口SQL注入漏洞POC:构造请求包查看返回包你的网址/api/blade-system/dict-biz/list?updatexml(1,concat(0x7e,md5(1),0x7e),1)=1漏洞概述在SpringBlade框架中，如果dict-biz/list接口的后台处理逻辑没有正确地对用户输入进行过滤或参数化查询（PreparedSta
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
python中的深拷贝与浅拷贝 anshejd70787 python
深拷贝和浅拷贝浅拷贝的时候，修改原来的对象，浅拷贝的对象不会发生改变。1、对象的赋值对象的赋值实际上是对象之间的引用：当创建一个对象，然后将这个对象赋值给另外一个变量的时候，python并没有拷贝这个对象，而只是拷贝了这个对象的引用。当对对象做赋值或者是参数传递或者作为返回值的时候，总是传递原始对象的引用，而不是一个副本。如下所示：>>>aList=["kel","abc",123]>>>bLis
2024.8.22 Python，链表两数之和，链表快速反转，二叉树的深度，二叉树前中后序遍历，N叉树递归遍历，翻转二叉树 RaidenQ python 链表开发语言
1.链表两数之和输入：l1=[2,4,3],l2=[5,6,4]输出：[7,0,8]解释：342+465=807.示例2：输入：l1=[0],l2=[0]输出：[0]示例3：输入：l1=[9,9,9,9,9,9,9],l2=[9,9,9,9]输出：[8,9,9,9,0,0,0,1]昨天的这个题，用自己的办法写的麻烦的要死，然后刚才一看chat归类的办法，感觉自己像个智障。classListNode
第1步win10宿主机与虚拟机通过NAT共享上网互通学习3人组大数据大数据
VM的CentOS采用NAT共用宿主机网卡宿主机器无法连接到虚拟CentOS要实现宿主机与虚拟机通信，原理就是给宿主机的网卡配置一个与虚拟机网关相同网段的IP地址，实现可以互通。1、查看虚拟机的IP地址2、编辑虚拟机的虚拟网络的NAT和DHCP的配置，设置虚拟机的网卡选择NAT共享模式3、宿主机的IP配置，确保vnet8的IPV4属性与虚拟机在同一网段4、ping测试连通性[root@localh
系统架构设计师需求分析篇二 AmHardy 软件架构设计师系统架构需求分析面向对象分析分析模型 UML和SysML
面向对象分析方法1.用例模型构建用例模型一般需要经历4个阶段：识别参与者：识别与系统交互的所有事物。合并需求获得用例：将需求分配给予其相关的参与者。细化用例描述：详细描述每个用例的功能。调整用例模型：优化用例之间的关系和结构，前三个阶段是必需的。2.用例图的三元素参与者：使用系统的用户或其他外部系统和设备。用例：系统所提供的服务。通信关联：参与者和用例之间的关系，或用例与用例之间的关系。3.识别参
spring如何整合druid连接池？惜.己 spring spring junit 数据库 java idea 后端 xml
目录spring整合druid连接池1.新建maven项目2.新建mavenModule3.导入相关依赖4.配置log4j2.xml5.配置druid.xml1)xml中如何引入properties2)下面是配置文件6.准备jdbc.propertiesJDBC配置项解释7.配置druid8.测试spring整合druid连接池1.新建maven项目打开IDE（比如IntelliJIDEA,Ecl
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
Python神器！WEB自动化测试集成工具 DrissionPage 亚丁号 python 开发语言
一、前言用requests做数据采集面对要登录的网站时，要分析数据包、JS源码，构造复杂的请求，往往还要应付验证码、JS混淆、签名参数等反爬手段，门槛较高。若数据是由JS计算生成的，还须重现计算过程，体验不好，开发效率不高。使用浏览器，可以很大程度上绕过这些坑，但浏览器运行效率不高。因此，这个库设计初衷，是将它们合而为一，能够在不同须要时切换相应模式，并提供一种人性化的使用方法，提高开发和运行效率
matlab mle 优化,MLE+: Matlab Toolbox for Integrated Modeling, Control and Optimization for Buildings... Simon Zhong matlab mle 优化
摘要：FollowingunilateralopticnervesectioninadultPVGhoodedrat,theaxonguidancecueephrin-A2isup-regulatedincaudalbutnotrostralsuperiorcolliculus(SC)andtheEphA5receptorisdown-regulatedinaxotomisedretinalgan
Vue中table合并单元格用法 weixin_30613343 javascript ViewUI
地名结果人名性别{{item.name}}已完成未完成{{item.groups[0].name}}{{item.groups[0].sex}}{{item.groups[son].name}}{{item.groups[son].sex}}exportdefault{data(){return{list:[{name:'地名1',result:'1',groups:[{name:'张三',sex
Android应用性能优化轻口味 Android
Android手机由于其本身的后台机制和硬件特点，性能上一直被诟病，所以软件开发者对软件本身的性能优化就显得尤为重要；本文将对Android开发过程中性能优化的各个方面做一个回顾与总结。Cache优化ListView缓存：ListView中有一个回收器，Item滑出界面的时候View会回收到这里，需要显示新的Item的时候，就尽量重用回收器里面的View；每次在getView函数中inflate新
tiff批量转png 诺有缸的高飞鸟 opencv 图像处理 python opencv 图像处理
目录写在前面代码完写在前面1、本文内容tiff批量转png2、平台/环境opencv,python3、转载请注明出处：https://blog.csdn.net/qq_41102371/article/details/132975023代码importnumpyasnpimportcv2importosdeffindAllFile(base):file_list=[]forroot,ds,fsin
《 C++ 修炼全景指南：九》打破编程瓶颈！掌握二叉搜索树的高效实现与技巧 Lenyiin C++修炼全景指南技术指南 c++算法 stl
摘要本文详细探讨了二叉搜索树（BinarySearchTree,BST）的核心概念和技术细节，包括插入、查找、删除、遍历等基本操作，并结合实际代码演示了如何实现这些功能。文章深入分析了二叉搜索树的性能优势及其时间复杂度，同时介绍了前驱、后继的查找方法等高级功能。通过自定义实现的二叉搜索树类，读者能够掌握其实际应用，此外，文章还建议进一步扩展为平衡树（如AVL树、红黑树）以优化极端情况下的性能退化。
【Python搞定车载自动化测试】——Python实现车载以太网DoIP刷写（含Python源码）疯狂的机器人 Python搞定车载自动化 python DoIP UDS ISO 14229 1SO 13400 Bootloader tcp/ip
系列文章目录【Python搞定车载自动化测试】系列文章目录汇总文章目录系列文章目录前言一、环境搭建1.软件环境2.硬件环境二、目录结构三、源码展示1.DoIP诊断基础函数方法2.DoIP诊断业务函数方法3.27服务安全解锁4.DoIP自动化刷写四、测试日志1.测试日志五、完整源码链接前言随着智能电动汽车行业的发展，汽车=智能终端+四个轮子，各家车企都推出了各自的OTA升级方案，本章节主要介绍如何使
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
Python 课程10-单元测试可愛小吉 Python教學 python 单元测试开发语言 TDD unittest
前言在现代软件开发中，单元测试已成为一种必不可少的实践。通过测试，我们可以确保每个功能模块在开发和修改过程中按预期工作，从而减少软件缺陷，提高代码质量。而测试驱动开发（TDD）则进一步将测试作为开发的核心部分，先编写测试，再编写代码，以测试为指导开发出更稳定、更可靠的代码。Python提供了强大的unittest模块，它是Python标准库的一部分，专门用于编写和执行单元测试。与其他测试框架相比，
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l

YUV视频格式到RGB32格式转换的速度优化 中篇

你可能感兴趣的:(优化,list,vector,测试,byte,parallel)

YUV视频格式到RGB32格式转换的速度优化中篇