housisong

YUV视频格式到RGB32格式转换的速度优化中篇

                  YUV视频格式到RGB32格式转换的速度优化中篇
                    [email protected]   2007.11.05

tag: YUV,YCbCr,YUV到RGB颜色转换,YUV解码,VFW,视频,MMX,SSE,多核优化

摘要: 我们得到的很多视频数据(一些解码器的输出或者摄像头的输出等)都使用了一种
叫YUV的颜色格式；本文介绍了常见的YUV视频格式(YUY2/YVYU/UYVY/I420/YV12等)到
RGB颜色格式的转换,并尝试对转化的速度进行优化；
全文分为:
    《上篇》文章首先介绍了YUV颜色格式，并介绍了YUV颜色格式和RGB颜色格式之
间的相互转换；然后重点介绍了YUYV视频格式到RGB32格式的转化，并尝试进行了一
些速度优化；
    《中篇》尝试使用MMX/SSE指令对前面实现的解码器核心进行速度优化；然
后简要介绍了一个使用这类CPU特殊指令时的代码框架，使得解码程序能够根据运行时
的CPU指令支持情况动态调用最佳的实现代码；并最终提供一个多核并行的优化版本；
    《下篇》介绍YUV类型的其他种类繁多的视频数据编码格式；并将前面实现的解码
器核心(在不损失代码速度的前提下)进行必要的修改，使之适用于这些YUV视频格式
的解码；

    (2007.11.25 优化了一下DECODE_YUYV_SSE，使用预读优化;调整了一下MMX指令的定义方式，结构更好一些)
    (2007.11.13 修正了一下颜色转换公式中的系数)
    (2007.11.05 修改函数DECODE_YUYV_AutoEx中的一个bug)

正文:
代码使用C++,编译器:VC2005
涉及到汇编的时候假定为x86平台；
现在的高清视频帧尺寸越来越大，所以本文测试的图片大小将使用1024x576和
1920x1080两种常见的帧尺寸来测试解码器速度；
测试平台:(CPU:AMD64x2 4200+(2.37G);   内存:DDR2 677(双通道); 编译器:VC2005)
测试平台:(CPU:Intel Core2 4400(2.00G);内存:DDR2 667(双通道); 编译器:VC2005)

请先参看《YUV视频格式到RGB32格式转换的速度优化上篇》，
本文章将继续成倍的提高其速度!


A:使用MMX指令来继续优化YUYV视频格式到RGB32格式的转换函数
现在绝大多数的x86CPU都支持MMX指令，它是一种单指令多数据流的指令集(SIMD)；
MMX指令能够同时操作8个byte或者4个short等; 在YUV转换到RGB的运算中,为了保持精
度选用一次运算4个short数据类型；那外考虑如果在一个寄存器中保存YUYV四个数据，
整个运算写起来会较麻烦，且算法受到Y、U、V三个颜色存放位置的影响严重；而且考
虑到除了packed模式外很多YUV视频数据都为planar模式，所以想把Y、U、V先分离到
各自的寄存器再运算，看起来舒服得多，那么运算核心将用一个寄存器保存4个U，一
个寄存器保存4个V，对应8个Y，也就是说核心转换代码运行一遍可以输出8个RGB32比
特颜色；
所以我们先来实现一个通用的MMX实现的转换核心：
我们约定输入:
        mm0 = Y7 Y6 Y5 Y4 Y3 Y2 Y1 Y0
        mm1 = 00 u3 00 u2 00 u1 00 u0
        mm2 = 00 v3 00 v2 00 v1 00 v0
通过edx指向的内存输出:
        [edx -- edx+8*4]

由于主要的计算使用short精度，那些系数就不能使用16位的定点数了；为了不超出short的
范围可以使用13位的定点数(再大就会溢出了)；

MMX实现的转换核心(使用了宏来实现)：YUV422ToRGB32_MMX:
(系数的由来/数据在MMX寄存器的大致流动都有较详细的注释；
如果有人进一步改进了这个核心,请告诉我:)

typedef unsigned __int64  UInt64;

const  UInt64   csMMX_16_b      = 0x1010101010101010; // byte{16,16,16,16,16,16,16,16}
const  UInt64   csMMX_128_w     = 0x0080008000800080; //short{  128,  128,  128,  128}
const  UInt64   csMMX_0x00FF_w  = 0x00FF00FF00FF00FF; //掩码
const  UInt64   csMMX_Y_coeff_w = 0x2543254325432543; //short{ 9539, 9539, 9539, 9539} =1.164383*(1<<13)
const  UInt64   csMMX_U_blue_w  = 0x408D408D408D408D; //short{16525,16525,16525,16525} =2.017232*(1<<13)
const  UInt64   csMMX_U_green_w = 0xF377F377F377F377; //short{-3209,-3209,-3209,-3209} =(-0.391762)*(1<<13)
const  UInt64   csMMX_V_green_w = 0xE5FCE5FCE5FCE5FC; //short{-6660,-6660,-6660,-6660} =(-0.812968)*(1<<13)
const  UInt64   csMMX_V_red_w   = 0x3313331333133313; // short{13075,13075,13075,13075} =1.596027*(1<<13)

//一次处理8个颜色输出
#define YUV422ToRGB32_MMX(out_RGB_reg,WriteCode)                                                 /
    /*input :  mm0 = Y7 Y6 Y5 Y4 Y3 Y2 Y1 Y0    */                                                 /
   /*         mm1 = 00 u3 00 u2 00 u1 00 u0    */                                                 /
   /*         mm2 = 00 v3 00 v2 00 v1 00 v0    */                                                 /
   /*output : [out_RGB_reg -- out_RGB_reg+8*4]                 */                                 /
                                                                                                 /
          asm   psubusb     mm0,csMMX_16_b        /* mm0 : Y -= 16                       */       /
          asm   psubsw      mm1,csMMX_128_w       /* mm1 : u -= 128                      */       /
          asm   movq        mm7,mm0                                                              /
          asm   psubsw      mm2,csMMX_128_w       /* mm2 : v -= 128                      */       /
          asm   pand        mm0,csMMX_0x00FF_w    /* mm0 = 00 Y6 00 Y4 00 Y2 00 Y0       */       /
          asm   psllw       mm1,3                 /* mm1 : u *= 8                        */       /
          asm   psllw       mm2,3                 /* mm2 : v *= 8                        */       /
          asm   psrlw       mm7,8                 /* mm7 = 00 Y7 00 Y5 00 Y3 00 Y1       */       /
          asm   movq        mm3,mm1                                                              /
          asm   movq        mm4,mm2                                                              /
                                                                                                 /
          asm   pmulhw      mm1,csMMX_U_green_w   /* mm1 = u * U_green                   */       /
          asm   psllw       mm0,3                 /* y*=8                                */       /
          asm   pmulhw      mm2,csMMX_V_green_w   /* mm2 = v * V_green                   */       /
          asm   psllw       mm7,3                 /* y*=8                                */       /
          asm   pmulhw      mm3,csMMX_U_blue_w                                                   /
          asm   paddsw      mm1,mm2                                                              /
          asm   pmulhw      mm4,csMMX_V_red_w                                                    /
          asm   movq        mm2,mm3                                                              /
          asm   pmulhw      mm0,csMMX_Y_coeff_w                                                  /
          asm   movq        mm6,mm4                                                              /
          asm   pmulhw      mm7,csMMX_Y_coeff_w                                                  /
          asm   movq        mm5,mm1                                                              /
          asm   paddsw      mm3,mm0               /* mm3 = B6 B4 B2 B0       */                   /
          asm   paddsw      mm2,mm7               /* mm2 = B7 B5 B3 B1       */                   /
          asm   paddsw      mm4,mm0               /* mm4 = R6 R4 R2 R0       */                   /
          asm   paddsw      mm6,mm7               /* mm6 = R7 R5 R3 R1       */                   /
          asm   paddsw      mm1,mm0               /* mm1 = G6 G4 G2 G0       */                   /
          asm   paddsw      mm5,mm7               /* mm5 = G7 G5 G3 G1       */                   /
                                                                                                 /
          asm   packuswb    mm3,mm4               /* mm3 = R6 R4 R2 R0 B6 B4 B2 B0 to [0-255] */ /
          asm   packuswb    mm2,mm6               /* mm2 = R7 R5 R3 R1 B7 B5 B3 B1 to [0-255] */ /
          asm   packuswb    mm5,mm1               /* mm5 = G6 G4 G2 G0 G7 G5 G3 G1 to [0-255] */ /
          asm   movq        mm4,mm3                                                              /
          asm   punpcklbw   mm3,mm2               /* mm3 = B7 B6 B5 B4 B3 B2 B1 B0     */         /
          asm   punpckldq   mm1,mm5               /* mm1 = G7 G5 G3 G1 xx xx xx xx     */         /
          asm   punpckhbw   mm4,mm2               /* mm4 = R7 R6 R5 R4 R3 R2 R1 R0     */         /
          asm   punpckhbw   mm5,mm1               /* mm5 = G7 G6 G5 G4 G3 G2 G1 G0     */         /
                                                                                                 /
                /*out*/                                                                           /
          asm   pcmpeqb     mm2,mm2               /* mm2 = FF FF FF FF FF FF FF FF     */         /
                                                                                                 /
          asm   movq        mm0,mm3                                                              /
          asm   movq        mm7,mm4                                                              /
          asm   punpcklbw   mm0,mm5             /* mm0 = G3 B3 G2 B2 G1 B1 G0 B0       */         /
          asm   punpcklbw   mm7,mm2             /* mm7 = FF R3 FF R2 FF R1 FF R0       */         /
          asm   movq        mm1,mm0                                                              /
          asm   movq        mm6,mm3                                                              /
          asm   punpcklwd   mm0,mm7             /* mm0 = FF R1 G1 B1 FF R0 G0 B0       */         /
          asm   punpckhwd   mm1,mm7             /* mm1 = FF R3 G3 B3 FF R2 G2 B2       */         /
          asm   WriteCode   [out_RGB_reg],mm0                                                    /
          asm   movq        mm7,mm4                                                              /
          asm   punpckhbw   mm6,mm5             /* mm6 = G7 B7 G6 B6 G5 B5 G4 B4       */         /
          asm   WriteCode   [out_RGB_reg+8 ],mm1                                                  /
          asm   punpckhbw   mm7,mm2             /* mm7 = FF R7 FF R6 FF R5 FF R4      */          /
          asm   movq        mm0,mm6                                                              /
          asm   punpcklwd   mm6,mm7             /* mm6 = FF R5 G5 B5 FF R4 G4 B4      */          /
          asm   punpckhwd   mm0,mm7             /* mm0 = FF R7 G7 B7 FF R6 G6 B6      */          /
          asm   WriteCode  [out_RGB_reg+8*2 ],mm6                                                 /
          asm   WriteCode  [out_RGB_reg+8*3 ],mm0

YUV视频格式到RGB32格式的转换函数，MMX指令实现版本

    #define YUYV_Loader_MMX(in_yuv_reg)                                                         /
          asm   movq        mm0,[in_yuv_reg  ] /*mm0=V1 Y3 U1 Y2 V0 Y1 U0 Y0  */                 /
          asm   movq        mm4,[in_yuv_reg+8] /*mm4=V3 Y7 U3 Y6 V2 Y5 U2 Y4  */                 /
          asm   movq        mm1,mm0                                                             /
          asm   movq        mm5,mm4                                                             /
          asm   psrlw       mm1,8              /*mm1=00 V1 00 U1 00 V0 00 U0  */                 /
          asm   psrlw       mm5,8              /*mm5=00 V3 00 U3 00 V2 00 U2  */                 /
          asm   pand        mm0,csMMX_0x00FF_w /*mm0=00 Y3 00 Y2 00 Y1 00 Y0  */                 /
          asm   pand        mm4,csMMX_0x00FF_w /*mm4=00 Y7 00 Y6 00 Y5 00 Y4  */                 /
          asm   packuswb    mm1,mm5            /*mm1=V3 U3 V2 U2 V1 U1 V0 U0  */                 /
          asm   movq        mm2,mm1                                                             /
          asm   packuswb    mm0,mm4            /*mm0=Y7 Y6 Y5 Y4 Y3 Y2 Y1 Y0  */                 /
          asm   psllw       mm1,8              /*mm1=U3 00 U2 00 U1 00 U0 00  */                 /
          asm   psrlw       mm2,8              /*mm2=00 V3 00 V2 00 V1 00 V0  */                 /
          asm   psrlw       mm1,8              /*mm1=00 U3 00 U2 00 U1 00 U0  */


    void DECODE_YUYV_MMX_line(TARGB32* pDstLine,const TUInt8* pYUYV,long width)
    {
        long expand8_width=(width>>3)<<3 ;

        if (expand8_width>0 )
        {
            asm
            {
                mov     ecx,expand8_width
                mov     eax,pYUYV
                mov     edx,pDstLine
                lea     eax,[eax+ecx*2 ]
                lea     edx,[edx+ecx*4 ]
                neg     ecx

              loop_beign:
                YUYV_Loader_MMX(eax+ecx*2 )
                YUV422ToRGB32_MMX(edx+ecx*4 ,movq)

                add     ecx,8
                jnz     loop_beign

                mov     pYUYV,eax
                mov     pDstLine,edx
            }
        }

         //处理边界
        DECODE_YUYV_Common_line(pDstLine,pYUYV,width- expand8_width);
    }

void DECODE_YUYV_MMX(const TUInt8* pYUYV,const TPicRegion& DstPic)
{
    assert((DstPic.width & 1)==0 );

    long YUV_byte_width=(DstPic.width>>1)<<2 ;
    TARGB32* pDstLine= DstPic.pdata;
    for (long y=0;y<DstPic.height;++ y)
    {
        DECODE_YUYV_MMX_line(pDstLine,pYUYV,DstPic.width);
        pYUYV+= YUV_byte_width;
        ((TUInt8*&)pDstLine)+= DstPic.byte_width;
    }
    asm emms
}

B.使用SSE中的软件预取和禁止写缓存来改进MMX版本

这里的改动其实很小，只是把YUV422ToRGB32_MMX中颜色数据保存操作
movq [mem],mmx_reg 修改成 movntq [mem],mmx_reg
然后再处理完成后调用sfence缓存刷新指令。
完整代码如下:

    //使用软件预读和禁止写缓存优化
    #define  YUV422ToRGB32_SSE(out_RGB_reg) YUV422ToRGB32_MMX(out_RGB_reg,movntq)

     void DECODE_YUYV_SSE_line(TARGB32* pDstLine,const TUInt8* pYUYV,long width)
    {
        long expand8_width=(width>>3)<<3 ;

        if (expand8_width>0 )
        {
            asm
            {
                mov     ecx,expand8_width
                mov     eax,pYUYV
                mov     edx,pDstLine
                lea     eax,[eax+ecx*2 ]
                lea     edx,[edx+ecx*4 ]
                neg     ecx

              loop_beign:
                YUYV_Loader_MMX(eax+ecx*2 )
                prefetchnta [eax+ecx*2+64*4]  //预读
                YUV422ToRGB32_SSE(edx+ecx*4 )

                add     ecx,8
                jnz     loop_beign

                mov     pYUYV,eax
                mov     pDstLine,edx
            }
        }

         //处理边界
        DECODE_YUYV_Common_line(pDstLine,pYUYV,width- expand8_width);
    }

void DECODE_YUYV_SSE(const TUInt8* pYUYV,const TPicRegion& DstPic)
{
    assert((DstPic.width & 1)==0 );

    long YUV_byte_width=(DstPic.width>>1)<<2 ;
    TARGB32* pDstLine= DstPic.pdata;
    for (long y=0;y<DstPic.height;++ y)
    {
        DECODE_YUYV_SSE_line(pDstLine,pYUYV,DstPic.width);
        pYUYV+= YUV_byte_width;
        ((TUInt8*&)pDstLine)+= DstPic.byte_width;
    }
    asm sfence
    asm emms
}

C.使用CPU特殊指令的一般框架
我的blog文章中，经常使用MMX/SSE等特殊指令，都是只给出代码实现；它们离实际项目代
码还有一点距离；在实际的项目中需要一种机制使得开发的软件能够根据运行的CPU的特性动
态的决定调用最优化的实现版本；
在x86CPU上可以使用CPUID指令来得到各种关于当前CPU的特性，包括制造商、CPU家族号、
缓存信息、是否支持MMX/SSE/SSE2指令集等等；
要使用CPUID指令，首先应该判断CPU是否支持该指令；方法是判断EFLAGS寄存器的第21位
是否可以改写；如果可以改写，那么说明这块CPU支持CPUID指令；函数实现如下:

    bool   _CPUSupportCPUID()
    {
        long int CPUIDInfOld=0 ;
        long int CPUIDInfNew=0 ;

      try
      {
        asm
        {
            pushfd                    // 保存原 EFLAGS
            pop     eax
            mov     edx,eax
            mov     CPUIDInfOld,eax   //

            xor     eax,00200000h     // 改写第21位
            push    eax
            popfd                    // 改写 EFLAGS

            pushfd                    // 保存新 EFLAGS
            pop     eax
            mov     CPUIDInfNew,eax

            push    edx              // 恢复原 EFLAGS
            popfd
        }
        return (CPUIDInfOld!=CPUIDInfNew);  // EFLAGS 第21位可以改写
      }
      catch (...)
      {
     return false ;
      }
    }

//那么判断CPU是否支持MMX指令的函数如下:

    bool  _CPUSupportMMX()  //判断CPU是否支持MMX指令
    {

      if (! _CPUSupportCPUID())
        return false ;

      long int MMXInf=0 ;

      try
      {
        asm
     {
          push  ebx
          mov   eax, 1
          cpuid
          mov   MMXInf,edx
          pop   ebx
        }
        MMXInf =MMXInf & (1 << 23);  //检测edx第23位
        return (MMXInf==(1 << 23 ));
      }
      catch (...)
      {
        return false ;
      }
    }

//判断CPU是否支持SSE指令的函数如下:

    bool  _CPUSupportSSE()  //判断CPU是否支持SSE指令
    {

      if (! _CPUSupportCPUID())
        return false ;

      long int SSEInf=0 ;
      try
      {
        asm
     {
          push  ebx
          mov   eax, 1
          cpuid
          mov   SSEInf,edx
          pop   ebx
        }
        SSEInf =SSEInf & (1 << 25);  //检测edx第25位
        return  (SSEInf==(1 << 25 ));
      }
      catch (...)
      {
        return false ;
      }
    }

// 由于SSE的寄存器是比较后期加入的，某些较老的操作系统可能不支持这些寄存器
//的任务切换保存；可以用触发异常的方式来判断操作系统是否支持SSE;

    bool  _SystemSupportSSE()  //判断操作系统是否支持SSE指令
    {
      //触发异常来判断
      try
      {
        asm
        {
             //movups     xmm0,xmm0
            asm _emit 0x0F asm _emit 0x10 asm _emit 0xC0
        }
         return true ;
      }
      catch (...)
      {
        return false ;
      }
    }

//定义常量，用以在程序作为分支条件

const bool _IS_MMX_ACTIVE= _CPUSupportMMX();
const bool _IS_SSE_ACTIVE=_CPUSupportSSE() && _SystemSupportSSE();

D.根据运行的CPU支持的指令集来动态调用不同的解码器实现

typedef void (*TDECODE_YUYV_line_proc)(TARGB32* pDstLine,const TUInt8* pYUYV,long width);

const TDECODE_YUYV_line_proc DECODE_YUYV_Auto_line=
        ( _IS_MMX_ACTIVE ? (_IS_SSE_ACTIVE ? DECODE_YUYV_SSE_line : DECODE_YUYV_MMX_line) : DECODE_YUYV_Common_line );

__forceinline void DECODE_filish()
{
    if (_IS_MMX_ACTIVE)
    {
        if (_IS_SSE_ACTIVE) {  asm sfence }
        asm emms
    }
}

void DECODE_YUYV_Auto(const TUInt8* pYUYV,const TPicRegion& DstPic)
{
    assert((DstPic.width & 1)==0 );

    long YUV_byte_width=(DstPic.width>>1)<<2 ;
    TARGB32* pDstLine= DstPic.pdata;
    for (long y=0;y<DstPic.height;++ y)
    {
        DECODE_YUYV_Auto_line(pDstLine,pYUYV,DstPic.width);
        pYUYV+= YUV_byte_width;
        ((TUInt8*&)pDstLine)+= DstPic.byte_width;
    }
    DECODE_filish();
}

在我的两台测试电脑上速度同DECODE_YUYV_SSE，因为它们都支持MMX和SSE;

E.YUYV视频格式解码器的并行化实现
这个比较简单，将图像分为多个块交给多个CPU同时执行就可以了；代码如下:
( 这里利用CWorkThreadPool类来并行执行任务; 参见我的Blog文
章《并行计算简介和多核CPU编程Demo》,里面有CWorkThreadPool类的完整源代码)

#include "WorkThreadPool.h"

struct TDECODE_YUYV_Parallel_WorkData
{
    const TUInt8* pYUYV;
    TPicRegion    DstPic;
};

void DECODE_YUYV_Parallel_callback(void* wd)
{
    TDECODE_YUYV_Parallel_WorkData* WorkData=(TDECODE_YUYV_Parallel_WorkData* )wd;
    DECODE_YUYV_Auto(WorkData->pYUYV,WorkData-> DstPic);
}

void DECODE_YUYV_Parallel(const TUInt8* pYUYV,const TPicRegion& DstPic)
{
    long work_count= CWorkThreadPool::best_work_count();
    std::vector<TDECODE_YUYV_Parallel_WorkData>    work_list(work_count);
    std::vector<TDECODE_YUYV_Parallel_WorkData*>   pwork_list(work_count);
    long cheight=DstPic.height / work_count;
    for (long i=0;i<work_count;++ i)
    {
        work_list[i].pYUYV=pYUYV+i*cheight*(DstPic.width*2 );
        work_list[i].DstPic.pdata=DstPic.pixel_pos(0,cheight* i);
        work_list[i].DstPic.byte_width= DstPic.byte_width;
        work_list[i].DstPic.width= DstPic.width;
        work_list[i].DstPic.height= cheight;
        pwork_list[i]=& work_list[i];
    }
    work_list[work_count-1].DstPic.height=DstPic.height-cheight*(work_count-1 );
    CWorkThreadPool::work_execute(DECODE_YUYV_Parallel_callback,(void**)&pwork_list[0 ],work_count);
}

F.另一种更灵活的任务分配方案
我的Blog文章中，涉及到并行的时候，一般都是前面那种简单的平均任务分配模式；
这里再实现一种复杂一点的分配方案：线程执行完自己分配的任务后，尝试帮助其它
线程执行没有完成的任务；(以单行为最小可分配任务粒度)；这有一个优点，就是
在多任务环境下，能够更好地利用全部的CPU资源; 实现如下:

    __forceinline void DECODE_YUYV_AutoLock_line(TARGB32* pDstLine,const TUInt8* pYUYV,long width,volatile long*   Lock)
    {
        //任务领取
        if ((*Lock)!=0) return ;
        long lock_value=InterlockedIncrement(Lock);// 也可以用带lock前缀的inc指令来代替这个windows调用
        //警告: 在以后更多个核的电脑上，这里的lock造成的潜在冲突没有测试过
        if (lock_value>=2) return ;
        // lock_value==1时，任务领取成功

        //执行任务
        DECODE_YUYV_Auto_line(pDstLine,pYUYV,width);
    }

    __forceinline void DECODE_YUYV_AutoEx(const TUInt8* pYUYV,const TPicRegion& DstPic,volatile long* LockList,long   begin_y0)
    {
        assert((DstPic.width & 1)==0 );

        long YUV_byte_width=(DstPic.width>>1)<<2 ;
        TARGB32* pDstLine= DstPic.pdata;
        long y;

        const TUInt8* pYUYV_b=pYUYV+(YUV_byte_width* begin_y0);
        TARGB32* pDstLine_b=(TARGB32*)(((TUInt8*)DstPic.pdata)+(DstPic.byte_width* begin_y0));
        for (y=begin_y0;y<DstPic.height;++ y)
        {
            DECODE_YUYV_AutoLock_line(pDstLine_b,pYUYV_b,DstPic.width,& LockList[y]);
            pYUYV_b+= YUV_byte_width;
            ((TUInt8*&)pDstLine_b)+= DstPic.byte_width;
        }
        for (y=0;y<begin_y0;++ y)
        {
            DECODE_YUYV_AutoLock_line(pDstLine,pYUYV,DstPic.width,& LockList[y]);
            pYUYV+= YUV_byte_width;
            ((TUInt8*&)pDstLine)+= DstPic.byte_width;
        }
        DECODE_filish();
    }

struct TDECODE_YUYV_ParallelEx_WorkData
{
    const TUInt8*    pYUYV;
    TPicRegion      DstPic;
    long*            LockList;
    long             begin_y0;
};

void DECODE_YUYV_ParallelEx_callback(void* wd)
{
    TDECODE_YUYV_ParallelEx_WorkData* WorkData=(TDECODE_YUYV_ParallelEx_WorkData* )wd;
    DECODE_YUYV_AutoEx(WorkData->pYUYV,WorkData->DstPic,(volatile long*)WorkData->LockList,WorkData-> begin_y0);
}

void DECODE_YUYV_ParallelEx(const TUInt8* pYUYV,const TPicRegion& DstPic)
{
    long work_count= CWorkThreadPool::best_work_count();
    std::vector<TDECODE_YUYV_ParallelEx_WorkData>    work_list(work_count);
    std::vector<TDECODE_YUYV_ParallelEx_WorkData*>   pwork_list(work_count);
    std::vector<long>   lock_list(DstPic.height);
    for (long y=0;y<DstPic.height;++ y)
        lock_list[y]=0 ;

    long cheight=DstPic.height / work_count;
    for (long i=0;i<work_count;++ i)
    {
        work_list[i].pYUYV= pYUYV;
        work_list[i].DstPic= DstPic;
        work_list[i].begin_y0=i* cheight;
        work_list[i].LockList=&lock_list[0 ];
        pwork_list[i]=& work_list[i];
    }
    CWorkThreadPool::work_execute(DECODE_YUYV_ParallelEx_callback,(void**)&pwork_list[0 ],work_count);
}

G:把测试成绩放在一起

//测试平台:(CPU:AMD64x2 4200+(2.37G);   内存:DDR2 677(双通道); 编译器:VC2005)
//测试平台:(CPU:Intel Core2 4400(2.00G);内存:DDR2 667(双通道); 编译器:VC2005)

//==============================================================================
//                       |        1024x576       |       1920x1080       |
//------------------------------------------------------------------------------
//                       | AMD64x2 |   Core2   | AMD64x2 |   Core2   |
//------------------------------------------------------------------------------
//DECODE_YUYV_Float         55.0 FPS   63.7 FPS     15.6 FPS   18.0 FPS
//DECODE_YUYV_Int          137.1 FPS 131.9 FPS     39.0 FPS   37.1 FPS
//DECODE_YUYV_RGBTable     164.8 FPS 152.9 FPS     47.1 FPS   43.7 FPS
//DECODE_YUYV_Table        146.1 FPS 151.3 FPS     41.8 FPS   43.5 FPS
//DECODE_YUYV_TableEx      236.5 FPS 300.5 FPS     68.1 FPS   85.0 FPS
//DECODE_YUYV_Common       250.7 FPS 287.1 FPS     71.9 FPS   80.7 FPS
//DECODE_YUYV_MMX          585.4 FPS  569.8 FPS    169.8 FPS 160.4 FPS
//DECODE_YUYV_SSE          770.3 FPS  741.9 FPS    220.0 FPS 209.7 FPS
//DECODE_YUYV_Auto                    (同DECODE_YUYV_SSE)
//DECODE_YUYV_Parallel    1433.9 FPS 1417.1 FPS    414.1 FPS 286.3 FPS
//DECODE_YUYV_ParallelEx 1387.5 FPS 1359.2 FPS    409.9 FPS  287.4 FPS

(欢迎提出不足和改进意见；文章下篇将开始支持更多类型的YUV视频数据格式)

你可能感兴趣的:(代码优化,图形图像)

Java--程序控制结构（下）阿亮爱学代码 Java java 开发语言程序控制结构 java基础讲解循环控制
目录1.1for循环控制注意事项和细节说明：练习：打印1-100之间所有是9的倍数的整数，统计个数及总和我们进行代码优化：代码：1.2while循环控制1.3do...while循环控制1.4多重循环控制（重点）1.5break跳转控制语句细节：1.6continue跳转语句1.7return跳转语句1.1for循环控制介绍：听其名而知其意，就是让你的代码可以循环的执行语法：for（循环变量初始化
厂房起火3D消防灭火安全救援模拟演练 VRARvrnew3d 3d vr 虚拟现实 VR仿真 VR公司消防厂房
深圳VR公司华锐视点依托前沿的VR虚拟现实制作、三维仿真和图形图像渲染技术，将参训者带入栩栩如生的火灾现场。佩戴VR头盔，参训者将真切体验火势蔓延的紧张与危机，身临其境地感受火灾的恐怖。并且消防安全VR虚拟现实演练系统精心模拟了住宅、工厂火灾及交通事故等多种场景，让参训者在虚拟环境中进行实战演练，显著增强应对火灾的实战能力。不受时间、空间限制，多次体验火灾现场，深化应急处理技巧，提升应变能力。同时
IAR Workspace 中 Debug 与 Release 配置的深度解析指令集诗人 zynq IAR 嵌入式软件 C语言编译优化
IARWorkspace中Debug与Release配置的深度解析一、配置的本质区别1.核心目标对比特性Debug配置Release配置优化目标调试友好性性能/尺寸优化代码优化无或低优化(-O0/-O1)高级优化(-O2/-O3/-Oz)调试信息包含完整符号信息无或最小化符号断言检查启用通常禁用输出文件带调试信息的可执行文件优化后的生产固件典型用途开发调试阶段最终产品发布2.编译参数差异//Deb
高效编程：DeepSeek 官方提示词库摆烂大大王 deepseek AIGC ai 人工智能
写更少的提示词，做更多的创造：结构化思维让AI成为你的“第二大脑”一、DeepSeek编程提示词的核心设计哲学DeepSeek在编程辅助场景中，始终贯彻RICE方法论：Role（角色）：明确AI身份（如“代码优化专家”）Input（输入）：规范代码/需求的描述格式Capability（能力）：声明所需技能（如“跨文件重构”）Expectation（期望）：定义输出标准（如“带注释的迭代版代码”）这
4.1 FFmpeg编译选项配置卖猪肉的痴汉 #FFmpeg编译与移植 ffmpeg
一、不同场景的编译选项1.1源码调试场景开启debug和禁用strip，防止代码优化，避免源码调试时乱跳。#生成Makefile./configure\--prefix=$(pwd)/../install_mingw\--enable-gpl\--enable-debug=3\--disable-optimizations\--disable-asm\--disable-stripping\--e
Android Studio 修改 JDK 版本的方法奔跑吧邓邓子必备核心技能 android studio JDK 修改方法
提示：“奔跑吧邓邓子”的必备核心技能专栏聚焦计算机技术与职场场景，拆解程序员、产品经理等技术从业者的核心能力图谱。内容涵盖编程思维、算法实战、项目管理、技术架构等硬核技能，结合案例解析代码优化、跨团队协作等落地方法论。定期更新前沿技术趋势与避坑指南，助你突破技能瓶颈，从执行层进阶到技术核心圈，成为职场中不可替代的复合型人才。目录一、AndroidStudio版本信息二、修改方法1.进入File->
Android Studio 打 APK 包报错 Invalid keystore format 的解决方法奔跑吧邓邓子必备核心技能 android studio ide APK打包 invalid 解决方法
提示：“奔跑吧邓邓子”的必备核心技能专栏聚焦计算机技术与职场场景，拆解程序员、产品经理等技术从业者的核心能力图谱。内容涵盖编程思维、算法实战、项目管理、技术架构等硬核技能，结合案例解析代码优化、跨团队协作等落地方法论。定期更新前沿技术趋势与避坑指南，助你突破技能瓶颈，从执行层进阶到技术核心圈，成为职场中不可替代的复合型人才。目录一、问题描述二、解决方法1.修改JDK版本2.使用第三方工具生成证书三
CVTE Android面试题及参考答案（100道题）大模型大数据攻城狮 android 大厂面试 android面试移动开发安卓面试大厂春招大厂校招
目录插件化组件化合并相似接口抽象通用方法使用接口代理引入设计模式编写源代码资源文件准备编译资源文件编译源代码生成dex文件打包APK文件技术能力提升项目经验积累职业发展知识分享与团队协作建立良好的沟通机制明确团队目标和职责尊重和理解团队成员采用合适的解决方法建立团队凝聚力性能优化兼容性问题帧动画属性动画转场动画动画集合基于物理的动画内存管理优化代码优化资源管理优化多线程优化虚拟机参数调整内存优化性
Uniapp性能优化全面指南：从原理到实践 vvilkin的学习备忘 #Uniapp uni-app 性能优化
在移动应用开发中，性能优化是提升用户体验的关键。Uniapp作为一款跨平台开发框架，虽然开发效率高，但在多端适配时仍然可能遇到性能瓶颈。本文将深入探讨Uniapp性能优化的核心策略，涵盖启动优化、渲染优化、代码优化、网络优化、构建优化等多个方面，并提供可落地的实践方案。一、为什么Uniapp需要性能优化？Uniapp的跨平台特性使其在开发效率上具有优势，但同时也带来了一些性能挑战：跨平台适配：不同
位运算详解之移位运算的神奇操作 GG不是gg leetcode #算法分析与设计算法
位运算详解之移位运算的神奇操作一、移位运算基础概念1.1移位运算的定义与本质1.2移位运算的分类二、左移位运算（>）3.1运算规则3.2神奇应用场景3.2.1快速除法运算3.2.2提取二进制位的特定部分3.2.3符号扩展与数据类型转换四、无符号右移位运算（>>>）4.1运算规则4.2神奇应用场景4.2.1处理无符号整数4.2.2哈希算法与加密领域4.2.3图形图像处理五、移位运算的组合与高级应用5
15个Spring Boot常见编程误区解析与代码优化建议 java干货 spring boot 后端 java
SpringBoot让Java开发变得更快、更简单、也更整洁。但即使是经验丰富的开发者，也常常会犯一些错误，这些错误会导致性能瓶瓶颈、Bug和安全问题。让我们来探讨一下最常见的SpringBoot错误，通过完整的代码示例，学习如何像专家一样避免它们。‍1.❌未正确使用@Service,@Component或@Repository注解•糟糕的代码：//这个类没有被标记为Spring的组件public
【Story】编译器的基础概念与类型分类 LuckiBit Story C语言 c++python java 编译器 gcc gnu
目录编译器详解1.编译器的工作流程1.1词法分析（LexicalAnalysis）词法分析的例子1.2语法分析（SyntaxAnalysis）语法分析的例子1.3语义分析（SemanticAnalysis）语义分析的例子1.4中间代码生成（IntermediateCodeGeneration）中间代码的例子1.5代码优化（CodeOptimization）代码优化的例子1.6目标代码生成（Code
5、探索Android图形世界：从基础到高级 laforet Android图形处理 OpenGL ES Canvas绘图
探索Android图形世界：从基础到高级1.引言：图形的重要性在移动应用开发中，图形是至关重要的组成部分。无论是用户界面、游戏还是数据可视化，图形都能显著提升用户体验。本篇文章将深入探讨Android平台上的图形处理技术，从基础到高级，逐步解析如何利用Android的图形绘制和合成设施，以及如何通过桌面工具开发图形图像、纹理和图标等元素，帮助开发者在应用中融入丰富的视觉效果。2.使用Android
Web 架构之 Serverless 技术选型与冷启动优化懂搬砖原力计划 web架构前端架构 serverless
文章目录摘要思维导图正文Serverless概述定义与特点应用场景技术选型公有云Serverless平台开源Serverless框架冷启动问题冷启动原理影响因素冷启动优化策略代码优化资源配置优化预热策略总结摘要Serverless架构作为一种新兴的Web架构模式，正逐渐改变着开发者构建和部署应用的方式。它具有按需计费、自动伸缩等诸多优势，但同时也面临着冷启动等问题。本文将深入探讨Serverles
微信小程序 ---- 慕尚花坊代码优化前端贾公子 2024 --微信小程序微信小程序小程序
代码优化1.分享功能思路分析：目前小程序页面都没有配置分享功能，需要给小程序页面设置分享功能。但是并不是所有页面都需要设置分享功能，具体哪些页面需要设置分享功能，可以和产品经理进行协商。首页商品列表商品详情落地代码：//转发功能onShareAppMessage(){return{title:'所有的怦然心动，都是你',path:'/pages/index/index',imageUrl:'../
前端领域前端框架的前端代码优化与重构方法
前端领域前端框架的前端代码优化与重构方法关键词：前端优化、代码重构、性能提升、前端框架、组件化、懒加载、缓存策略摘要：本文深入探讨前端开发中的代码优化与重构方法，从核心概念到实际应用场景，系统性地介绍如何提升前端代码质量和性能。文章涵盖性能优化策略、代码重构技巧、现代前端框架最佳实践等内容，并提供具体代码示例和实战案例，帮助开发者掌握高效的前端开发方法。1.背景介绍1.1目的和范围前端开发在Web
Java程序员的爽文人生开始了，通义灵码配合上Idea，网友直呼无敌头顶的风 java intellij-idea 开发语言
通义灵码是阿里云推出的一款人工智能工具，旨在提升开发者在编码过程中的效率与体验。本文将重点介绍如何在IntelliJIDEA中集成并使用通义灵码辅助编写Java代码。通义灵码的优势智能代码补全：基于上下文自动推荐代码片段。代码优化建议：分析代码质量并提供优化建议。错误检测与修复：自动识别潜在错误并提供修复方案。支持多种语言与框架：不仅支持Java，还兼容常见框架如Spring、MyBatis等。降
VR教育：开启教育新时代的钥匙广州华锐视点 vr VR教育
VR教育，即虚拟现实教育，是将虚拟现实技术(VirtualReality，简称VR)应用于教育领域的一种创新教育模式。它借助计算机技术、图形图像技术、传感器技术等，创建出高度逼真的虚拟学习环境，让学生通过头戴式显示设备、手柄、体感设备等硬件，身临其境地感受和探索各种学习场景，实现沉浸式学习。VR教育这种创新模式，正逐渐改变着传统教育的面貌。想象一下，在往日略显沉闷的历史课上，学生们不再是对着那些陈
constexpr 是 C++11 引入的关键字 jie18894575866 c++java 算法
constexpr是C++11引入的关键字，用于在编译期进行常量表达式计算，从而提高程序性能和安全性。以下是其核心作用和用法：一.作用1编译期计算constexpr变量或函数的值在编译时确定，避免运行时计算开销。例如，数组大小、模板参数等需要在编译期确定的场景。2类型安全相比宏（#define），constexpr提供类型检查，避免宏替换带来的潜在错误。3代码优化编译器可以在编译期优化conste
快速了解GO+ElasticSearch 我的golang之路果然有问题 golang elasticsearch 开发语言笔记后端经验分享
更多个人笔记见：（注意点击“继续”，而不是“发现新项目”）github个人笔记仓库https://github.com/ZHLOVEYY/IT_notegitee个人笔记仓库https://gitee.com/harryhack/it_note个人学习，学习过程中还会不断补充～（后续会更新在github上）文章目录简单介绍经典例子示范demo代码优化后的代码参考：es返回格式示例：空指针问题简单介
从入门到实战：全面解析 uni-app 跨平台开发（2025 版） 583tj uni-app
目录一、引言：跨平台开发的终极解决方案二、核心优势：为何选择uni-app？1.开发效率提升300%2.性能与原生媲美3.生态系统完善三、开发流程：从环境搭建到项目发布1.环境准备2.项目初始化3.多端适配4.打包发布四、核心技术深度解析1.跨平台原理2.性能优化策略（1）代码优化（2）构建优化（3）渲染优化3.条件编译实战五、实战案例：Todo应用多端开发1.功能需求2.关键代码3.多端适配六、
【Hot 100】118. 杨辉三角海码007 算法算法 Hot100 leetcode c++
目录引言杨辉三角我的解题代码优化优化说明‍♂️作者：海码007专栏：算法专栏标题：【Hot100】118.杨辉三角❣️寄语：书到用时方恨少，事非经过不知难！引言杨辉三角题目链接：做题状态：我的解题这道题目也不难，就是当前层的计算是基于上一层两个元素值，代码如下：classSolution{public:vector>generate(intnumRows){vector>res={{1}};//创
Java在低代码平台性能优化中的实践：从秒杀到百万并发的“魔法“代码实战墨夶 Java学习资料3 java 性能优化开发语言
一、基础代码优化：从原子操作到无锁化1.1原子操作的"量子加速"//AtomicCounterService.java：原子操作的"无锁魔法"publicclassAtomicCounterService{privatefinalAtomicLongcounter=newAtomicLong(0
002_初识 Photoshop CS5 Ramboooooooo
文章目录一、PS简介二、初识位图和矢量图三、图像颜色模式四、图像的文件格式一、PS简介 PhotoShopCS5是Adobe公司推出用于平面设计和图片处理和合成等多功能于一体的强大处理软件，PS是二维的图像合成软件，可以围绕已有的素材进行艺术再加工。二、初识位图和矢量图在计算机领域中，图形图像分为两种类型，即“位图图像”和“矢量图形”。1、位图位图也称为点阵图，是由许多点组成，这些点被称
Go语言极致性能优化实战：生产级代码优化完全指南 go优化
在微服务架构和高并发场景下，Go语言的性能优化直接决定了系统的吞吐量和资源利用率。本文基于大型互联网公司的实践经验，提供可直接应用于生产环境的优化技巧和完整代码实现。1.内存分配优化1.1对象池模式(sync.Pool)对象池是减少GC压力的核心技术，特别适用于频繁创建和销毁的对象。packagemainimport("sync""bytes""fmt")//高性能字节缓冲池varbufferPo
关于keil编译生成elf文件 Wsunsky 单片机小白
问题：最近要使用protues去仿真stm32，由于keil使用的编译器是keilforarm因此不能生成elf文件。方案一：更改keil5的编译器。百度keil5gccforarm就会找找到一些关于keil5更给编译器的文章。缺点也很明显，譬如不能使用goto的功能，代码优化都会受到一些影响。方案二：利用交叉编译器“arm-none-eabi-gcc”以及makefile进行编译问题在于，操作复
HTTP/2与HTTP/3特性详解：为你的Nginx/Apache服务器开启下一代Web协议 Clownseven http nginx apache
更多服务器知识，尽在hostol.com嘿，各位站长和服务器管理员朋友们！咱们天天跟网站打交道，都希望自己的网站能像火箭一样快，用户体验“嗖嗖”的。但你知道吗？除了服务器硬件配置、代码优化、CDN加速这些“常规操作”外，你的Web服务器所使用的HTTP协议版本，也对网站的“奔跑速度”起着至关重要的作用！很多服务器可能还在默默地跑着老旧的HTTP/1.1协议，就像开着一辆“老爷车”在信息高速公路上晃
2024前端面试经验分享 JHCan333 前端知识前端
一、简历1、整理步骤把自己过去做过的有亮点的事情整理一遍。项目经历，通过star法则来做，不赘述，网上很多人讲。需要突出的亮点见下面。2、前端开发常见突出亮点：性能优化代码优化组件封装框架原理项目推进、协调能力技术难点的解决能力技术方案设计能力前端工程化的推进3、管理相关亮点如何制定代码规范，以及review如何提升团队人员的水平如何制定流程为团队提效4、其他亮点个人博客、公众号了解前沿技术，新知
python 代码优化 Pushkin. python python代码优化 list优化循环优化字典优化
代码优化1.合并尽量用joins=','.join(list1)2.可以不用循环就不用循环例1:---------------------------------------------------valid_tags数据为[('漂亮',100),('美丽',150),('丑',89)]valid_tags_name=[]forninvalid_tags:valid_tags_name.appen
PHP生成PDF方法我是我们村的村长 php php
TCPDF具有以下特性：1、支持页面页脚；2、支持HTML标签代码；3、支持jpg/png/gif/svg图形图像；4、支持表格；5、支持中文字符；（有些PDF类不支持中文或者处理中文相当麻烦）6、自动分页，自动页码，等等。如何使用您可以从TCPDF官网获取最新版本：http://www.tcpdf.org。官网提供了几十个示例以及说明文档，下载解压后一定要注意文件路径，如何使用TCPDF，可以从
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

YUV视频格式到RGB32格式转换的速度优化 中篇

你可能感兴趣的:(代码优化,图形图像)

YUV视频格式到RGB32格式转换的速度优化中篇