lifan_3a

YUV视频格式到RGB32格式转换的速度优化中篇

tag: YUV,YCbCr,YUV到RGB颜色转换,YUV解码,VFW,视频,MMX,SSE,多核优化

摘要: 我们得到的很多视频数据(一些解码器的输出或者摄像头的输出等)都使用了一种
叫YUV的颜色格式；本文介绍了常见的YUV视频格式(YUY2/YVYU/UYVY/I420/YV12等)到
RGB颜色格式的转换,并尝试对转化的速度进行优化；
全文分为:
    《上篇》文章首先介绍了YUV颜色格式，并介绍了YUV颜色格式和RGB颜色格式之
间的相互转换；然后重点介绍了YUYV视频格式到RGB32格式的转化，并尝试进行了一
些速度优化；
    《中篇》尝试使用MMX/SSE指令对前面实现的解码器核心进行速度优化；然
后简要介绍了一个使用这类CPU特殊指令时的代码框架，使得解码程序能够根据运行时
的CPU指令支持情况动态调用最佳的实现代码；并最终提供一个多核并行的优化版本；
    《下篇》介绍YUV类型的其他种类繁多的视频数据编码格式；并将前面实现的解码
器核心(在不损失代码速度的前提下)进行必要的修改，使之适用于这些YUV视频格式
的解码；

    (2007.11.25 优化了一下DECODE_YUYV_SSE，使用预读优化;调整了一下MMX指令的定义方式，结构更好一些)
    (2007.11.13 修正了一下颜色转换公式中的系数)
    (2007.11.05 修改函数DECODE_YUYV_AutoEx中的一个bug)

正文:
代码使用C++,编译器:VC2005
涉及到汇编的时候假定为x86平台；
现在的高清视频帧尺寸越来越大，所以本文测试的图片大小将使用1024x576和
1920x1080两种常见的帧尺寸来测试解码器速度；
测试平台:(CPU:AMD64x2 4200+(2.37G);   内存:DDR2 677(双通道); 编译器:VC2005)
测试平台:(CPU:Intel Core2 4400(2.00G);内存:DDR2 667(双通道); 编译器:VC2005)

请先参看《YUV视频格式到RGB32格式转换的速度优化上篇》，
本文章将继续成倍的提高其速度!


A:使用MMX指令来继续优化YUYV视频格式到RGB32格式的转换函数
现在绝大多数的x86CPU都支持MMX指令，它是一种单指令多数据流的指令集(SIMD)；
MMX指令能够同时操作8个byte或者4个short等; 在YUV转换到RGB的运算中,为了保持精
度选用一次运算4个short数据类型；那外考虑如果在一个寄存器中保存YUYV四个数据，
整个运算写起来会较麻烦，且算法受到Y、U、V三个颜色存放位置的影响严重；而且考
虑到除了packed模式外很多YUV视频数据都为planar模式，所以想把Y、U、V先分离到
各自的寄存器再运算，看起来舒服得多，那么运算核心将用一个寄存器保存4个U，一
个寄存器保存4个V，对应8个Y，也就是说核心转换代码运行一遍可以输出8个RGB32比
特颜色；
所以我们先来实现一个通用的MMX实现的转换核心：
我们约定输入:
        mm0 = Y7 Y6 Y5 Y4 Y3 Y2 Y1 Y0
        mm1 = 00 u3 00 u2 00 u1 00 u0
        mm2 = 00 v3 00 v2 00 v1 00 v0
通过edx指向的内存输出:
        [edx -- edx+8*4]

由于主要的计算使用short精度，那些系数就不能使用16位的定点数了；为了不超出short的
范围可以使用13位的定点数(再大就会溢出了)；

MMX实现的转换核心(使用了宏来实现)：YUV422ToRGB32_MMX:
(系数的由来/数据在MMX寄存器的大致流动都有较详细的注释；
如果有人进一步改进了这个核心,请告诉我:)

typedef unsigned __int64  UInt64;

const  UInt64   csMMX_16_b      = 0x1010101010101010; // byte{16,16,16,16,16,16,16,16}
const  UInt64   csMMX_128_w     = 0x0080008000800080; //short{  128,  128,  128,  128}
const  UInt64   csMMX_0x00FF_w  = 0x00FF00FF00FF00FF; //掩码
const  UInt64   csMMX_Y_coeff_w = 0x2543254325432543; //short{ 9539, 9539, 9539, 9539} =1.164383*(1<<13)
const  UInt64   csMMX_U_blue_w  = 0x408D408D408D408D; //short{16525,16525,16525,16525} =2.017232*(1<<13)
const  UInt64   csMMX_U_green_w = 0xF377F377F377F377; //short{-3209,-3209,-3209,-3209} =(-0.391762)*(1<<13)
const  UInt64   csMMX_V_green_w = 0xE5FCE5FCE5FCE5FC; //short{-6660,-6660,-6660,-6660} =(-0.812968)*(1<<13)
const  UInt64   csMMX_V_red_w   = 0x3313331333133313; // short{13075,13075,13075,13075} =1.596027*(1<<13)

//一次处理8个颜色输出
#define YUV422ToRGB32_MMX(out_RGB_reg,WriteCode)                                                 /
    /*input :  mm0 = Y7 Y6 Y5 Y4 Y3 Y2 Y1 Y0    */                                                 /
   /*         mm1 = 00 u3 00 u2 00 u1 00 u0    */                                                 /
   /*         mm2 = 00 v3 00 v2 00 v1 00 v0    */                                                 /
   /*output : [out_RGB_reg -- out_RGB_reg+8*4]                 */                                 /
                                                                                                 /
          asm   psubusb     mm0,csMMX_16_b        /* mm0 : Y -= 16                       */       /
          asm   psubsw      mm1,csMMX_128_w       /* mm1 : u -= 128                      */       /
          asm   movq        mm7,mm0                                                              /
          asm   psubsw      mm2,csMMX_128_w       /* mm2 : v -= 128                      */       /
          asm   pand        mm0,csMMX_0x00FF_w    /* mm0 = 00 Y6 00 Y4 00 Y2 00 Y0       */       /
          asm   psllw       mm1,3                 /* mm1 : u *= 8                        */       /
          asm   psllw       mm2,3                 /* mm2 : v *= 8                        */       /
          asm   psrlw       mm7,8                 /* mm7 = 00 Y7 00 Y5 00 Y3 00 Y1       */       /
          asm   movq        mm3,mm1                                                              /
          asm   movq        mm4,mm2                                                              /
                                                                                                 /
          asm   pmulhw      mm1,csMMX_U_green_w   /* mm1 = u * U_green                   */       /
          asm   psllw       mm0,3                 /* y*=8                                */       /
          asm   pmulhw      mm2,csMMX_V_green_w   /* mm2 = v * V_green                   */       /
          asm   psllw       mm7,3                 /* y*=8                                */       /
          asm   pmulhw      mm3,csMMX_U_blue_w                                                   /
          asm   paddsw      mm1,mm2                                                              /
          asm   pmulhw      mm4,csMMX_V_red_w                                                    /
          asm   movq        mm2,mm3                                                              /
          asm   pmulhw      mm0,csMMX_Y_coeff_w                                                  /
          asm   movq        mm6,mm4                                                              /
          asm   pmulhw      mm7,csMMX_Y_coeff_w                                                  /
          asm   movq        mm5,mm1                                                              /
          asm   paddsw      mm3,mm0               /* mm3 = B6 B4 B2 B0       */                   /
          asm   paddsw      mm2,mm7               /* mm2 = B7 B5 B3 B1       */                   /
          asm   paddsw      mm4,mm0               /* mm4 = R6 R4 R2 R0       */                   /
          asm   paddsw      mm6,mm7               /* mm6 = R7 R5 R3 R1       */                   /
          asm   paddsw      mm1,mm0               /* mm1 = G6 G4 G2 G0       */                   /
          asm   paddsw      mm5,mm7               /* mm5 = G7 G5 G3 G1       */                   /
                                                                                                 /
          asm   packuswb    mm3,mm4               /* mm3 = R6 R4 R2 R0 B6 B4 B2 B0 to [0-255] */ /
          asm   packuswb    mm2,mm6               /* mm2 = R7 R5 R3 R1 B7 B5 B3 B1 to [0-255] */ /
          asm   packuswb    mm5,mm1               /* mm5 = G6 G4 G2 G0 G7 G5 G3 G1 to [0-255] */ /
          asm   movq        mm4,mm3                                                              /
          asm   punpcklbw   mm3,mm2               /* mm3 = B7 B6 B5 B4 B3 B2 B1 B0     */         /
          asm   punpckldq   mm1,mm5               /* mm1 = G7 G5 G3 G1 xx xx xx xx     */         /
          asm   punpckhbw   mm4,mm2               /* mm4 = R7 R6 R5 R4 R3 R2 R1 R0     */         /
          asm   punpckhbw   mm5,mm1               /* mm5 = G7 G6 G5 G4 G3 G2 G1 G0     */         /
                                                                                                 /
                /*out*/                                                                           /
          asm   pcmpeqb     mm2,mm2               /* mm2 = FF FF FF FF FF FF FF FF     */         /
                                                                                                 /
          asm   movq        mm0,mm3                                                              /
          asm   movq        mm7,mm4                                                              /
          asm   punpcklbw   mm0,mm5             /* mm0 = G3 B3 G2 B2 G1 B1 G0 B0       */         /
          asm   punpcklbw   mm7,mm2             /* mm7 = FF R3 FF R2 FF R1 FF R0       */         /
          asm   movq        mm1,mm0                                                              /
          asm   movq        mm6,mm3                                                              /
          asm   punpcklwd   mm0,mm7             /* mm0 = FF R1 G1 B1 FF R0 G0 B0       */         /
          asm   punpckhwd   mm1,mm7             /* mm1 = FF R3 G3 B3 FF R2 G2 B2       */         /
          asm   WriteCode   [out_RGB_reg],mm0                                                    /
          asm   movq        mm7,mm4                                                              /
          asm   punpckhbw   mm6,mm5             /* mm6 = G7 B7 G6 B6 G5 B5 G4 B4       */         /
          asm   WriteCode   [out_RGB_reg+8 ],mm1                                                  /
          asm   punpckhbw   mm7,mm2             /* mm7 = FF R7 FF R6 FF R5 FF R4      */          /
          asm   movq        mm0,mm6                                                              /
          asm   punpcklwd   mm6,mm7             /* mm6 = FF R5 G5 B5 FF R4 G4 B4      */          /
          asm   punpckhwd   mm0,mm7             /* mm0 = FF R7 G7 B7 FF R6 G6 B6      */          /
          asm   WriteCode  [out_RGB_reg+8*2 ],mm6                                                 /
          asm   WriteCode  [out_RGB_reg+8*3 ],mm0

YUV视频格式到RGB32格式的转换函数，MMX指令实现版本

    #define YUYV_Loader_MMX(in_yuv_reg)                                                         /
          asm   movq        mm0,[in_yuv_reg  ] /*mm0=V1 Y3 U1 Y2 V0 Y1 U0 Y0  */                 /
          asm   movq        mm4,[in_yuv_reg+8] /*mm4=V3 Y7 U3 Y6 V2 Y5 U2 Y4  */                 /
          asm   movq        mm1,mm0                                                             /
          asm   movq        mm5,mm4                                                             /
          asm   psrlw       mm1,8              /*mm1=00 V1 00 U1 00 V0 00 U0  */                 /
          asm   psrlw       mm5,8              /*mm5=00 V3 00 U3 00 V2 00 U2  */                 /
          asm   pand        mm0,csMMX_0x00FF_w /*mm0=00 Y3 00 Y2 00 Y1 00 Y0  */                 /
          asm   pand        mm4,csMMX_0x00FF_w /*mm4=00 Y7 00 Y6 00 Y5 00 Y4  */                 /
          asm   packuswb    mm1,mm5            /*mm1=V3 U3 V2 U2 V1 U1 V0 U0  */                 /
          asm   movq        mm2,mm1                                                             /
          asm   packuswb    mm0,mm4            /*mm0=Y7 Y6 Y5 Y4 Y3 Y2 Y1 Y0  */                 /
          asm   psllw       mm1,8              /*mm1=U3 00 U2 00 U1 00 U0 00  */                 /
          asm   psrlw       mm2,8              /*mm2=00 V3 00 V2 00 V1 00 V0  */                 /
          asm   psrlw       mm1,8              /*mm1=00 U3 00 U2 00 U1 00 U0  */


    void DECODE_YUYV_MMX_line(TARGB32* pDstLine,const TUInt8* pYUYV,long width)
    {
        long expand8_width=(width>>3)<<3 ;

        if (expand8_width>0 )
        {
            asm
            {
                mov     ecx,expand8_width
                mov     eax,pYUYV
                mov     edx,pDstLine
                lea     eax,[eax+ecx*2 ]
                lea     edx,[edx+ecx*4 ]
                neg     ecx

              loop_beign:
                YUYV_Loader_MMX(eax+ecx*2 )
                YUV422ToRGB32_MMX(edx+ecx*4 ,movq)

                add     ecx,8
                jnz     loop_beign

                mov     pYUYV,eax
                mov     pDstLine,edx
            }
        }

         //处理边界
        DECODE_YUYV_Common_line(pDstLine,pYUYV,width- expand8_width);
    }

void DECODE_YUYV_MMX(const TUInt8* pYUYV,const TPicRegion& DstPic)
{
    assert((DstPic.width & 1)==0 );

    long YUV_byte_width=(DstPic.width>>1)<<2 ;
    TARGB32* pDstLine= DstPic.pdata;
    for (long y=0;y<DstPic.height;++ y)
    {
        DECODE_YUYV_MMX_line(pDstLine,pYUYV,DstPic.width);
        pYUYV+= YUV_byte_width;
        ((TUInt8*&)pDstLine)+= DstPic.byte_width;
    }
    asm emms
}

速度测试:
////////////////////////////////////////////////////////////////////////////////
//==============================================================================
//                       |        1024x576       |       1920x1080       |
//------------------------------------------------------------------------------
//                       | AMD64x2 |   Core2   | AMD64x2 |   Core2   |
//------------------------------------------------------------------------------
//DECODE_YUYV_MMX          585.4 FPS 569.8 FPS    169.8 FPS 160.4 FPS
////////////////////////////////////////////////////////////////////////////////

B.使用SSE中的软件预取和禁止写缓存来改进MMX版本

这里的改动其实很小，只是把YUV422ToRGB32_MMX中颜色数据保存操作
movq [mem],mmx_reg 修改成 movntq [mem],mmx_reg
然后再处理完成后调用sfence缓存刷新指令。
完整代码如下:

    //使用软件预读和禁止写缓存优化
    #define  YUV422ToRGB32_SSE(out_RGB_reg) YUV422ToRGB32_MMX(out_RGB_reg,movntq)

     void DECODE_YUYV_SSE_line(TARGB32* pDstLine,const TUInt8* pYUYV,long width)
    {
        long expand8_width=(width>>3)<<3 ;

        if (expand8_width>0 )
        {
            asm
            {
                mov     ecx,expand8_width
                mov     eax,pYUYV
                mov     edx,pDstLine
                lea     eax,[eax+ecx*2 ]
                lea     edx,[edx+ecx*4 ]
                neg     ecx

              loop_beign:
                YUYV_Loader_MMX(eax+ecx*2 )
                prefetchnta [eax+ecx*2+64*4]  //预读
                YUV422ToRGB32_SSE(edx+ecx*4 )

                add     ecx,8
                jnz     loop_beign

                mov     pYUYV,eax
                mov     pDstLine,edx
            }
        }

         //处理边界
        DECODE_YUYV_Common_line(pDstLine,pYUYV,width- expand8_width);
    }

void DECODE_YUYV_SSE(const TUInt8* pYUYV,const TPicRegion& DstPic)
{
    assert((DstPic.width & 1)==0 );

    long YUV_byte_width=(DstPic.width>>1)<<2 ;
    TARGB32* pDstLine= DstPic.pdata;
    for (long y=0;y<DstPic.height;++ y)
    {
        DECODE_YUYV_SSE_line(pDstLine,pYUYV,DstPic.width);
        pYUYV+= YUV_byte_width;
        ((TUInt8*&)pDstLine)+= DstPic.byte_width;
    }
    asm sfence
    asm emms
}

速度测试:
////////////////////////////////////////////////////////////////////////////////
//==============================================================================
//                       |        1024x576       |       1920x1080       |
//------------------------------------------------------------------------------
//                       | AMD64x2 |   Core2   | AMD64x2 |   Core2   |
//------------------------------------------------------------------------------
//DECODE_YUYV_SSE          770.3 FPS   741.9 FPS   220.0 FPS 209.7 FPS
////////////////////////////////////////////////////////////////////////////////

C.使用CPU特殊指令的一般框架
我的blog文章中，经常使用MMX/SSE等特殊指令，都是只给出代码实现；它们离实际项目代
码还有一点距离；在实际的项目中需要一种机制使得开发的软件能够根据运行的CPU的特性动
态的决定调用最优化的实现版本；
在x86CPU上可以使用CPUID指令来得到各种关于当前CPU的特性，包括制造商、CPU家族号、
缓存信息、是否支持MMX/SSE/SSE2指令集等等；
要使用CPUID指令，首先应该判断CPU是否支持该指令；方法是判断EFLAGS寄存器的第21位
是否可以改写；如果可以改写，那么说明这块CPU支持CPUID指令；函数实现如下:

    bool   _CPUSupportCPUID()
    {
        long int CPUIDInfOld=0 ;
        long int CPUIDInfNew=0 ;

      try
      {
        asm
        {
            pushfd                    // 保存原 EFLAGS
            pop     eax
            mov     edx,eax
            mov     CPUIDInfOld,eax   //

            xor     eax,00200000h     // 改写第21位
            push    eax
            popfd                    // 改写 EFLAGS

            pushfd                    // 保存新 EFLAGS
            pop     eax
            mov     CPUIDInfNew,eax

            push    edx              // 恢复原 EFLAGS
            popfd
        }
        return (CPUIDInfOld!=CPUIDInfNew);  // EFLAGS 第21位可以改写
      }
      catch (...)
      {
     return false ;
      }
    }

//那么判断CPU是否支持MMX指令的函数如下:

    bool  _CPUSupportMMX()  //判断CPU是否支持MMX指令
    {

      if (! _CPUSupportCPUID())
        return false ;

      long int MMXInf=0 ;

      try
      {
        asm
     {
          push  ebx
          mov   eax, 1
          cpuid
          mov   MMXInf,edx
          pop   ebx
        }
        MMXInf =MMXInf & (1 << 23);  //检测edx第23位
        return (MMXInf==(1 << 23 ));
      }
      catch (...)
      {
        return false ;
      }
    }

//判断CPU是否支持SSE指令的函数如下:

    bool  _CPUSupportSSE()  //判断CPU是否支持SSE指令
    {

      if (! _CPUSupportCPUID())
        return false ;

      long int SSEInf=0 ;
      try
      {
        asm
     {
          push  ebx
          mov   eax, 1
          cpuid
          mov   SSEInf,edx
          pop   ebx
        }
        SSEInf =SSEInf & (1 << 25);  //检测edx第25位
        return  (SSEInf==(1 << 25 ));
      }
      catch (...)
      {
        return false ;
      }
    }

// 由于SSE的寄存器是比较后期加入的，某些较老的操作系统可能不支持这些寄存器
//的任务切换保存；可以用触发异常的方式来判断操作系统是否支持SSE;

    bool  _SystemSupportSSE()  //判断操作系统是否支持SSE指令
    {
      //触发异常来判断
      try
      {
        asm
        {
             //movups     xmm0,xmm0
            asm _emit 0x0F asm _emit 0x10 asm _emit 0xC0
        }
         return true ;
      }
      catch (...)
      {
        return false ;
      }
    }

//定义常量，用以在程序作为分支条件

const bool _IS_MMX_ACTIVE= _CPUSupportMMX();
const bool _IS_SSE_ACTIVE=_CPUSupportSSE() && _SystemSupportSSE();

D.根据运行的CPU支持的指令集来动态调用不同的解码器实现

typedef void (*TDECODE_YUYV_line_proc)(TARGB32* pDstLine,const TUInt8* pYUYV,long width);

const TDECODE_YUYV_line_proc DECODE_YUYV_Auto_line=
        ( _IS_MMX_ACTIVE ? (_IS_SSE_ACTIVE ? DECODE_YUYV_SSE_line : DECODE_YUYV_MMX_line) : DECODE_YUYV_Common_line );

__forceinline void DECODE_filish()
{
    if (_IS_MMX_ACTIVE)
    {
        if (_IS_SSE_ACTIVE) {  asm sfence }
        asm emms
    }
}

void DECODE_YUYV_Auto(const TUInt8* pYUYV,const TPicRegion& DstPic)
{
    assert((DstPic.width & 1)==0 );

    long YUV_byte_width=(DstPic.width>>1)<<2 ;
    TARGB32* pDstLine= DstPic.pdata;
    for (long y=0;y<DstPic.height;++ y)
    {
        DECODE_YUYV_Auto_line(pDstLine,pYUYV,DstPic.width);
        pYUYV+= YUV_byte_width;
        ((TUInt8*&)pDstLine)+= DstPic.byte_width;
    }
    DECODE_filish();
}

在我的两台测试电脑上速度同DECODE_YUYV_SSE，因为它们都支持MMX和SSE;

E.YUYV视频格式解码器的并行化实现
这个比较简单，将图像分为多个块交给多个CPU同时执行就可以了；代码如下:
( 这里利用CWorkThreadPool类来并行执行任务; 参见我的Blog文
章《并行计算简介和多核CPU编程Demo》,里面有CWorkThreadPool类的完整源代码)

#include "WorkThreadPool.h"

struct TDECODE_YUYV_Parallel_WorkData
{
    const TUInt8* pYUYV;
    TPicRegion    DstPic;
};

void DECODE_YUYV_Parallel_callback(void* wd)
{
    TDECODE_YUYV_Parallel_WorkData* WorkData=(TDECODE_YUYV_Parallel_WorkData* )wd;
    DECODE_YUYV_Auto(WorkData->pYUYV,WorkData-> DstPic);
}

void DECODE_YUYV_Parallel(const TUInt8* pYUYV,const TPicRegion& DstPic)
{
    long work_count= CWorkThreadPool::best_work_count();
    std::vector<TDECODE_YUYV_Parallel_WorkData>    work_list(work_count);
    std::vector<TDECODE_YUYV_Parallel_WorkData*>   pwork_list(work_count);
    long cheight=DstPic.height / work_count;
    for (long i=0;i<work_count;++ i)
    {
        work_list[i].pYUYV=pYUYV+i*cheight*(DstPic.width*2 );
        work_list[i].DstPic.pdata=DstPic.pixel_pos(0,cheight* i);
        work_list[i].DstPic.byte_width= DstPic.byte_width;
        work_list[i].DstPic.width= DstPic.width;
        work_list[i].DstPic.height= cheight;
        pwork_list[i]=& work_list[i];
    }
    work_list[work_count-1].DstPic.height=DstPic.height-cheight*(work_count-1 );
    CWorkThreadPool::work_execute(DECODE_YUYV_Parallel_callback,(void**)&pwork_list[0 ],work_count);
}

速度测试:
////////////////////////////////////////////////////////////////////////////////
//==============================================================================
//                       |        1024x576       |       1920x1080       |
//------------------------------------------------------------------------------
//                       | AMD64x2 |   Core2   | AMD64x2 |   Core2   |
//------------------------------------------------------------------------------
//DECODE_YUYV_Parallel    1433.9 FPS  1417.1 FPS    414.1 FPS  286.3 FPS
////////////////////////////////////////////////////////////////////////////////

F.另一种更灵活的任务分配方案
我的Blog文章中，涉及到并行的时候，一般都是前面那种简单的平均任务分配模式；
这里再实现一种复杂一点的分配方案：线程执行完自己分配的任务后，尝试帮助其它
线程执行没有完成的任务；(以单行为最小可分配任务粒度)；这有一个优点，就是
在多任务环境下，能够更好地利用全部的CPU资源; 实现如下:

    __forceinline void DECODE_YUYV_AutoLock_line(TARGB32* pDstLine,const TUInt8* pYUYV,long width,volatile long*   Lock)
    {
        //任务领取
        if ((*Lock)!=0) return ;
        long lock_value=InterlockedIncrement(Lock);// 也可以用带lock前缀的inc指令来代替这个windows调用
        //警告: 在以后更多个核的电脑上，这里的lock造成的潜在冲突没有测试过
        if (lock_value>=2) return ;
        // lock_value==1时，任务领取成功

        //执行任务
        DECODE_YUYV_Auto_line(pDstLine,pYUYV,width);
    }

    __forceinline void DECODE_YUYV_AutoEx(const TUInt8* pYUYV,const TPicRegion& DstPic,volatile long* LockList,long   begin_y0)
    {
        assert((DstPic.width & 1)==0 );

        long YUV_byte_width=(DstPic.width>>1)<<2 ;
        TARGB32* pDstLine= DstPic.pdata;
        long y;

        const TUInt8* pYUYV_b=pYUYV+(YUV_byte_width* begin_y0);
        TARGB32* pDstLine_b=(TARGB32*)(((TUInt8*)DstPic.pdata)+(DstPic.byte_width* begin_y0));
        for (y=begin_y0;y<DstPic.height;++ y)
        {
            DECODE_YUYV_AutoLock_line(pDstLine_b,pYUYV_b,DstPic.width,& LockList[y]);
            pYUYV_b+= YUV_byte_width;
            ((TUInt8*&)pDstLine_b)+= DstPic.byte_width;
        }
        for (y=0;y<begin_y0;++ y)
        {
            DECODE_YUYV_AutoLock_line(pDstLine,pYUYV,DstPic.width,& LockList[y]);
            pYUYV+= YUV_byte_width;
            ((TUInt8*&)pDstLine)+= DstPic.byte_width;
        }
        DECODE_filish();
    }

struct TDECODE_YUYV_ParallelEx_WorkData
{
    const TUInt8*    pYUYV;
    TPicRegion      DstPic;
    long*            LockList;
    long             begin_y0;
};

void DECODE_YUYV_ParallelEx_callback(void* wd)
{
    TDECODE_YUYV_ParallelEx_WorkData* WorkData=(TDECODE_YUYV_ParallelEx_WorkData* )wd;
    DECODE_YUYV_AutoEx(WorkData->pYUYV,WorkData->DstPic,(volatile long*)WorkData->LockList,WorkData-> begin_y0);
}

void DECODE_YUYV_ParallelEx(const TUInt8* pYUYV,const TPicRegion& DstPic)
{
    long work_count= CWorkThreadPool::best_work_count();
    std::vector<TDECODE_YUYV_ParallelEx_WorkData>    work_list(work_count);
    std::vector<TDECODE_YUYV_ParallelEx_WorkData*>   pwork_list(work_count);
    std::vector<long>   lock_list(DstPic.height);
    for (long y=0;y<DstPic.height;++ y)
        lock_list[y]=0 ;

    long cheight=DstPic.height / work_count;
    for (long i=0;i<work_count;++ i)
    {
        work_list[i].pYUYV= pYUYV;
        work_list[i].DstPic= DstPic;
        work_list[i].begin_y0=i* cheight;
        work_list[i].LockList=&lock_list[0 ];
        pwork_list[i]=& work_list[i];
    }
    CWorkThreadPool::work_execute(DECODE_YUYV_ParallelEx_callback,(void**)&pwork_list[0 ],work_count);
}

速度测试:
////////////////////////////////////////////////////////////////////////////////
//==============================================================================
//                       |        1024x576       |       1920x1080       |
//------------------------------------------------------------------------------
//                       | AMD64x2 |   Core2   | AMD64x2 |   Core2   |
//------------------------------------------------------------------------------
//DECODE_YUYV_ParallelEx 1387.5 FPS   1359.2 FPS    409.9 FPS  287.4 FPS
////////////////////////////////////////////////////////////////////////////////

G:把测试成绩放在一起

////////////////////////////////////////////////////////////////////////////////
//测试平台:(CPU:AMD64x2 4200+(2.37G);   内存:DDR2 677(双通道); 编译器:VC2005)
//测试平台:(CPU:Intel Core2 4400(2.00G);内存:DDR2 667(双通道); 编译器:VC2005)
////////////////////////////////////////////////////////////////////////////////
//==============================================================================
//                       |        1024x576       |       1920x1080       |
//------------------------------------------------------------------------------
//                       | AMD64x2 |   Core2   | AMD64x2 |   Core2   |
//------------------------------------------------------------------------------
//DECODE_YUYV_Float         55.0 FPS   63.7 FPS     15.6 FPS   18.0 FPS
//DECODE_YUYV_Int          137.1 FPS 131.9 FPS     39.0 FPS   37.1 FPS
//DECODE_YUYV_RGBTable     164.8 FPS 152.9 FPS     47.1 FPS   43.7 FPS
//DECODE_YUYV_Table        146.1 FPS 151.3 FPS     41.8 FPS   43.5 FPS
//DECODE_YUYV_TableEx      236.5 FPS 300.5 FPS     68.1 FPS   85.0 FPS
//DECODE_YUYV_Common       250.7 FPS 287.1 FPS     71.9 FPS   80.7 FPS
//DECODE_YUYV_MMX          585.4 FPS  569.8 FPS    169.8 FPS 160.4 FPS
//DECODE_YUYV_SSE          770.3 FPS  741.9 FPS    220.0 FPS 209.7 FPS
//DECODE_YUYV_Auto                    (同DECODE_YUYV_SSE)
//DECODE_YUYV_Parallel    1433.9 FPS 1417.1 FPS    414.1 FPS 286.3 FPS
//DECODE_YUYV_ParallelEx 1387.5 FPS 1359.2 FPS    409.9 FPS  287.4 FPS
////////////////////////////////////////////////////////////////////////////////

你可能感兴趣的:(YUV视频格式到RGB32格式转换的速度优化中篇)

linux下的libpng下载，编译，安装，配置等， wushuang443 libpng
libpng的使用|在Linux系统下编译、安装与使用_1234567890@world的博客-CSDN博客
Linux 虚拟机里面系统自动校准时间， wushuang443 linux
首先查看下系统时间：输入date或者timedatectlstatus查看时间信息先启用NTP(网络时间协议)timedatectlset-ntptrue1现在发现日期对上了，但是准确的时钟分钟没对上，输入：这点时区的设置很重要timedatectlset-timezone"Asia/Shanghai"1修改时区为上海注意：若提示权限不足可以加上sudo提权或者使用root账户
C#学习日志 future1412 c#学习 java
构造函数和析构函数知识点一构造函数基本概念在实例化对象时会调用的用于初始化的函数如果不写默认存在一个无参构造函数构造函数的写法1.没有返回值2.函数名和类名必须相同3.没有特殊需求时一般都是public的classPerson{publicstringname;publicintage;类中是允许自己申明无参构造函数的结构体是不允许publicPerson(){name="怪盗基德";age=18
ollama v0.9.4 详解：联网功能、模型目录自定义及macOS性能优化全面升级
近年来，随着人工智能技术的快速发展，模型管理与调用变得尤为重要。作为一款备受关注的本地AI模型管理工具，Ollama在最新发布的v0.9.4版本中带来了多项重磅改进和全新功能，提升了用户体验和应用场景的灵活性。本文将深入解析Ollamav0.9.4版本的功能亮点、技术改进以及实用操作指南，帮助广大开发者和AI爱好者全面掌握这款工具的最新动态。一、版本概述Ollamav0.9.4版本于2025年7月
软件测试【理论篇】02：什么是白盒测试
白盒测试（White-boxTesting），又称结构测试或透明盒测试，是一种基于被测系统内部代码结构、逻辑实现细节的软件测试方法。其核心是通过分析程序的源代码、逻辑路径、控制流等内部特征，设计测试用例以验证代码的正确性、完整性及可靠性。一、白盒测试的核心思想白盒测试将软件视为一个“透明的盒子”，测试人员需了解程序的内部结构（如代码逻辑、函数调用关系、条件判断分支等），通过覆盖代码的执行路径、逻辑
傻瓜式安装QT+ROS2+Ubuntu22环境(可直接在pro中使用) 牛顶顶大王 Ros qt 开发语言性能优化
结果展示QT版本的订阅者实例/官网的发布者实例1.安装qt我使用的版本5.14.2下载地址现在qt下载无法访问了，需要0.0下载qt-opensource-linux-x64-5.14.2.run直接运行其他环境的安装sudoaptinstallgccsudoaptinstallg++sudoaptinstallclangsudoaptinstallclang++sudoaptinstallmak
ubuntu环境搭建四：安装和使用git 小坚学Linux ubuntu环境搭建 git ubuntu github
1.安装gitsudoapt-getinstallgit2.配置git的名字和邮箱gitconfig--globaluser.name"jian"gitconfig--globaluser.email"[email protected]"gitconfig--globalcore.editorvim提交内核patch的配置gitconfig--globaluser.name"RuijianLi"gi
【深度学习:进阶篇】--4.2.词嵌入和NLP 西柚小萌新吖(●ˇ∀ˇ●) #深度学习深度学习自然语言处理人工智能
在RNN中词使用one_hot表示的问题假设有10000个词每个词的向量长度都为10000，整体大小太大没能表示出词与词之间的关系例如Apple与Orange会更近一些，Man与Woman会近一些，取任意两个向量计算内积都为0目录1.词嵌入1.1.特点1.3.word2vec介绍1.3.Word2Vec案例1.3.1.训练语料1.3.2.步骤1.3.3.代码2.测试代码1.词嵌入定义：指把一个维数
【深度学习】卷积神经网络(CNN)原理 chaser&upper 深度学习神经网络卷积计算机视觉
【深度学习】卷积神经网络原理1.卷积神经网络的组成2.卷积层2.1卷积运算过程3.padding-零填充3.1ValidandSame卷积3.2奇数维度的过滤器4.stride-步长5.多通道卷积5.1多卷积核（多个Filter）6.卷积总结7.池化层(Pooling)8.全连接层9.总结1.卷积神经网络的组成定义卷积神经网络由一个或多个卷积层、池化层以及全连接层等组成。与其他深度学习结构相比，卷
Spring Cloud Config 配合 Spring Cloud Bus 实现分布式配置自动刷新详解 ( •̀∀•́ )920 spring cloud java 1024程序员节
SpringCloudConfig配置刷新机制详解在分布式系统中，配置的集中管理尤为重要。SpringCloudConfig提供了基于Git仓库的集中化配置管理方案，而在配置更新后，如何让服务动态刷新而无需重启呢？这就需要利用SpringCloudConfig的配置刷新机制以及SpringCloudBus的消息传播能力。本文将详细讲解如何通过/actuator/bus-refresh接口，实现各个
MySQL(114)如何进行数据库负载均衡？辞暮尔尔-烟火年年 MySQL 数据库 mysql 负载均衡
为了进行数据库负载均衡，我们可以使用SpringBoot和MySQL，并结合AbstractRoutingDataSource来实现数据源的动态切换。下面的实现包括配置多数据源、定义数据源上下文和实现负载均衡策略（如轮询和随机）。项目依赖首先在pom.xml中添加必要的依赖：org.springframework.bootspring-boot-starter-data-jpamysqlmysql
GoldenDB简述
GoldenDB是国产的分布式数据库。它解决了分布式事务一致性问题。底层存储采用的是SharedNothing不共享数据（分片式存储）的分布式架构，各自节点持有各自的数据。不共享彼此数据，还有其他两种分布式架构，分别是Sharedisk，共享磁盘，例如NFS，网络文件系统，采用的就是这种架构。NFS是一种基于客户端-服务器架构的文件系统。它通过网络，特别是局域网，让多台计算机可以共享文件和目录。还
深度学习学习经验——卷积神经网络（CNN） Linductor 深度学习学习经验深度学习学习 cnn
卷积神经网络卷积神经网络（CNN）1.卷积神经网络的基本组成2.卷积操作3.激活函数（ReLU）4.池化操作5.全连接层6.卷积神经网络的完整实现项目示例项目目标1.加载数据2.卷积层：图像的特征探测器2.1第一个卷积层3.激活函数：增加非线性4.池化层：信息压缩器5.多层卷积和池化：逐层提取更高层次的特征6.全连接层：分类器7.模型训练和测试完整的项目示例代码总结卷积神经网络（CNN）卷积神经网
用鸿蒙打造真正的跨设备数据库：从零实现分布式存储网罗开发 HarmonyOS 实战源码实战 harmonyos 数据库分布式
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
从零掌握二叉树序列化：Swift实战详解，让你的树结构飞起来！网罗开发 Swift swift 开发语言 ios
文章目录摘要描述题解答案序列化思路反序列化思路题解代码分析示例测试及结果时间复杂度空间复杂度总结摘要今天咱们来聊聊二叉树的一个经典问题：序列化和反序列化。简单来说，就是把一棵二叉树转换成字符串形式（序列化），然后再把这个字符串还原成原来的二叉树（反序列化）。这个问题在实际开发中特别有用，比如你想把一棵树结构保存到文件里，或者通过网络传输给其他服务，都需要用到这种技术。描述想象一下，你正在开发一个社
LeetCode - #106 从中序与后序遍历序列构造二叉树网罗开发 Swift #LeetCode leetcode 算法职场和发展
文章目录前言1.描述2.示例3.答案关于我们前言我们社区陆续会将顾毅（Netflix增长黑客，《iOS面试之道》作者，ACE职业健身教练。）的Swift算法题题解整理为文字版以方便大家学习与阅读。LeetCode算法到目前我们已经更新到105期，我们会保持更新时间和进度（周一、周三、周五早上9:00发布），每期的内容不多，我们希望大家可以在上班路上阅读，长久积累会有很大提升。不积跬步，无以至千里；
LeetCode - #144 二叉树的前序遍历网罗开发 Swift leetcode 算法职场和发展
文章目录前言1.描述2.示例3.答案关于我们前言我们社区陆续会将顾毅（Netflix增长黑客，《iOS面试之道》作者，ACE职业健身教练。）的Swift算法题题解整理为文字版以方便大家学习与阅读。LeetCode算法到目前我们已经更新到143期，我们会保持更新时间和进度（周一、周三、周五早上9:00发布），每期的内容不多，我们希望大家可以在上班路上阅读，长久积累会有很大提升。不积跬步，无以至千里；
【V5.0 - 视觉篇】AI的“火眼金睛”：用OpenCV量化“第一眼缘”，并用SHAP验证它的“审美” 爱分享的飘哥 AI 人工智能 opencv 计算机视觉
系列回顾：在上一篇《给AI装上“写轮眼”：用SHAP看穿模型决策的每一个细节》中，我们成功地为AI装上了“透视眼镜”，看穿了它基于数字决策的内心世界。但一个巨大的问题暴露了：它的世界里，还只有数字。它能理解“时长60秒”，却无法感受画面的震撼。它是一个强大的“盲人数学家”。计算机视觉我们没有必要为每个视频进行切帧，可以针对开头的视频或者中间关键点视频进行切帧，让计算机识别。承上启下：“现在，我们来
QT读写excel FlechazoCLF 嵌入式软件开发代码库 qt excel 单片机
最近呢在做一个生产工具，这样的需要将这表格里的元素存下来，支持导入导出首先需要这几个头文件#include"QFileDialog"#include"QAxObject"#include#include"QFile"读取excel//读取excelvoidMainWindow::vexcelReadInfo(QStringbutton){staticQStringstrFile=QFileDial
C++笔记想要入门的程序猿 c++笔记开发语言
一.指针与引用的区别：1.指针是一个实际的变量，引用是一个别名2.指针可以为空，引用不行3.引用在定义的时候只能初始化一次，后面就不能变了，指针可以变4.指针需要通过解引用操作符（*）访问目标对象，而引用直接作为原变量的别名使用，无需特殊符号inta=10;int*p=&a;int&r=a;coutwords={"apple","banana","cherry"};std::sort(words.
SpringCloud系列（45）--SpringCloud Bus简介 Ken_1115 spring cloud spring cloud
1、什么是SpringCloudBusSpringCloudBus是用来将分布式系统的节点与轻量级消息系统链接起来的框架，它整合了Java的事件处理机制和消息中间件的功能，SpringCloudBus目前支持RabbitMQ和Kafka。SpringCloudBus配合SpringCloudConfig使用可以实现配置的动态刷新。2、SpringCloudBus能做什么SpringCloudBus
【PHP开发900个实用技巧】405.API限流技术：Redis实现令牌桶算法的高级用法精通代码大仙 PHP开发900个实用技巧 php redis 算法程序员创富
百万并发下的生存法则：用Redis+Lua构建坚不可摧的API流量防线！本文将揭示令牌桶算法在PHP高并发场景的核心实现技巧，包括Lua原子操作、动态策略配置与深度避坑指南，让你的API从此从容应对流量风暴。API限流技术：Redis实现令牌桶高级用法01.令牌桶原理解析02.Redis为何是最强拍档03.PHP实战四步曲3.1Lua脚本原子操作3.2对象封装技巧3.3动态参数配置3.4平滑突发流
Spring Cloud Bus 服务总线，实现全局广播/定点通知扛麻袋的少年 #Spring Cloud spring cloud java spring boot
本文目录：写在开头环境说明1.了解SpringCloudBus1.1Bus何方神圣(Bus是什么)1.2Bus原理2.Bus的两种设计思想2.1触发客户端2.2触发服务端2.3如何选型3.环境搭建4.Bus动态刷新全局广播配置4.1集群版客户端组建4.2服务端配置中心/客户端pom引入Bus总线依赖4.3服务端配置中心application.yml修改(添加rabbitmq相关配置)4.4客户端a
文本lint工具：textlint全面指南包椒浩Leith
文本lint工具：textlint全面指南textlintThepluggablenaturallanguagelinterfortextandmarkdown.项目地址:https://gitcode.com/gh_mirrors/te/textlint项目介绍textlint是一款可插拔的文本和Markdown语法检查工具，专为JavaScript编写，旨在解决自然语言文本校对的难题。与专注于
照明新基建：塔能科技如何用数字骨骼支撑智慧城市生长塔能物联运维人工智能大数据
一、能源管理困局：双碳目标下的市政用电痛点在双碳背景下，城市照明用电量已引起市政部门的重点关注。据国家统计局统计：我国城市照明用电量已占据全市城市用电量的28%，部分城市的照明用电量已高达35%以上，高压钠灯传统照明系统存在大量的“长明灯”长“明”问题，照明浪费已十分严重，二线城市市政部门统计未经治理路段无效照明耗电320万度，耗资高达2亿多元。塔能科技智慧照明系统为这种窘迫带来了光明。塔能科技智
推荐一个强大的文本质量检查工具 —— textlint-rule-preset-JTF-style 幸竹任
推荐一个强大的文本质量检查工具——textlint-rule-preset-JTF-styletextlint-rule-preset-JTF-styleJTF日本語標準スタイルガイドfortextlint.项目地址:https://gitcode.com/gh_mirrors/te/textlint-rule-preset-JTF-style在这个信息爆炸的时代，良好的语言表达能力不仅在学术界，
Swift中常见的面试题 ~废弃回忆 �༄ swift Swift面试题 Swift常见面试题 Swift面试题总结
1.Swift与OC相比有什么优势?Swift是强类型语言，注重值类型，有类型推断，安全性高Swift的语法更简洁，使用起来方便，支持函数式编程Swift拥有更强大的特性，它有元组类型、支持可选类型（optional）、支持运算符重载、支持泛型、支持静态/动态派发，协议不仅可以被类实现还可以被struct和enum实现Swift支持命名空间、函数支持默认参数Swift的错误处理机制更完善oc的优点
计算机视觉 OpenCV Android | Mat像素操作（图像像素的读写、均值方差、算术、逻辑等运算、权重叠加、归一化等操作）... 凌川江雪
本文目录1.像素读写2.图像通道与均值方差计算3.算术操作与调整图像的亮度和对比度4.基于权重的图像叠加5.Mat的其他各种像素操作1.像素读写Mat作为图像容器，其数据部分存储了图像的像素数据，我们可以通过相关的API来获取图像数据部分；在获取图像数据的时候，知道Mat的类型与通道数目关重要，根据Mat的类型与通道数目，开辟适当大小的内存空间，然后通过get方法就可以循环实现每个像素点值的读取、
Ubuntu22+ROS2+QtCreator+Ros_Qtc_Plugin开发环境搭建 ZPC8210 ROS python github git
Ubuntu22+ROS2+QtCreator+Ros_Qtc_Plugin开发环境搭建1.写在前面最近重装了ubuntu22.04，被告知ubuntu22已经不支持ROS1了，想着ROS2毕竟是大势所趋，所以安装了ROS2准备进行相应的学习开发。折腾了两天，没发现一款好用的、适合ROS2开发的IDE。之前开发ROS1程序时一直用的QTC，我本以为QTC应该还没有对应的ROS2插件，没想到网上查找
国密算法如何守护金融安全？7大核心场景全解析南京首传信安科技有限公司密码应用密码应用金融安全
目录一、主要应用场景1.基础设施安全2.身份认证与访问管理3.交易安全与不可否认性4.数据安全5.支付清算与结算6.移动金融安全7.风控与反欺诈二、商用密码应用带来的核心价值三、面临的挑战与趋势四、首传信安解决方案总结金融领域的安全需求是一个极其严苛、多层次、动态演进的体系，其核心目标是构建信任基础，确保资金安全、系统稳定、隐私合规、业务连续。商用密码算法在金融领域的应用是保障金融安全的核心技术支
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1

YUV视频格式到RGB32格式转换的速度优化 中篇

你可能感兴趣的:(YUV视频格式到RGB32格式转换的速度优化 中篇)

YUV视频格式到RGB32格式转换的速度优化中篇

你可能感兴趣的:(YUV视频格式到RGB32格式转换的速度优化中篇)