balderfan

YUV视频格式到RGB32格式转换的速度优化下篇

tag: YUV,YCbCr,YUV到RGB颜色转换,YUV解码,VFW,视频,MMX,SSE,多核优化

摘要: 我们得到的很多视频数据(一些解码器的输出或者摄像头的输出等)都使用了一种
叫YUV的颜色格式；本文介绍了常见的YUV视频格式(YUY2/YVYU/UYVY/I420/YV12等)到
RGB颜色格式的转换,并尝试对转化的速度进行优化；
全文分为:
    《上篇》文章首先介绍了YUV颜色格式，并介绍了YUV颜色格式和RGB颜色格式之
间的相互转换；然后重点介绍了YUYV视频格式到RGB32格式的转化，并尝试进行了一
些速度优化；
    《中篇》尝试使用MMX/SSE指令对前面实现的解码器核心进行速度优化；然
后简要介绍了一个使用这类CPU特殊指令时的代码框架，使得解码程序能够根据运行时
的CPU指令支持情况动态调用最佳的实现代码；并最终提供一个多核并行的优化版本；
    《下篇》介绍YUV类型的其他种类繁多的视频数据编码格式；并将前面实现的解码
器核心(在不损失代码速度的前提下)进行必要的修改，使之适用于这些YUV视频格式
的解码；

正文:
代码使用C++,编译器:VC2005
涉及到汇编的时候假定为x86平台；
现在的高清视频帧尺寸越来越大，所以本文测试的图片大小将使用1024x576和
1920x1080两种常见的帧尺寸来测试解码器速度；
测试平台:(CPU:AMD64x2 4200+(2.37G);   内存:DDR2 677(双通道); 编译器:VC2005)
(另一套测试平台(Intel Core2 4400)不再由我使用，换成了苹果的iMac电脑）

请先参看《YUV视频格式到RGB32格式转换的速度优化上篇》和《... 中篇》;

A:YUV视频格式的分类：
YUV数据有很多种储存的方式：从数据布局方式来看，YUV数据主要分为两大类packed
模式和planar模式；packed模式是指Y/U/V颜色分量放置在一起，比如前面的YUYV格式，
它就是两个相邻像素打包在一起；planar模式是指把Y/U/V颜色分量分成3个大区存放，
也就是所有的Y连续储存在一起，同样所有的U和V也连续储存在一起，比如常见的I420
格式。从数据压缩的角度来看，YUV数据主要的模式有： 1:1:1 、2:1:1、4:1:1等模式；
1:1:1模式是指Y/U/V的数据量一样，一个像素对应一组YUV数据（在视频编码中比较少
见）；2:1:1模式是指两个像素对应两个Y数据和一个U和一个V数据，由于人眼对亮度(Y)
更敏感，所以就压缩了U/V分量的数量，比如把相邻的两个像素的U/V分量取平均值，然
后这两个像素共享这组U/V值，前面介绍的YUYV格式就属于2:1:1模式； 4:1:1模式也很好
理解，就是把2x2范围的4个相邻像素一起编码得到4个Y分量，然后4个像素共享这组U/V
值，I420格式就属于这类；

B:我们来实现planar模式的YUV数据解码

    void DECODE_PlanarYUV111_Common_line(TARGB32* pDstLine,const TUInt8* pY,
                                         const TUInt8* pU,const TUInt8* pV,long width)
    {
        for (long x=0;x<width;++ x)
            pDstLine[x]= YUVToRGB32_Int(pY[x],pU[x],pV[x]);
    }

//1:1:1 planar模式
void DECODE_PlanarYUV111_Common(const TUInt8* pY,const long Y_byte_width,
                                const TUInt8* pU,const long U_byte_width,
                                const TUInt8* pV,const long V_byte_width,
                                const TPicRegion& DstPic)
{
    assert((DstPic.width & 1)==0 );
    TARGB32* pDstLine= DstPic.pdata;
    for (long y=0;y<DstPic.height;++ y)
    {
        DECODE_PlanarYUV111_Common_line(pDstLine,pY,pU,pV,DstPic.width);
        ((TUInt8*&)pDstLine)+= DstPic.byte_width;
        pY+= Y_byte_width;
        pU+= U_byte_width;
        pV+= V_byte_width;
    }
}

    void DECODE_PlanarYUV211_Common_line(TARGB32* pDstLine,const TUInt8* pY,
                                         const TUInt8* pU,const TUInt8* pV,long width)
    {
        for (long x=0;x<width;x+=2 )
        {
            long x_uv=x>>1 ;
            YUVToRGB32_Two(&pDstLine[x],pY[x],pY[x+1 ],pU[x_uv],pV[x_uv]);
        }
    }

//2:1:1 planar模式
void DECODE_PlanarYUV211_Common(const TUInt8* pY,const long Y_byte_width,
                                const TUInt8* pU,const long U_byte_width,
                                const TUInt8* pV,const long V_byte_width,
                                const TPicRegion& DstPic)
{
    assert((DstPic.width & 1)==0 );
    TARGB32* pDstLine= DstPic.pdata;
    for (long y=0;y<DstPic.height;++ y)
    {
        DECODE_PlanarYUV211_Common_line(pDstLine,pY,pU,pV,DstPic.width);
        ((TUInt8*&)pDstLine)+= DstPic.byte_width;
        pY+= Y_byte_width;
        pU+= U_byte_width;
        pV+= V_byte_width;
    }
}

//4:1:1 planar模式
void DECODE_PlanarYUV411_Common(const TUInt8* pY,const long Y_byte_width,
                                const TUInt8* pU,const long U_byte_width,
                                const TUInt8* pV,const long V_byte_width,
                                const TPicRegion& DstPic)
{
    assert((DstPic.width & 1)==0 );
    TARGB32* pDstLine= DstPic.pdata;
    for (long y=0;y<DstPic.height;++ y)
    {
        DECODE_PlanarYUV211_Common_line(pDstLine,pY,pU,pV,DstPic.width);
        ((TUInt8*&)pDstLine)+= DstPic.byte_width;
        pY+= Y_byte_width;

//这里做了特殊处理，使Y下移两行的时候U、V才会下移一行
        if ((y&1)==1 )
        {
            pU+= U_byte_width;
            pV+= V_byte_width;
        }
    }
}

一点说明: 1:1:1模式,后面将不再处理，而4:1:1模式直接使用了2:1:1解码器的核心；

C.我们来优化DECODE_PlanarYUV411_Common函数；

1.当前的实现DECODE_PlanarYUV411_Common
速度测试:
/////////////////////////////////////////////////////////
//=======================================================
//                           | 1024x576 | 1920x1080 |
//-------------------------------------------------------
//                           | AMD64x2 | AMD64x2 |
//-------------------------------------------------------
//DECODE_PlanarYUV411_Common   236.1 FPS    67.5 FPS
/////////////////////////////////////////////////////////

2.MMX的实现DECODE_PlanarYUV411_MMX

     #define PlanarYUV211_Loader_MMX(in_y_reg,in_u_reg,in_v_reg)                                 /
          asm   movd        mm1,[in_u_reg]      /*mm1=00 00 00 00 U3 U2 U1 U0  */                 /
          asm   movd        mm2,[in_v_reg]     /*mm2=00 00 00 00 V3 V2 V1 V0  */                 /
          asm   pxor        mm4,mm4            /*mm4=00 00 00 00 00 00 00 00  */                 /
          asm   movq        mm0,[in_y_reg]     /*mm0=Y7 Y6 Y5 Y4 Y3 Y2 Y1 Y0  */                 /
          asm   punpcklbw   mm1,mm4            /*mm1=00 U3 00 U2 00 U1 00 U0  */                 /
          asm   punpcklbw   mm2,mm4            /*mm2=00 V3 00 V2 00 V1 00 V0  */

    void DECODE_PlanarYUV211_MMX_line(TARGB32* pDstLine,const TUInt8* pY,
                                      const TUInt8* pU,const TUInt8* pV,long width)
    {
        long expand8_width=(width>>3)<<3 ;

        if (expand8_width>0 )
        {
            asm
            {
                push    esi
                push    edi

                mov     ecx,expand8_width
                shr     ecx,1
                mov     eax,pY
                mov     esi,pU
                mov     edi,pV
                mov     edx,pDstLine
                lea     eax,[eax +ecx*2 ]
                lea     esi,[esi+ ecx]
                lea     edi,[edi+ ecx]
                neg     ecx

              loop_beign:
                PlanarYUV211_Loader_MMX(eax+ecx*2,esi+ecx,edi+ ecx)
                YUV422ToRGB32_MMX(edx,movq)

                add     edx,8*4
                add     ecx, 4
                jnz     loop_beign

                mov     pY,eax
                mov     pU,esi
                mov     pV,edi
                mov     pDstLine,edx

                pop     edi
                pop     esi
            }
        }

         //处理边界
        DECODE_PlanarYUV211_Common_line(pDstLine,pY,pU,pV,width- expand8_width);
    }

void DECODE_PlanarYUV411_MMX(const TUInt8* pY,const long Y_byte_width,
                             const TUInt8* pU,const long U_byte_width,
                             const TUInt8* pV,const long V_byte_width,
                             const TPicRegion& DstPic)
{
    assert((DstPic.width & 1)==0 );
    TARGB32* pDstLine= DstPic.pdata;
    for (long y=0;y<DstPic.height;++ y)
    {
        DECODE_PlanarYUV211_MMX_line(pDstLine,pY,pU,pV,DstPic.width);
        ((TUInt8*&)pDstLine)+= DstPic.byte_width;
        pY+= Y_byte_width;
        if ((y&1)==1 )
        {
            pU+= U_byte_width;
            pV+= V_byte_width;
        }
    }
    asm emms
}

速度测试:
/////////////////////////////////////////////////////////
//=======================================================
//                           | 1024x576 | 1920x1080 |
//-------------------------------------------------------
//                           | AMD64x2 | AMD64x2 |
//-------------------------------------------------------
//DECODE_PlanarYUV411_MMX      650.1 FPS   187.3 FPS
/////////////////////////////////////////////////////////

3.优化写缓冲的SSE实现DECODE_PlanarYUV411_SSE

    void DECODE_PlanarYUV211_SSE_line(TARGB32* pDstLine,const TUInt8* pY,
                                      const TUInt8* pU,const TUInt8* pV,long width)
    {
        long expand8_width=(width>>3)<<3 ;

        if (expand8_width>0 )
        {
            asm
            {
                push    esi
                push    edi

                mov     ecx,expand8_width
                shr     ecx,1
                mov     eax,pY
                mov     esi,pU
                mov     edi,pV
                mov     edx,pDstLine
                lea     eax,[eax +ecx*2 ]
                lea     esi,[esi+ ecx]
                lea     edi,[edi+ ecx]
                neg     ecx

              loop_beign:
                PlanarYUV211_Loader_MMX(eax+ecx*2,esi+ecx,edi+ ecx)
                YUV422ToRGB32_SSE(edx)

                add     edx,8*4
                add     ecx, 4
                jnz     loop_beign

                mov     pY,eax
                mov     pU,esi
                mov     pV,edi
                mov     pDstLine,edx

                pop     edi
                pop     esi
            }
        }

         //处理边界
        DECODE_PlanarYUV211_Common_line(pDstLine,pY,pU,pV,width- expand8_width);
    }

void DECODE_PlanarYUV411_SSE(const TUInt8* pY,const long Y_byte_width,
                             const TUInt8* pU,const long U_byte_width,
                             const TUInt8* pV,const long V_byte_width,
                             const TPicRegion& DstPic)
{
    assert((DstPic.width & 1)==0 );
    TARGB32* pDstLine= DstPic.pdata;
    for (long y=0;y<DstPic.height;++ y)
    {
        DECODE_PlanarYUV211_SSE_line(pDstLine,pY,pU,pV,DstPic.width);
        ((TUInt8*&)pDstLine)+= DstPic.byte_width;
        pY+= Y_byte_width;
        if ((y&1)==1 )
        {
            pU+= U_byte_width;
            pV+= V_byte_width;
        }
    }
    asm emms
}

速度测试:
/////////////////////////////////////////////////////////
//=======================================================
//                           | 1024x576 | 1920x1080 |
//-------------------------------------------------------
//                           | AMD64x2 | AMD64x2 |
//-------------------------------------------------------
//DECODE_PlanarYUV411_SSE      864.6 FPS   249.5 FPS
/////////////////////////////////////////////////////////

4.自动适应CPU指令集的版本和并行优化版本的实现就不赘述了；

D:解码器框架
有了前面的各种实现的尝试，完成支持大部分YUV视频格式的解码器已经没有多少困难了；剩下的
就是弄清楚数据的储存格式并组织规划好各种实现代码。
一些建议: 可以将解码器分成3段，载入器、核心解码器、颜色输出器，不同的YUV格式可能需要不同的
“载入器”实现，它负责组织好Y、U、V源，使之适合核心解码器使用，输出的时候可能有不同
的RGB颜色编码输出需求，可以做几个不同的“颜色输出器”实现；
Planar模式的解码是比较容易统一处理的，只要弄清楚各分量存放的位置就能使用同一个解码器
函数的实现；
packed模式就麻烦一些，需要对不同的编码方式实现不同的“载入器”(也可以把它们做成多个
仿函数实现，作为解码函数的参数；另外合理运用内联、宏和泛型可以节省很多代码和维护工作量；)

mybatis批量插入数据时，如果是sql server库只返回一条自增主键小小不吃香菜 mybatis sqlserver java
有个功能需要做个批量插入，表是自增主键，本来是很简单的事情，结果一测试发现一个神奇的事情，由于数据库是sqlserver的，插入一条时，id可以正常返回，多条时，就出现了标题的问题，只返回一个id，使用的是mybatis自带的jar包，甚至如何使用人家还加了备注在里面，很清晰，是这样的:然后我就按照上面描述的，自己加了一个自定义的Mapper，把主键名称改成我自己的，然后发现依然只能获取到一条，后
10招提升SQL性能的实战技巧快乐才是自己的 sql mysql sql mysql oracle database hadoop 大数据
SQL语句常见性能优化方案在数据库应用中，SQL性能优化是核心技术要点。以下是经过验证的优化策略，按关键维度分类：一、索引优化精准索引覆盖对高频查询的WHERE、JOIN、ORDERBY字段建立索引复合索引遵循最左前缀原则：索引(a,b,c)仅支持WHEREa=?或WHEREa=?ANDb=?示例：将SELECT*FROMordersWHEREstatus='shipped'改为CREATEIND
【ElementUI】日期选择器时间选择范围限制前端Joy姐 element UI
ElementUI是饿了么推出的一套基于vue2.x的一个ui框架。官方文档也很详细，这里做一个element-ui日期插件的补充。官方文档中使用picker-options属性来限制可选择的日期，这里举例子稍做补充。单个输入框的组件代码：情景1:设置选择今天以及今天之后的日期data(){return{pickerOptions0:{disabledDate(time){returntime.g
vue大数据量列表渲染性能优化：虚拟滚动原理 Java小卷 Vue3开源组件实战 vue3 自定义Tree 虚拟滚动
前面咱完成了自定义JuanTree组件各种功能的实现。在数据量很大的情况下，我们讲了两种实现方式来提高渲染性能：前端分页和节点数据懒加载。前端分页小节：Vue3扁平化Tree组件的前端分页实现节点数据懒加载小节：ElementTreePlus版功能演示：数据懒加载关于扁平化结构Tree和嵌套结构Tree组件的渲染嵌套结构的Tree组件是一种递归渲染，性能上比起列表结构的v-for渲染比较一般。对于
RK3399 驱动开发 _ 07 - ADC 开发 chenkanuo 驱动开发
文章目录前言一、ADC简介二、ADC配置1.dts节点配置2.重新编译并烧录三、ADC值获取1.计算采集到的电压2.获取ADC值在这里插入图片描述总结前言在RK3399平台开发过程中，经常需要用到ADC功能。例如：检测主板温度、复位/音量按键、DRAMID检测等。一、ADC简介RK3399板卡上常见的AD接口有2种：温度传感器(TemperatureSensor)、逐次逼近ADC(Successi
ElementPlus表格相关操作大全-2 朝阳 Melo 前端 javascript 开发语言
网址：一个Vue3UI框架|ElementPlus(element-plus.org)https://element-plus.org/zh-CN/例：组件——Form表单典型表单参考代码：-OnlineactivitiesPromotionactivitiesOfflineactivitiesSimplebrandexposureSponsorVenueCreateCancelimport{re
cJSON 源码解析
1.概述cJSON是一个轻量级的C语言JSON解析库，支持JSON数据的解析和生成。它采用单一头文件和源文件的设计，易于集成到项目中。主要特性完整的JSON支持（解析和生成）内存管理自动化支持格式化输出支持自定义内存分配器跨平台兼容2.核心数据结构2.1cJSON结构体typedefstructcJSON{structcJSON*next;//指向下一个兄弟节点structcJSON*prev;/
宝塔服务器调优工具 1.1（Opcache优化）拍客圈服务器运维
第一步：宝塔服务器调优工具1.1（按照下面的参数填写）第二步：路径/www/server/php/80/etc/php.ini搜索jit=jit=1235其中1235根据服务器情况修改第三步：路径/www/server/php/80/etc/php-cli.ini搜索jit=1235其中1235必须和宝塔服务器调优工具jit里面填写的数字一样注意：必须临时关掉宝塔系统加固和企业防篡改（不然修改不成
redis的scan使用详解，结合spring使用详解黑皮爱学习 redis自学笔记 redis spring 数据库
Redis的SCAN命令是一种非阻塞的迭代器，用于逐步遍历数据库中的键，特别适合处理大数据库。下面详细介绍其使用方法及在Spring框架中的集成方式。SCAN命令基础SCAN命令的基本语法：SCANcursor[MATCHpattern][COUNTcount]cursor：迭代游标，初始为0，每次迭代返回新的游标值。MATCHpattern：可选，用于过滤键的模式（如user:*）。COUNTc
深圳软件测试的行情怎么样了？川石课堂软件测试压力测试 python 单元测试 jmeter docker 功能测试数据库
软件测试是一个关键的软件开发环节，其目的是确保软件产品的质量、性能、可靠性、安全性，以及满足用户的需求。软件测试在整个软件开发生命周期中占据着重要地位，它不仅限于找出缺陷和问题，还包括验证软件功能、接口、性能等是否符合预期。软件测试通常分为多个层次，包括单元测试、集成测试、系统测试、验收测试等。每个层次都有其特定的目标和测试范围。测试人员需要根据项目需求和设计文档，编写测试用例，实施测试，并记录测
软件架构师论文_论基于架构(ABSD)的软件设计方法及应用 June_Xiao 软件架构师架构
2022年的论文题目是基于CBSD的软件设计方法及应用，本人写了基于ABSD的软件设计方法及应用，论文离题拿了3x分，悲催，这是我的第一次考架构师，是最后一次手写版考试，是最有可能通过的一次。下面是我的论文。论基于架构的软件设计方法及应用摘要2020年5月，我司中标了某省联网收费的省站直传项目，该项目将建设一套全省收费站与省中心相互通信传输数据的平台，主要分为上传、下发、监控三个子系统。，包括收费
MongoDB框架零基础入门码农研究僧 Python 100天精通全栈 mongodb nosql 数据库
目录前言1.安装配置2.关启配置3.基本概念4.基本操作4.1创建集合4.2删除集合4.3插入文档4.4更新文档4.5删除文档4.6查询文档前言先科普讲解一下NoSQL（notonlysql）本身NoSQL非关系型数据库就具备了ACID（原子性、一致性、持久性、隔离性）数据持久化一般还是要使用关系型数据库，内存的数据库使用检索MongoDB是C++编写，一个基于分布式文件存储的开源数据库系统。将其
深入理解 Linux `poll` 模型：`select` 的增强版蜗牛沐雨异步编程并发编程 C++linux 网络编程并发编程
在LinuxI/O多路复用模型中，poll紧随select之后，作为其功能更强大、限制更少的继任者。虽然select在处理并发连接方面迈出了重要一步，但其自身的一些缺陷促使了poll的诞生。poll模型同样允许单个进程同时监控多个文件描述符，等待I/O事件，但在文件描述符数量限制和接口使用上进行了优化。poll为什么比select更优？select的一个主要痛点是其对文件描述符数量的硬性限制（通常
软件著作权代码提取——固定页数 antzou java eclipse gitee 个人开发
文章目录背景目标实现下载背景协助公司完成软著申报的工作之一就是提供项目60页word源码。目标选择项目：可读取目录以及子目录。输出设置：页数、每页行数。操作便捷：免安装、免注册，开箱即用，一看就懂，有手就行。安全使用：离线工作、100%使用本地能力，0信息泄露。实现基于EclipseRCP技术框架开发,企业级应用的技术。软件著作权代码提取——固定页数下载antrcp-Assistant蚂蚁(离线)
GPS-SDR-SIM与HackONE的融合：C++实现的高效GPS模拟 m0_57781768 c++开发语言
GPS-SDR-SIM与HackONE的融合：C++实现的高效GPS模拟前言在现代导航技术中，全球定位系统（GPS）无疑是最重要的工具之一。然而，随着技术的发展，GPS模拟器在安全测试、导航系统开发和教育等领域的应用也越来越广泛。GPS-SDR-SIM是一个开源的GPS模拟软件，通过软件定义无线电（SDR）技术，能够生成GPS信号，并用于各种GPS接收器的测试。HackONE是一种流行的SDR硬件
2024年BCSP-X小高组基础知识题目（模拟题）天秀信奥编程培训 #BCXP-X模拟题北京BCSP-X试题讲解专栏 BCSP-X c++算法数据结构
一、单项选择计算机的核心部件是什么（）？A.显示器B.键盘C.中央处理器（CPU)D.鼠标将十进制小数9.375转换为二进制小数，其正确的二进制表示是（）。A.1001.11B.1011.11C.1001.011D.1011.011假设有一个内存显示为96MB的文件夹，里面存储的都是分辨率为1024×2048的24位图像，请问理论上存储了（）张图像？(不考虑图像技术压缩对内存的优化)A.16张B.
16.2 Docker多阶段构建实战：LanguageMentor镜像瘦身40%，支持500+并发1.2秒响应！少林码僧 docker langchain windows 人工智能语言模型 llama 运维
LanguageMentorAgent容器化部署与发布：Docker镜像创建与测试关键词：Docker容器化部署,多阶段构建,镜像分层优化,环境一致性,私有化模型集成1.Dockerfile最佳实践架构设计通过多阶段构建策略实现开发与生产环境分离：
HTML中引入JavaScript的三种方式北冥郇翔 javascript html 前端
在HTML中引入JavaScript主要有以下三种方式，每种方式都有其适用场景和注意事项：1.内嵌方式（在标签内直接编写代码）直接在HTML文件的或中使用标签编写JavaScript代码。特点：代码与HTML混合，适用于简单逻辑或快速测试。alert()等函数会阻塞HTML页面渲染（如引用[1]所示）。示例：window.alert("页面加载被阻塞！");//阻塞后续内容渲染2.外部引入方式（推
ROS：录制相机、IMU、GNSS等设备数据吃水果不削皮视觉组合导航 ROS VIO
文章目录简介录制数据️准备工作录制相机录制串口设备录制数据项目地址简介在ROS中，录制传感器数据（如相机、IMU等）常使用rosbag工具，它可以将ROS话题消息保存为.bag文件，供后续回放或分析。本文使用jetson-tx2核心板作为录制平台，录制微光相机数据和六轴IMU数据，用于相机标定、IMU标定、相机-IMU联合标定与VIO轨迹分析。相机标定详见：相机-IMU联合标定：相机标定IMU标定
Java/Kotlin 主线程IO操作全方位监控指南（实战代码+性能优化）时小雨 Android实战与技巧 android kotlin
本文涵盖从基础监控到高级诊断的全套解决方案，包含10+个可直接落地的代码示例一、为什么需要监控主线程IO？主线程IO阻塞会导致界面卡顿、响应延迟等严重问题。典型场景：文件读写阻塞UI渲染网络请求未使用异步线程数据库查询未优化日志输出同步阻塞二、代码级监控方案（Kotlin实现）1.装饰器模式监控流操作classMonitoredInputStream(privatevalorigin:InputS
Day 11：Shell工具库：从“刀耕火种“到“工业革命“的效率飞跃 zhysunny Shell编程 linux
目录一、jq：JSON处理的"瑞士军刀"1.基础查询（比grep更精准）2.高级转换技巧3.实战：JSON日志分析二、curl：API调试的"特种部队"1.诊断技巧（看到隐藏细节）2.高级参数技巧3.实战：API健康检查三、parallel：释放多核威力的"核按钮"1.基础并行化2.性能对比实验3.实战：批量图片转换四、效率工具：打造你的"命令行智库"1.自制备忘系统2.终端工作流优化五、调试工具
Spring AI入门教学：从零搭建智能应用（2025最新实践）程序员子固 spring 人工智能 java ai
目录引言：为什么选择SpringAI？一、环境搭建（附避坑指南）1.开发环境要求2.依赖配置二、实战：智能客服接入（代码级详解）1.配置模型参数2.实现流式对话接口三、高级功能：多模态AI开发1.图像描述生成2.智能文档处理四、开发者工具箱1.调试技巧2.性能优化五、学习路径建议引言：为什么选择SpringAI？随着生成式AI技术的爆发式发展（如OpenAI的GPT-4.5新动态24），Java开
ActixWeb框架实战案例精萃 KENYCHEN奉孝 Rust 前端 rust 后端开发语言
使用ActixWeb框架编写的简易案例以下是一些使用ActixWeb框架编写的简易案例示例，涵盖常见功能，每个案例均以独立代码块展示：基础路由与响应useactix_web::{get,App,HttpServer,Responder};#[get("/")]asyncfnhello()->implResponder{"Hello,ActixWeb!"}#[actix_web::main]asyn
DeepSeek-V3混合精度推理（FP8/BF16）原理与实战全解析 CarlowZJ DEEPSEEK-V3
目录摘要混合精度推理的背景与意义DeepSeek-V3混合精度架构设计FP8与BF16核心原理详解混合精度推理核心实现实践案例：FP8权重转BF16与推理部署常见问题与注意事项最佳实践与扩展建议总结参考资料附录：可视化图表1.摘要本文系统梳理DeepSeek-V3在FP8/BF16混合精度推理方面的架构设计与工程实现，结合源码与实际案例，帮助开发者深入理解其混合精度推理原理、工程落地方法与性能优化
c语言寄存器技巧（struct 和 union）盼雨落，等风起 c语言面试 c语言 c++算法
参考：C语言|位域的使用详解测试代码#includestructpack{unsignedinta:2;//取值范围为：0~3unsignedintb:4;//取值范围为：0~15unsignedintc:6;//取值范围为：0~63};unionu1//u1表示联合体类型名{//unsignedintb;structpackf;unsignedintb;};intmain(void){struc
高通 audio pal 配置文件盼雨落，等风起 audio 音视频
一、PAL配置文件解析1.mixer_paths.xml-硬件控制中枢核心作用：物理通路定义：建立Codec寄存器到音频端点的信号链路动态控制：运行时通过ALSAControlAPI（如amixerset"SpkrLeftPAVolume"25）实时调整参数平台适配：文件命名规则mixer_paths__.xml（如mixer_paths_sm8550-demo.xml）调试技巧：使用tinymi
JDBC工具类小布不吃竹数据库 java
目录引言一、JDBC连接数据库步骤1.加载驱动2.获取连接（URL用户名密码）3.编写sql4.获取执行sql的stmt的对象5.执行sql拿到结果集6.遍历结果集7.关闭资源（先开的后关后开的先关）二、JDBC工具类版本一：基础JDBC工具类(JdbcUtils)版本二：配置化JDBC工具类(JdbcUtils2)版本三：连接池JDBC工具类(JdbcUtils3)测试总结引言JDBC(Java
一套源码搞定教育平台搭建？Web端网校系统开发详解万岳科技程序员小金教育平台开发 APP开发软件开发在线教育系统源码教育APP开发网校平台搭建 PHP uniapp
曾经线下授课、纸质教材为主的传统教育模式，逐步被智能化、在线化、个性化的“云课堂”所替代。而Web端网校系统，正成为搭建在线教育平台的核心载体。许多教育机构、企业培训部甚至个体讲师都在思考一个问题：是否可以通过一套完整的网校系统源码，就快速搭建出属于自己的在线教育平台？答案是肯定的，但背后涉及的技术、架构与运营逻辑，却远非“买个源码一部署”这么简单。今天，就以笔者在Web端网校系统开发中的实践经验
Python多线程实现FTP密码破解技术指南不胖的羊
本文还有配套的精品资源，点击获取简介：本文主要介绍在Python环境下，使用多线程技术提升FTP密码安全性测试的效率。通过threading模块实现多线程，每个线程尝试一个密码，大幅加快破解过程。详细阐述了ftpbrute.py脚本的关键实现部分，包括导入库、定义密码字典、创建线程类、启动线程、等待线程完成以及添加错误处理和安全措施。需要注意的是，未经授权的密码破解活动是非法的，必须在合法授权的情
Excel处理控件Aspose.Cells教程：Java 在 Excel 中插入和删除行和列
Aspose.Cells是Excel电子表格编程API，可加快电子表格的管理和处理任务，支持构建能够生成，修改，转换，呈现和打印电子表格的跨平台应用程序。同时不依赖于MicrosoftExcel或任何MicrosoftOfficeInterop组件，AsposeAPI支持旗下产品覆盖文档、图表、PDF、条码、OCR、CAD、HTML、电子邮件等各个文档管理领域，为全球.NET、Java、C++等1
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

YUV视频格式到RGB32格式转换的速度优化 下篇

你可能感兴趣的:(优化,框架,测试,byte,平台,编译器)

YUV视频格式到RGB32格式转换的速度优化下篇