superkris

使用ARM汇编进行3D加速

在vc2005下SIMD函数定义的地方

#ifdef ENABLE_SSE
#include
#endif

#ifdef ENABLE_SSE2
#include
#endif

以下为网络摘编

浮点

ARM 浮点体系结构 (VFP) 为半精度、单精度和双精度浮点运算中的浮点操作提供硬件支持。它完全符合 IEEE 754 标准，并提供完全软件库支持。

ARM VFP 的浮点功能为汽车动力系统、车身控制应用和图像应用（如打印中的缩放、转换和字体生成以及图形中的 3D 转换、FFT 和过滤）中使用的浮点运算提供增强的性能。下一代消费类产品（如 Internet 设备、机顶盒和家庭网关）可直接从 ARM VFP 受益。

NEON

ARM^® NEON™ 通用 SIMD 引擎可有效处理当前和将来的多媒体格式，从而改善用户体验。

NEON 技术可加速多媒体和信号处理算法（如视频编码/解码、2D/3D 图形、游戏、音频和语音处理、图像处理技术、电话和声音合成），其性能至少为 ARMv5 性能的 3 倍，为 ARMv6 SIMD 性能的 2 倍。

NEON 技术是通过干净方式构建的，并可无缝用于其本身的独立管道和寄存器文件。

NEON 技术是 ARM Cortex™-A 系列处理器的 128 位 SIMD（单指令，多数据）体系结构扩展，旨在为消费性多媒体应用程序提供灵活、强大的加速功能，从而显著改善用户体验。它具有 32 个寄存器，64 位宽（是 16 个寄存器，128 位宽的双倍视图。）

NEON 指令可执行“打包的 SIMD”处理：

寄存器被视为同一数据类型的元素的矢量
数据类型可以为：签名/未签名的 8 位、16 位、32 位、64 位单精度浮点
指令在所有通道中执行同一操作

使用 NEON 技术的 ARM Cortex™-A 系列处理器，以及 ARM 的 Mali 多媒体硬件解决方案可用于多媒体应用程序，范围从智能手机和移动计算设备到 HDTV。

X86的SIMD指令 ...simd instrucitons in X86

IA-32 Intel体系结构的指令主要分为以下几类 [1]：

通用
x87 FPU
MMX技术
SSE/SSE2/SSE3扩展

MMX/SSE类扩展引入了SIMD（单指令多数据）的执行模式，可用于加速多媒体应用。下面简要介绍一下这些指令的执行环境和特征。

8个32位通用寄存器可为各个SIMD扩展所使用；
MMX：8个64位MMX寄存器（mm0 - mm7），也可为各SSE扩展所使用；
- 数据为整数，最多支持两个32位
- 运算中没有寄存器能够进行溢出指示
SSE：8个128位xmm寄存器，MXSCR寄存器，EFLAGS寄存器
- 支持单精度浮点
- MXSCR含有rounding, overflow标志
- 支持64位SIMD整数
SSE2：执行环境同sse
- 双精度浮点
- 128位整数
- 双—单精度转换
SSE3：与Inte Prescott处理器一同发布不久，共13条指令
- 主要增强了视频解码、3D图形优化和超线程性能

MMX技术出现最早，目前几乎所有的X86处理器都提供支持，包括嵌入式X86，所以下面的讨论主要基于MMX，但方法完全适用于SSEn，包括像AMD的3D Now等其它SIMD扩展。

MMX指令又分为以下几种：

数据传送：movd, movq
数据转换：packsswb, packssdw, packuswb, punpckhbw, punpckhwd, punpckhdq, punpcklbw, punpcklwd, punpckldq
并行算术：paddb, paddw, paddd, paddsb, paddsw, paddusb, paddusw, psubb, psubw, psubd, psubsb, psubsw, psubusb, psubusb, psubusw, pmulhw, pmullw, pmaddwd
并行比较：pcmpeqb, pcmpeqw, pcmpeqd, pcmpgtb, pcmpgtw, pcmpgtd
并行逻辑：pand, pandn, por, pxor
移位与旋转：psllw, pslld, psllq, psrlw, psrld, psrlq, psraw, psrad
状态管理：emms

这些指令除了需要注意功能外，还需要注意处理的数据类型。以上内容为背景介绍，细节请参考手册。

回页首

性能优化 ...Performance Optimization

当使用C/C++完成了一个嵌入式应用的所有功能，性能问题常摆在面前，这时可以使用profile工具(如gprof)找出产生瓶颈的函数，将这些函数使用汇编彻底重写，例如MPEG-4编解码器xvid项目 [4]就使用了这种方法，而且针对不同处理器／指令集分别给出了不同的优化，正是如此该项目无论功能、还是性能均为一流，显然这是深度优化的目标所在。

在使用流水线、VLIW以及SIMD的体系结构（比如某些DSP）上，整个函数的手工优化可以带来几倍到几十倍的性能提升。不过，性能允许，对于函数内关键部分使用一些特定的实现，既突出重点提高性能，又可以尽多地利用C/C++的高级特征，相对缩短开发周期。下面给出使用GCC时，应用MMX指令的几种混合编程方法：

Intel C/C++ 编译器intrinsics
GCC builtin操作
嵌入汇编asm construct

回页首

Intel C/C++ 编译器intrinsics ...Intel C/C++ Compiler Intrinsics

查看IA-32 Intel指令集手册 [2]时，部分指令的解释中会有一项“Intel C/C++ Compiler Intrinsic Equivalent”，会指出该指令对等的intrinsic。 intrinsic在C/C++程序中的语法是以函数形式出现，编译时可以直接翻译为一条MMX指令（复合情况会生成最直接的几条），换言之，如果不使用intrinsic，可能需要多条C/C++语句完成，而编译器却并不能保证将这几条语句能够生成这条最高效的MMX指令。并不是每条MMX指令都有对等的intrinsic，手册的附录中列出了所有的，它们分为简单型（simple）和复合型（composite）两种，每个简单型的就是对应一条指令，而复合型则对应多条指令。

GCC支持Intel C/C++ Compiler Intrinsics。用法如下示例：

      #include 
  
   
      #include 
   
     /*一定需要包括此头文件*/ /*gcc -Wall -march=pentium4 -mmmx -o ins mmx_ins.c*/ int main(int argc,char *argv[]) { /*使用MMX做以下向量的点积*/ short in1[] = {1, 2, 3, 4}; short in2[] = {2, 3, 4, 5}; int out1; int out2; __m64 m1; /* MMX支持64位整数的mm寄存器 */ __m64 m2; /* MMX操作需要使用mm寄存器 */ __m128 m128; /* for SSEn only*/ /*每次往mm寄存器装入两个short型的数，注意是两个*/ m1 = _mm_cvtsi32_si64(((int*)in1)[0]); m2 = _mm_cvtsi32_si64(((int*)in2)[0]); /*一条指令进行4个16位整数的乘加*/ /*生成两个32位整数*/ m2 = _mm_madd_pi16(m1, m2); /*将低32位整数放入通用寄存器*/ out1 = _mm_cvtsi64_si32(m2); /*将高32位整数右移后，放入通用寄存器*/ m2 = _mm_slli_pi32(m2, 32); out2 = _mm_cvtsi64_si32(m2); /*清除MMX状态*/ _mm_empty(); /*将两个32位数相加，结果为8*/ out1 += out2; printf("a: %d/n", out1); return(0); }

几点说明：

即使你不是P4平台，编译时也请使用以下选项，
/*gcc -Wall -march=pentium4 -mmmx -o ins mmx_ins.c*/
否则，会出现如下类似信息：
...xmmintrin.h:34:3: #error "SSE instruction set not enabled"
最终结果实际并没有求得四对乘积的和，只是前两对的， instrinsic _mm_cvtsi32_si64只向mm寄存器放入了低32位，高32位为零，但mmx有指令movq可以做到64位的数据传送，intrinsic没有对应，这也说明并不是所有的指令有等价的intrinsic。
当计算的向量为两对0x8000, 0x8000时，即(-2^15)*(-2^15) + (-2^15)*(-2^15) ，结果应该为 2^31，但计算出来的值是 -2^31，因为发生了溢出，可程序无从知道。这是使用MMX时，应特别注意的，计算溢出没有任何标志位指示，一个极大的值变为极小，SSE对此做了改善。
程序不再使用MMX之时，注意使用emms指令清除MMX状态。

回页首

使用built-in操作 ...GCC built-in Operation

什么是built-in操作？就是对待MMX操作数，就如int, float等基本数据类型一般，有相应定义的操作，如加(+)、减(-)，或者数据类型之间的转换。详细内容参考GNU GCC Manual [5] Extensions to the C Language Family4#4Built-in Functions4#4 X86 Built-in Functions一节。

一些MMX指令有其相应的built-in操作，下面一段代码为例：

      #include 
  
   
      /*无需特别的头文件，built-in嘛*/
      /* gcc -Wall  -o bins  builtinmmx.c*/
      /*定义了一个vector数据类型，hi表示16位，4表示4个*/
      typedef int v4hi __attribute__ ((mode(V4HI)));
      /*定义了2个32位的vector类型，si表示32位*/
      typedef int v2si __attribute__ ((mode(V2SI)));
      int main(int argc,char *argv[])
      { 
        short pa[4] = {0x8000, 0x8000, 1, -1};
        short pb[4] = {0x8000, 0x7FFF, -1, -2};
        
        v4hi va, vb;
        v4hi vsum;
        
        va = ((v4hi*)pa)[0];
        vb = ((v4hi*)pb)[0];
        
        /* 4个16位进行饱和加 */
        //vsum = __builtin_ia32_paddsw(va, vb);
        /* 4个16位还可以直接进行加法，但不同于两个long long相加 */
        vsum =  va + vb;
        
        /*vector的输出还需要强制转换为long long*/
        printf("...with MMX instructions...to compute vec_add: %llx /n", (long long)vsum);
        
        //结果1：0xfffd0000ffff8000
        //结果2：0xfffd0000ffff0000
        
        return(0);
      }

几点说明：

是的，这里built-in vector及其操作，随着GCC的发展正在加强。如果需要使用以上范例，应使用GCC 3.4以上版本；
使用builtin函数时，与intrinsic相似；但本质却是不同，这里两个向量使用‘+’操作就说明了vector也如其它数据类型一样，编译器直接支持，只不过这里的加法就是指四个单元数分别相加，低位单元的进位不会影响相邻高位单元的数据；
vector还可以强制转换为通用数据。

回页首

嵌入汇编 ...Inline asm

GCC一开始就允许C代码中嵌入asm指令，并不只是针对MMX指令，不过对于MMX技术，显然也是一个很好的利用方法，详细的语法请参考GNU GCC手册 [5]，或者GCC: The Complete Reference [6]''Inline Assembly''一节。如下是一个点积的例子：

      #include 
  
   
      /** GCC -o ins  inlinemmx.c **/
      int main(int argc,char *argv[])
      { 
        int i;
        int result;
        short a[] = {1, 2, 3, 4, 5, 6, 7, 8};
        short b[] = {1, 1, 1, 1, 1, 1, 1, 1};
        printf("...with MMX instructions.../n");
        
        /*首先，将点积合累积寄存器清零，实际缺省就为0？*/
        asm("pandn %%mm5,%%mm5;"::);
        /*读入a, b，每四对数相乘后分两组相加，形成两组和*/
        /*这里的循环控制是C在做*/
        for(i = 0; i < sizeof(a)/sizeof(short); i += 4){
          asm("movq %0,%%mm0;/
          movq %1,%%mm1;/
          pmaddwd %%mm1,%%mm0;/
          paddd %%mm0,%%mm5; #相乘后相加 "
          :
          : "m" (a[i]), "m" (b[i]));
        }
        /*将两组和分离，并相加*/
        asm("movq %%mm5, %%mm0;/
        psrlq $32,%%mm5;/
        paddd %%mm0, %%mm5;/
        movd %%mm5,%0;/
        emms"
        :"=r" (result)
        :);
        printf("result: 0x%x/n", result);
        //这里结果为0x24
        return(0);
      }

几点说明：

这里是典型的在函数中C和汇编混合编程；
注意汇编指令中操作数的顺序；
这里可以直接使用movq等没有intrinsics/built-in对应的指令；
注意在asm指令序列中间不要加杂注释，可能导致生成的代码不正确。

回页首

MMX实用一例：合成滤波器 ...Synthesis Filter in X86 SIMD INSTRUCTIONS

下面是合成滤波器(Synthesis Filter)的一个优化过程，合成滤波器在语音编解码中有广泛应用，运行时也占用了整个算法中较高比例的时间。

      for (i = 0; i < lg; i++)
      {
        s = L_mult(x[i], a[0]);/*L_mult是相乘后左移*/
        for (j = 1; j <= M; j++){/*M这里固定为10*/
          s = L_msu(s, a[j], yy[-j]);/*L_msu是乘减后左移操作*/
        }
	
        s = L_shl(s, 3); /*左移三位*/
        *yy++ = g729round(s);
      }
      #endif

上面的代码，因为内存循环为10，可以考虑展开，并统一操作为乘加指令。

      /*为了使用乘加操作，需要调整10个系数的顺序*/
      for(i = 0; i < M; i++)
        ta[i] = -a[M - i];
      ta[11] = 0;
      ta[10] = a[0];
      for (i = 0; i < lg; i++){
        *yy = x[i];
        yy[1] = 0;
        s = L_mac(s, ta[11], yy[1]);
        s = L_mac(s, ta[10], yy[0]);
        s = L_mac(s, ta[9], yy[-1]);
        s = L_mac(s, ta[8], yy[-2]);
        s = L_mac(s, ta[7], yy[-3]);
        s = L_mac(s, ta[6], yy[-4]);
        s = L_mac(s, ta[5], yy[-5]);
        s = L_mac(s, ta[4], yy[-6]);
        s = L_mac(s, ta[3], yy[-7]);
        s = L_mac(s, ta[2], yy[-8]);
        s = L_mac(s, ta[1], yy[-9]);
        s = L_mac(s, ta[0], yy[-10]);
        
        s = L_shl(s, 3);
        *yy++ = g729round(s);
      }

以上循环内核正好可以将MMX的8个寄存器全部利用。

      /*为了使用乘加操作，需要调整10个系数的顺序*/
      for(i = 0; i < M; i++)
        ta[i] = -a[M - i];
      ta[11] = 0;
      ta[10] = a[0];
      /*11个系数分别放入3个MMX寄存器，0作填充*/
      asm("movq %0,%%mm0;/
      movq %1,%%mm1;/
      movq %2,%%mm2"/
      :/
      : "m" (ta[0]), "m" (ta[4]), "m"(ta[8]));
      
      /*利用MMX技术进行滤波器核心操作*/
      for (i = 0; i < lg; i++){
        *yy = x[i];
        yy[1] = 0;
        asm("pandn %%mm6,%%mm6;/
        movq %1,%%mm3;/
        movq %2,%%mm4;/
        movq %3,%%mm5;/
        pmaddwd %%mm0,%%mm3;/
        pmaddwd %%mm1,%%mm4;/
        pmaddwd %%mm2,%%mm5;/
        paddd %%mm3, %%mm6;/
        paddd %%mm4, %%mm6;/
        paddd %%mm5, %%mm6;/
        movq  %%mm6, %%mm7;/
        psrlq $32, %%mm6;/
        paddd %%mm7, %%mm6;/
        movd %%mm6,%0;/
        emms"
        :
        :"r"(s), "m" (yy[-10]), "m" (yy[-6]), "m"(yy[-2]));
	/*因为指令结果饱和属性的限制，s还没有左移，所以下面多做一位饱和左移*/
        s = L_shl(s, 4);
        *yy++ = g729round(s);
      }

几点说明：

注意：以上嵌入的汇编代码输出结果s放在了输入处，属于实践中的个案；
MMX没有乘左移之类的DSP指令，甚至还没有加饱和之类的操作，SSE中有一定增强；
以上操作，理论上存在溢出可能，所以最后使用原有的饱和左移操作，减少了一定风险；
上面的部分代码操作显然允许并行，这在VLIW系统中十分有用；
这已经形成了该滤波器全面优化的核心。

回页首

总结 ...Conclusion

如果愿意尽多地利用SIMD技术，可能需要更多地使用汇编级的编码，不过也有一些高级语言和汇编的混合编程技术能够帮助你，它们有的提高性能更大一些，有的形式上更优雅些，本质上效率也不错，都不失好的方法，建议尝试。

正是如此，一方面CPU上支持越来越多的SIMD指令集扩展，另一方面GCC也正在加紧支持这些扩展的易用，对，正在，碰到一些问题，先想办法绕过去，这里使用GCC 3.4.1，根据经验效果还是不错的。

回页首

关于文档

GCC中SIMD指令的应用方法

This document was generated using the LaTeX2HTML translator Version 2002 (1.62)

Copyright ® 1993, 1994, 1995, 1996, Nikos Drakos, Computer Based Learning Unit, University of Leeds.
Copyright ®, 1998, 1999, Ross Moore, Mathematics Department, Macquarie University, Sydney.

The command line arguments were: latex2html -iso_language CN -html_version 4.0,unicode -address '®2004 CoreUp Designs' -local_icons -split 0 -nonavigation gccsimd

The translation was initiated by on 2004-12-13

参考资料

Intel: IA-32 Intel Architechture Software Developer's Manual, Volume 1: Basic Architecture(2002)
Intel: IA-32 Intel Architechture Software Developer's Manual, Volume 2: Instruction Set Reference(2003)
Intel: IA-32 Intel Architechture Software Developer's Manual, Volume 3: System Programming Guide(2003)
XviD.org，http://www.xvid.org/(up-to-date)
GNU, GCC online documentation, http://www.gnu.org/software/GCC/onlinedocs/(up-to-date)
Authur Griffith, GCC: The Complete Referencea, McGraw Hill(2002)

关于作者

钱浙滨，1999年从上海交通大学图像处理与模式识别研究所获得博士学位，曾参与完成计算机视觉、正规语言和移动通信等方面的研发工作；目前他和他的团队主要从事DSP系统开发，特别是多媒体编解码算法的性能优化，以及相关的Linux嵌入式应用；他们也提供WLAN相关的技术咨询，欢迎访问 http://embeddedcore.com进行交流。

使用 certbot 在centos7 搭建ssl证书自动并且续约 TwoSs110 ssl https
第一步，确定服务器适合安装的certbot版本sudoyuminstallpython27如果上述方法不起作用，你可以尝试编译安装。首先，你需要安装编译Python所需的依赖包。sudoyuminstallgccmakeopenssl-develsqlite-develreadline-develzlib-develbzip2-devel接下来，下载Python2.7.5的源代码，并进行编译安装。
PCIe信号传输的幕后：HCSL与LP-HCSL深度解析赛卡单片机嵌入式硬件服务器人工智能硬件架构 fpga开发
在数字化浪潮席卷的当下，PCIe（PeripheralComponentInterconnectExpress）作为高速串行计算机扩展总线标准，已然成为计算机内部硬件设备连接领域的中流砥柱。其信号传输的质量与完整性，恰似计算机系统运行的“命门”，对系统整体性能起着决定性作用。在PCIe体系架构里，HCSL（High-speedCurrentSteeringLogic）与LP-HCSL（Low-Po
Tornado 初识 Wu_Candy Web服务器
一、什么是tornadoTornado是使用Python编写的一个强大的、可扩展的Web服务器。它在处理严峻的网络流量时表现得足够强健，但却在创建和编写时有着足够的轻量级，并能够被用在大量的应用和工具中。二、tornado有什么优势Tornado和现在的主流baiduWeb服务器框架（包括大多数Python的框架）有着明显的区别：它是非阻塞式服务器，而且速度相当快，得利于其非阻塞的方式和对epol
黑板模式（Blackboard Design Pattern）。软件求生黑板模式设计模式
意图黑板模式是观察者模式的一个扩展，知名度并不高，但是我们使用的范围却非常广。黑板模式的意图如下：允许消息的读写同时进行，广泛的交互消息。简单的说，黑板模式允许多个消息读写者同时存在，消息的生产者和消费者完全分开。这就像一个黑板，任何一个教授（消息的生产者）都可以在其上书写消息，任何一个学生（消息的消费者）都可以从黑板上读取消息，两者在空间和时间上可以解耦，并且互不干扰。黑板模式确实是消息的广播，
庖丁解java(一篇文章学java) 庖丁解java java 开发语言
(大家不用收藏这篇文章,因为这篇文章会经常更新,也就是删除后重发)一篇文章学java,这是我滴一个执念...当然,真一篇文章就写完java基础,java架构,java业务实现,java业务扩展,根本不可能.所以,这篇文章,就是一个索引,索什么呢?请看下文...关于决定开始写博文的介绍(一切故事的起点源于这一次反省)中小技术公司的软扩展(微服务扩展是否有必要?)-CSDN博客SpringCloud(
Exception in thread “main“ java.lang.NoSuchMethodError: Awesome Baron java java vscode
在VScode中运行代码调试力扣程序报错：Exceptioninthread“main”java.lang.NoSuchMethodError:‘intSolution.subarraySum(int[],int)’attest_560.main(test_560.java:9)原因是因为在不同的.java程序中使用了同名的Solution类，导致编译器和运行时选择的类不一致。解决方案：只保留一个
MCU的工作原理：嵌入式系统的控制核心绿算技术 MCU架构介绍单片机嵌入式硬件
MCU的工作原理可以概括为以下几个步骤：1.初始化上电后，MCU从Flash存储器中加载程序代码，并初始化外设和寄存器。2.任务执行根据程序逻辑，MCU执行数据处理、外设控制和通信等任务。通过中断系统实时响应外部事件。3.低功耗管理在空闲时，MCU进入低功耗模式，等待外部事件唤醒。4.结果输出通过GPIO、通信接口或模拟接口输出处理结果。MCU的架构：模块化与可扩展性MCU的架构设计注重模块化和可
useblackbox黑箱AI编码助理百态老人 python 开发语言
黑箱AI是一个人工智能的编码助理可以让代码快10倍。它使您能够把任何问题变成代码和功能,如从任何视频提取代码和代码自动完成。它有以下几个特点：可以从视频、图片、PDF等格式中复制代码。可以将任何问题转换成代码。可以快速找到任何代码片段，并开始编码。支持20多种编程语言的代码自动补全。有Chrome扩展和VSCode扩展。这个网站有不同的收费方案，根据你需要的功能和使用量而定。它有以下几种选择：好开
2025年Python生态全景：从AI霸主到量子计算，揭秘其不可替代的技术魅力南玖yy python 人工智能量子计算
在2025年的技术浪潮中，Python凭借其极简的语法、庞大的生态系统以及跨领域融合能力，依然稳坐编程语言界的“头把交椅”。尽管Java等语言在AI领域发起挑战，但Python通过持续的技术革新和生态扩展，展现出不可撼动的生命力。本文将从技术趋势、行业应用与未来挑战三个维度，解析Python的“常青”密码。一、AI领域的持续主导：生态优势与工具革新Python在AI领域的统治地位仍未动摇。尽管有观
深入 Python 网络爬虫开发：从入门到实战南玖yy python python爬虫
一、为什么需要爬虫？在数据驱动的时代，网络爬虫是获取公开数据的重要工具。它可以帮助我们：监控电商价格变化抓取学术文献构建数据分析样本自动化信息收集二、基础环境搭建1.核心库安装pipinstallrequestsbeautifulsoup4lxmlseleniumscrapy2.开发工具推荐PyCharm（专业版）VSCode+Python扩展JupyterNotebook（适合调试）三、爬虫开发
DPU的架构：模块化与可扩展性绿算技术 DPU架构介绍架构科技缓存算法
DPU的架构设计注重模块化和可扩展性，以下是其典型架构：1.网络接口模块支持高速网络接口，例如100GbE、200GbE，甚至更高带宽的接口。2.处理核心模块包括多个ARM核心和专用加速核心，用于处理控制平面和数据平面任务。3.硬件加速模块包括网络加速引擎、存储加速引擎、加密引擎等，用于加速特定任务。4.内存与缓存集成高速内存和缓存，用于存储临时数据和指令。5.PCIe接口模块提供与主机CPU的高
DPU的未来：技术趋势与挑战绿算技术 DPU架构介绍科技 gpu算力硬件工程缓存架构
随着数据中心的不断发展，DPU技术也在快速演进。以下是DPU未来的技术趋势与挑战：1.更高性能·支持更高的网络带宽（如400GbE、800GbE）和更低的延迟。2.更广泛的应用·在AI、5G、物联网等领域，DPU的应用将进一步扩展。3.软件生态的完善·开源工具和开发框架的普及，将降低DPU的开发门槛。4.能效优化·在提升性能的同时，进一步降低功耗，满足绿色计算的需求。总结DPU作为一种新兴的数据处
如何编写vscode的配置文件c_cpp_properties.json 小秋slam实战从零开始学SLAM vscode
文章目录配置`c_cpp_properties.json`文件改变VScode中空格长度VSCode中C/C++无法跳转到定义c_cpp_properties.json安装插件配置c_cpp_properties.json文件假设你已经安装了GCC和G++编译器，{"configurations":[{"name":"Linux","includePath":
基于Java的家居设备控制系统设计与实现不知江月待何人.. java java 开发语言
目录项目目标设计思路系统架构核心实现运行演示存在问题与优化总结项目目标实现四种家居设备（灯/空调/电视/洗衣机）的智能控制系统，要求：统一管理设备开关状态支持状态反转操作提供简洁的控制接口具备扩展性支持新设备接入设计思路面向对象设计原则抽象原则：通过接口定义通用行为继承机制：建立家电父类统一管理基础属性多态应用：使用父类数组管理子类对象单例模式：控制系统唯一入口类关系图«interface»Swi
Java final关键字不知江月待何人.. java java 开发语言
一、final关键字概述final是Java中用于限制修改的关键字，它可以修饰类、方法和变量，被修饰的实体将具有"不可改变"的特性。合理使用final关键字能提高代码安全性、可读性，并有助于JVM进行优化。二、final修饰类1.特性被final修饰的类不能被继承常用于设计不需要扩展的类或安全敏感类2.代码示例finalclassPerson{//无法被继承的最终类//类内容...}//错误示例：
HOT100——链表篇Leetcode234. 回文链表闪电麦昆️ HOT100 Leetcode 链表数据结构 c++
文章目录题目：Leetcode160.相交链表原题链接思路代码题目：Leetcode160.相交链表给你一个单链表的头节点head，请你判断该链表是否为回文链表。如果是，返回true；否则，返回false。回文是向前和向后读都相同的原题链接回文链表思路将链表中的值全部放入一个vector中我们再对vector进行一个回文判断两个指针left和right指向头尾，判断是否是回文代码
（二分数学推导区间两个数组的距离值）leetcode 1385 维齐洛波奇特利(male) 算法
数学推导：设arr1[i]=x则|x-arr2[j]|x+d而这个数t有三种可能1.刚好等于x-d不满足条件2.大于x-d但是小于等于x+d不满足条件3.大于x+d满足条件那arr2中小于t的值呢，因为t>=x-d所以arr2&arr1,vector&arr2,intd){sort(arr2.begin(),arr2.end());intans=0;for(autox:arr1){autot=ra
每日总结3.13 labubu12 c语言
第十五届蓝桥杯c++省赛大学B组1.小球反弹问题（√）（镜像扩展空间，没有碰撞反弹，小球一直前进，到达出发点镜像后的点）#includeusingnamespacestd;intmain(){longlongx=343720,y=233333;longlongdx=15,dy=17;longlongt=1;while(1){if((t*dx)%x==0&&(t*dy)%y==0){break;}t
Kotlin编程实践-【标准库函数使用场景（let、run、with、apply、also）】 Hello姜先森 Kotlin kotlin java javascript
文章目录前言let用途示例run用途示例with用途示例apply用途示例also用途示例使用场景总结前言Kotlin标准库提供了一些非常有用的扩展函数，如let,run,with,apply,also等，这些函数通常被用作接收一个对象并以某种方式处理它。它们的主要目的是为了使代码更加简洁和易读。下面来说明这些函数的一些常见使用场景。let用途对非空值进行安全的操作，如果值不为空，则执行提供的la
数字马力ai面试题泠波前端
有关前端工程化的工具前端工程化是指将前端开发过程中的各种任务自动化、流程化、标准化，以提高开发效率、代码质量和可维护性。在前端工程化中，通常会用到一些工具来辅助完成各种任务，比如构建、测试、部署等。以下是一些常用的前端工程化工具：1.**构建工具（BuildTools）**-**Webpack**:是一个非常流行的模块打包器，可以处理各种类型的文件，并且支持插件扩展。-**Rollup**:另一个
kotlin与MVVM结合使用总结（一）每次的天空 kotlin 开发语言 android
一、Kotlin与MVVM结合的核心优势代码简洁性数据类（dataclass）简化Model层定义，自动生成equals/hashCode/toString扩展函数简化View层逻辑（如点击事件扩展）lateinit/bylazy优化ViewModel属性初始化异步处理优化协程（Coroutines）替代RxJava，轻量且代码可读性强withContext(Dispatchers.IO)切换线程
webpack5（Module Federation）+vue3.0实现微前端 weixin_42140041 前端奇淫技巧前端 javascript vue.js
项目源码地址：https://github.com/wuxiaohuaer/webpack5-vue-admin一、什么是微前端微前端是一个比较宏观的概念，他的核心就是独立，开发独立、部署独立，比较适合大的团队来进行重量级项目开发。从MicroFrontends官网可以了解到，微前端概念是从微服务概念扩展而来的，摒弃大型单体方式，将前端整体分解为小而简单的块，这些块可以独立开发、测试和部署，同时仍
C# 技术使用笔记：泛型的使用方法 caifox菜狐狸 C#技术使用笔记 c#笔记开发语言泛型 List 装箱拆箱
1.泛型基础1.1泛型的定义与作用泛型是C#语言中一个非常强大且常用的特性，它允许在编写代码时使用类型参数来创建类、方法或接口，而不需要在编写代码时指定具体的类型。类型参数可以是任何类型，直到代码实际执行时，类型才会被确定。例如，常见的泛型类List，其中T就是类型参数，可以是int、string、自定义类Person等。使用泛型的主要好处包括：类型安全：编译器会确保类型安全，避免了运行时的类型转
C#中的设计模式：构建更加优雅的代码 Envyᥫᩣᩚ c#开发语言
C#在面向对象编程（OOP）方面的强大支持，我们可以探讨“C#中的设计模式”。这不仅有助于理解如何更好地组织代码，还能提高代码的可维护性和可扩展性。引言设计模式是软件工程中经过实践验证的解决方案模板，它们提供了一种标准化的方法来解决常见的开发问题。对于使用C#进行开发的程序员来说，理解和应用这些模式可以帮助创建结构良好、易于维护和扩展的应用程序。本文将介绍几种常用的设计模式，并展示如何用C#实现它
贪心算法--将数组和减半的最小操作数 4C++ 数据结构与算法贪心算法算法
本题是力扣2208---点击跳转题目思路：要尽快的把数组和减小，那么每次挑出数组中最大的元素减半即可，由于每次都是找出最值元素，可以用优先队列来存储这些数组元素每次取出最值，减半后再放入优先队列中，操作次数+1，直到数组和小于等于原总和的一半代码：classSolution{public:inthalveArray(vector&nums){doublesum=0;intcnt=0;priorit
LLM之Colossal-LLaMA-2：源码解读(init_tokenizer.py文件)实现基于源词表的扩展、(init_model.py文件)实现过计算均值扩展模型、(prepare_pretr 一个处女座的程序猿 CaseCode NLP/LLMs 精选(人工智能)-中级 Colossal LLaMA-2 自然语言处理
LLM之Colossal-LLaMA-2：源码解读(init_tokenizer.py文件)实现基于jsonl文件中读取新词列表(新中文词汇)→for循环去重实现词表的扩展(中文标记的新词汇)→保存新的分词模型、(init_model.py文件)实现过计算均值来扩展模型的嵌入层以适应新的词汇表，然后保存扩展后的模型、(prepare_pretrain_dataset.py文件)将原始数据集进行处理
IKM 测试题 - Java SE 8 评估测试题目 843294669 java 开发语言
关于JavaSE中this()和super()关键字的使用问题：以下哪些陈述正确描述了JavaSE中this()和super()关键字的使用？选项：如果super()没有被编码，则编译器将生成对零参数超类构造函数的调用。this()和super()可以在同一构造函数中使用。如果使用，this()或super()调用必须始终是构造函数中的第一条语句。this()和super()调用可以在构造函数之外
laravel项目中使用FFMPeg 剪裁视频道系女孩~ php laravel
#运行环境需安装的软件ffmpeg#安装的扩展pbmedia/laravel-ffmpeg:^8.3#扩展文档https://packagist.org/packages/pbmedia/laravel-ffmpeg#引入的类useFFMpeg\Coordinate\TimeCode;useFFMpeg\Format\Video\X264;useFFMpeg\Exception\RuntimeEx
牛客练习赛128（下）筱姌牛客比赛算法 c++BFS DFS 图论动态规划
Cidoai的平均数对题目描述登录—专业IT笔试面试备考平台_牛客网运行代码#include#includeusingnamespacestd;intmain(){intn,k;cin>>n>>k;inttotalAns=0;intrSum=0;vectorex,weights;for(inti=0;i>a>>b;if(bf(rSum+1,0);for(inti=0;i=ex[i];--j){f[
ARM SVC指令小米人er 我的博客 arm开发
在ARM汇编中，SVC（SupervisorCall）指令用于从用户模式切换到特权模式（如Supervisor模式），以便执行操作系统内核提供的服务。它通常用于系统调用。具体作用触发异常：执行SVC指令时，处理器会进入Supervisor模式，并跳转到异常向量表中的SVC异常处理程序。传递参数：SVC指令后的立即数可作为参数传递给异常处理程序，帮助识别具体的系统调用。语法SVC#是一个24位的立即
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

使用ARM汇编进行3D加速

在vc2005下SIMD函数定义的地方

以下为网络摘编

浮点

NEON

你可能感兴趣的:(vector,汇编,gcc,扩展,compiler,编译器)