yxin1322

GCC中SIMD指令的应用方法

Abstract:
X86架构上的多媒体应用开发，如果能够使用SIMD指令进行优化，性能将大大提高。目前，IA-32的SIMD指令包括MMX，SSE，SSE2等几级。在GCC的开发环境中，有几种使用SIMD指令的方式，本文逐一介绍。
Keywords: 优化，GCC, SIMD，MMX，SSE

IA-32 Intel体系结构的指令主要分为以下几类 [1]：
通用
x87 FPU
MMX技术
SSE/SSE2/SSE3扩展
MMX/SSE类扩展引入了SIMD（单指令多数据）的执行模式，可用于加速多媒体应用。下面简要介绍一下这些指令的执行环境和特征。

8个32位通用寄存器可为各个SIMD扩展所使用；
MMX：8个64位MMX寄存器（mm0 - mm7），也可为各SSE扩展所使用；
数据为整数，最多支持两个32位
运算中没有寄存器能够进行溢出指示
SSE：8个128位xmm寄存器，MXSCR寄存器，EFLAGS寄存器
支持单精度浮点
MXSCR含有rounding, overflow标志
支持64位SIMD整数
SSE2：执行环境同sse
双精度浮点
128位整数
双—单精度转换
SSE3：与Inte Prescott处理器一同发布不久，共13条指令
主要增强了视频解码、3D图形优化和超线程性能
MMX技术出现最早，目前几乎所有的X86处理器都提供支持，包括嵌入式X86，所以下面的讨论主要基于MMX，但方法完全适用于SSEn，包括像AMD的3D Now等其它SIMD扩展。

MMX指令又分为以下几种：

数据传送：movd, movq
数据转换：packsswb, packssdw, packuswb, punpckhbw, punpckhwd, punpckhdq, punpcklbw, punpcklwd, punpckldq
并行算术：paddb, paddw, paddd, paddsb, paddsw, paddusb, paddusw, psubb, psubw, psubd, psubsb, psubsw, psubusb, psubusb, psubusw, pmulhw, pmullw, pmaddwd
并行比较：pcmpeqb, pcmpeqw, pcmpeqd, pcmpgtb, pcmpgtw, pcmpgtd
并行逻辑：pand, pandn, por, pxor
移位与旋转：psllw, pslld, psllq, psrlw, psrld, psrlq, psraw, psrad
状态管理：emms
这些指令除了需要注意功能外，还需要注意处理的数据类型。以上内容为背景介绍，细节请参考手册。

当使用C/C++完成了一个嵌入式应用的所有功能，性能问题常摆在面前，这时可以使用profile工具(如gprof)找出产生瓶颈的函数，将这些函数使用汇编彻底重写，例如MPEG-4编解码器xvid项目 [4]就使用了这种方法，而且针对不同处理器／指令集分别给出了不同的优化，正是如此该项目无论功能、还是性能均为一流，显然这是深度优化的目标所在。

在使用流水线、VLIW以及SIMD的体系结构（比如某些DSP）上，整个函数的手工优化可以带来几倍到几十倍的性能提升。不过，性能允许，对于函数内关键部分使用一些特定的实现，既突出重点提高性能，又可以尽多地利用C/C++的高级特征，相对缩短开发周期。下面给出使用GCC时，应用MMX指令的几种混合编程方法：

Intel C/C++ 编译器intrinsics
GCC builtin操作
嵌入汇编asm construct

查看IA-32 Intel指令集手册 [2]时，部分指令的解释中会有一项“Intel C/C++ Compiler Intrinsic Equivalent”，会指出该指令对等的intrinsic。 intrinsic在C/C++程序中的语法是以函数形式出现，编译时可以直接翻译为一条MMX指令（复合情况会生成最直接的几条），换言之，如果不使用intrinsic，可能需要多条C/C++语句完成，而编译器却并不能保证将这几条语句能够生成这条最高效的MMX指令。并不是每条MMX指令都有对等的intrinsic，手册的附录中列出了所有的，它们分为简单型（simple）和复合型（composite）两种，每个简单型的就是对应一条指令，而复合型则对应多条指令。
GCC支持Intel C/C++ Compiler Intrinsics。用法如下示例：

#include
#include /*一定需要包括此头文件*/

/*gcc -Wall -march=pentium4 -mmmx -o ins mmx_ins.c*/

      int main(int argc,char *argv[])
      {
        /*使用MMX做以下向量的点积*/
        short in1[] = {1, 2, 3, 4};
        short in2[] = {2, 3, 4, 5};
        int out1;
        int out2;

        __m64 m1;    /* MMX支持64位整数的mm寄存器 */
        __m64 m2;    /* MMX操作需要使用mm寄存器 */
        __m128 m128; /* for SSEn only*/

        /*每次往mm寄存器装入两个short型的数，注意是两个*/
        m1 = _mm_cvtsi32_si64(((int*)in1)[0]);
        m2 = _mm_cvtsi32_si64(((int*)in2)[0]);

        /*一条指令进行4个16位整数的乘加*/
        /*生成两个32位整数*/
        m2 = _mm_madd_pi16(m1, m2);

/*将低32位整数放入通用寄存器*/
out1 = _mm_cvtsi64_si32(m2);

        /*将高32位整数右移后，放入通用寄存器*/
        m2 = _mm_slli_pi32(m2, 32);
        out2 = _mm_cvtsi64_si32(m2);

/*清除MMX状态*/
_mm_empty();

        /*将两个32位数相加，结果为8*/
        out1 += out2;
        printf("a: %d/n", out1);

return(0);
}
几点说明：

即使你不是P4平台，编译时也请使用以下选项，
/*gcc -Wall -march=pentium4 -mmmx -o ins mmx_ins.c*/
否则，会出现如下类似信息：
...xmmintrin.h:34:3: #error "SSE instruction set not enabled"
最终结果实际并没有求得四对乘积的和，只是前两对的， instrinsic _mm_cvtsi32_si64只向mm寄存器放入了低32位，高32位为零，但mmx有指令movq可以做到64位的数据传送，intrinsic没有对应，这也说明并不是所有的指令有等价的intrinsic。
当计算的向量为两对0x8000, 0x8000时，即 (-215)*(-215) + (-215)*(-215)，结果应该为231，但计算出来的值是-231，因为发生了溢出，可程序无从知道。这是使用MMX时，应特别注意的，计算溢出没有任何标志位指示，一个极大的值变为极小，SSE对此做了改善。
程序不再使用MMX之时，注意使用emms指令清除MMX状态。

什么是built-in操作？就是对待MMX操作数，就如int, float等基本数据类型一般，有相应定义的操作，如加(+)、减(-)，或者数据类型之间的转换。详细内容参考GNU GCC Manual [5] Extensions to the C Language Family->Built-in Functions-> X86 Built-in Functions一节。
一些MMX指令有其相应的built-in操作，下面一段代码为例：

include
/*无需特别的头文件，built-in嘛*/

/* gcc -Wall -o bins builtinmmx.c*/

/*定义了一个vector数据类型，hi表示16位，4表示4个*/
typedef int v4hi __attribute__ ((mode(V4HI)));

/*定义了2个32位的vector类型，si表示32位*/
typedef int v2si __attribute__ ((mode(V2SI)));

      int main(int argc,char *argv[])
      {
        short pa[4] = {0x8000, 0x8000, 1, -1};
        short pb[4] = {0x8000, 0x7FFF, -1, -2};

        v4hi va, vb;
        v4hi vsum;

        va = ((v4hi*)pa)[0];
        vb = ((v4hi*)pb)[0];

        /* 4个16位进行饱和加 */
        //vsum = __builtin_ia32_paddsw(va, vb);

        /* 4个16位还可以直接进行加法，但不同于两个long long相加 */
        vsum = va + vb;

        /*vector的输出还需要强制转换为long long*/
        printf("...with MMX instructions...to compute vec_add: %llx /n", (long long)vsum);

        //结果1：0xfffd0000ffff8000
        //结果2：0xfffd0000ffff0000

        return(0);
      }
几点说明：

是的，这里built-in vector及其操作，随着GCC的发展正在加强。如果需要使用以上范例，应使用GCC 3.4以上版本；
使用builtin函数时，与intrinsic相似；但本质却是不同，这里两个向量使用‘+’操作就说明了vector也如其它数据类型一样，编译器直接支持，只不过这里的加法就是指四个单元数分别相加，低位单元的进位不会影响相邻高位单元的数据；
vector还可以强制转换为通用数据。

GCC一开始就允许C代码中嵌入asm指令，并不只是针对MMX指令，不过对于MMX技术，显然也是一个很好的利用方法，详细的语法请参考GNU GCC手册 [5]，或者GCC: The Complete Reference [6]''Inline Assembly''一节。
如下是一个点积的例子：

#include

/** GCC -o ins inlinemmx.c **/

      int main(int argc,char *argv[])
      {
        int i;
        int result;
        short a[] = {1, 2, 3, 4, 5, 6, 7, 8};
        short b[] = {1, 1, 1, 1, 1, 1, 1, 1};

        printf("...with MMX instructions.../n");

        /*首先，将点积合累积寄存器清零，实际缺省就为0？*/
        asm("pandn %%mm5,%%mm5;"::);

        /*读入a, b，每四对数相乘后分两组相加，形成两组和*/
        /*这里的循环控制是C在做*/
        for(i = 0; i < sizeof(a)/sizeof(short); i += 4){
          asm("movq %0,%%mm0;/
          movq %1,%%mm1;/
          pmaddwd %%mm1,%%mm0;/
          paddd %%mm0,%%mm5; #相乘后相加 "
          :
          : "m" (a[i]), "m" (b[i]));
        }

        /*将两组和分离，并相加*/
        asm("movq %%mm5, %%mm0;/
        psrlq $32,%%mm5;/
        paddd %%mm0, %%mm5;/
        movd %%mm5,%0;/
        emms"
        :"=r" (result)
        :);

printf("result: 0x%x/n", result);
//这里结果为0x24

return(0);
}
几点说明：

这里是典型的在函数中C和汇编混合编程；
注意汇编指令中操作数的顺序；
这里可以直接使用movq等没有intrinsics/built-in对应的指令；
注意在asm指令序列中间不要加杂注释，可能导致生成的代码不正确。

下面是合成滤波器(Synthesis Filter)的一个优化过程，合成滤波器在语音编解码中有广泛应用，运行时也占用了整个算法中较高比例的时间。

      for (i = 0; i < lg; i++)
      {
        s = L_mult(x[i], a[0]);/*L_mult是相乘后左移*/
        for (j = 1; j <= M; j++){/*M这里固定为10*/
          s = L_msu(s, a[j], yy[-j]);/*L_msu是乘减后左移操作*/
        }

        s = L_shl(s, 3); /*左移三位*/
        *yy++ = g729round(s);
      }
      #endif
上面的代码，因为内存循环为10，可以考虑展开，并统一操作为乘加指令。

      /*为了使用乘加操作，需要调整10个系数的顺序*/
      for(i = 0; i < M; i++)
        ta[i] = -a[M - i];

ta[11] = 0;
ta[10] = a[0];

      for (i = 0; i < lg; i++){
        *yy = x[i];
        yy[1] = 0;

        s = L_mac(s, ta[11], yy[1]);
        s = L_mac(s, ta[10], yy[0]);
        s = L_mac(s, ta[9], yy[-1]);
        s = L_mac(s, ta[8], yy[-2]);
        s = L_mac(s, ta[7], yy[-3]);
        s = L_mac(s, ta[6], yy[-4]);
        s = L_mac(s, ta[5], yy[-5]);
        s = L_mac(s, ta[4], yy[-6]);
        s = L_mac(s, ta[3], yy[-7]);
        s = L_mac(s, ta[2], yy[-8]);
        s = L_mac(s, ta[1], yy[-9]);
        s = L_mac(s, ta[0], yy[-10]);

        s = L_shl(s, 3);
        *yy++ = g729round(s);
      }
以上循环内核正好可以将MMX的8个寄存器全部利用。

      /*为了使用乘加操作，需要调整10个系数的顺序*/
      for(i = 0; i < M; i++)
        ta[i] = -a[M - i];

ta[11] = 0;
ta[10] = a[0];

      /*11个系数分别放入3个MMX寄存器，0作填充*/
      asm("movq %0,%%mm0;/
      movq %1,%%mm1;/
      movq %2,%%mm2"/
      :/
      : "m" (ta[0]), "m" (ta[4]), "m"(ta[8]));

      /*利用MMX技术进行滤波器核心操作*/
      for (i = 0; i < lg; i++){
        *yy = x[i];
        yy[1] = 0;

        asm("pandn %%mm6,%%mm6;/
        movq %1,%%mm3;/
        movq %2,%%mm4;/
        movq %3,%%mm5;/
        pmaddwd %%mm0,%%mm3;/
        pmaddwd %%mm1,%%mm4;/
        pmaddwd %%mm2,%%mm5;/
        paddd %%mm3, %%mm6;/
        paddd %%mm4, %%mm6;/
        paddd %%mm5, %%mm6;/
        movq %%mm6, %%mm7;/
        psrlq $32, %%mm6;/
        paddd %%mm7, %%mm6;/
        movd %%mm6,%0;/
        emms"
        :
        :"r"(s), "m" (yy[-10]), "m" (yy[-6]), "m"(yy[-2]));

/*因为指令结果饱和属性的限制，s还没有左移，所以下面多做一位饱和左移*/
        s = L_shl(s, 4);
        *yy++ = g729round(s);
      }
几点说明：
注意：以上嵌入的汇编代码输出结果s放在了输入处，属于实践中的个案；
MMX没有乘左移之类的DSP指令，甚至还没有加饱和之类的操作，SSE中有一定增强；
以上操作，理论上存在溢出可能，所以最后使用原有的饱和左移操作，减少了一定风险；
上面的部分代码操作显然允许并行，这在VLIW系统中十分有用；
这已经形成了该滤波器全面优化的核心。

如果愿意尽多地利用SIMD技术，可能需要更多地使用汇编级的编码，不过也有一些高级语言和汇编的混合编程技术能够帮助你，它们有的提高性能更大一些，有的形式上更优雅些，本质上效率也不错，都不失好的方法，建议尝试。
正是如此，一方面CPU上支持越来越多的SIMD指令集扩展，另一方面GCC也正在加紧支持这些扩展的易用，对，正在，碰到一些问题，先想办法绕过去，这里使用GCC 3.4.1，根据经验效果还是不错的。

Intel: IA-32 Intel Architechture Software Developer's Manual, Volume 1: Basic Architecture(2002)

Intel: IA-32 Intel Architechture Software Developer's Manual, Volume 2: Instruction Set Reference(2003)

Intel: IA-32 Intel Architechture Software Developer's Manual, Volume 3: System Programming Guide(2003)

XviD.org，http://www.xvid.org/(up-to-date)

GNU, GCC online documentation, http://www.gnu.org/software/GCC/onlinedocs/(up-to-date)

Authur Griffith, GCC: The Complete Referencea, McGraw Hill(2002)

GCC中SIMD指令的应用方法
This document was generated using the LaTeX2HTML translator Version 2002 (1.62)

The command line arguments were:
latex2html -iso_language CN -html_version 4.0,unicode -address '©2004 CoreUp Designs' -local_icons -split 0 -nonavigation gccsimd

The translation was initiated by on 2004-12-27

--------------------------------------------------------------------------------

guava loadingCache代码示例 IM 胡鹏飞 Java 工具类介绍
publicclassTest2{publicstaticvoidmain(String[]args)throwsException{LoadingCachecache=CacheBuilder.newBuilder()//设置并发级别为8，并发级别是指可以同时写缓存的线程数.concurrencyLevel(8)//设置缓存容器的初始容量为10.initialCapacity(10)//设置缓存
系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
什么是证书吊销列表？CRL 解释 WoTrusSSL ssl https
数字证书是安全在线互动的支柱，用于验证身份和确保加密通信。但是，当这些证书被盗用或滥用时，必须立即撤销它们以维持信任。这就是证书撤销列表(CRL)的作用所在。CRL由证书颁发机构(CA)维护，对于识别和撤销已撤销的证书，防止其造成危害至关重要。在本指南中，我们将探讨什么是CRL、它们如何运作以及为什么它们对网络安全至关重要。什么是证书吊销列表(CRL)？证书吊销列表(CRL)是证书颁发机构(CA)
有必要获得WHQL测试认证吗，有什么好处？
什么是WHQL认证？WHQL是MicrosoftWindowsHardwareQualityLab的缩写，中文意思是Windows硬件设备质量实验室，主要是对Windows操作系统的兼容性测试，检验硬件产品和驱动程序在windows系统下的兼容性和稳定性。当某一硬件或软件通过WHQL测试时，制造商可以在其产品包装和广告上使用“DesignedforWindows”标志。该标志可以证明硬件或软件已经
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
k8s:安装 Helm 私有仓库ChartMuseum、helm-push插件并上传、安装Zookeeper 云游 docker helm helm-push
ChartMuseum是Kubernetes生态中用于存储、管理和发布HelmCharts的开源系统，主要用于扩展Helm包管理器的功能核心功能‌集中存储‌：提供中央化仓库存储Charts，支持版本管理和权限控制。‌‌跨集群部署‌：支持多集群环境下共享Charts，简化部署流程。‌‌离线部署‌：适配无网络环境，可将Charts存储在本地或局域网内。‌‌HTTP接口‌：通过HTTP协议提供服务，用户
上位机知识篇---SD卡&U盘镜像
常用的镜像烧录软件balenaEtcherbalenaEtcher是一个开源的、跨平台的工具，用于将操作系统镜像文件（如ISO和IMG文件）烧录到SD卡和USB驱动器中。以下是其使用方法、使用场景和使用注意事项的介绍：使用方法下载安装：根据自己的操作系统，从官方网站下载对应的安装包。Windows系统下载.exe文件后双击安装；Linux系统若下载的是.deb文件，可在终端执行“sudodpkg-
【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
LeetCode 148. 排序链表：归并排序的细节解析进击的小白菜 2025 Top100 详解 leetcode 链表算法
文章目录题目描述一、方法思路：归并排序的核心步骤二、关键实现细节：快慢指针分割链表1.快慢指针的初始化问题2.为什么选择`fast=head.next`？示例1：链表长度为偶数（`1->2->3->4`）三、完整代码实现四、复杂度分析五、总结题目描述LeetCode148题要求对链表进行排序，时间复杂度需为O(nlogn)，且空间复杂度为O(logn)。由于链表的特殊结构（无法随机访问），归并排序
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
22、文档：Google Docs的强大与易用性 pear55 探索云技术的无限可能 Google Docs 云端文档语音输入
文档：GoogleDocs的强大与易用性1.GoogleDocs简介GoogleDocs是Google提供的在线办公套件的一部分，它是一个基于云端的文字处
docker-compose方式搭建lnmp环境——筑梦之路筑梦之路 linux系统运维国产化 docker android adb
docker-compose.yml文件#生成docker-compose.ymlcat>docker-compose.ymlnginx/conf.d/default.conf">www/index.phpecho"开始启动服务..."docker-composeup-d#获取本机ipip_addr=$(hostname-I|awk'{print$1}')echo"部署完成！"echo"访问测试页
ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
Android ViewBinding 使用与封装教程积跬步DEV Android 开发实战大全 android
AndroidViewBinding使用与封装教程：一、ViewBinding是什么？核心功能：为每个XML布局文件自动生成一个绑定类（如ActivityMainBinding），直接暴露所有带ID的视图引用。优点：避免繁琐的findViewById()，类型安全且编译时检查。对比DataBinding：ViewBinding仅处理视图引用，无数据绑定功能。DataBinding支持双向数据绑定，
理解TCP连接中的进程阻塞与CPU调度机制 109702008 编程 #C语言网络 tcp/ip 网络人工智能
引言在计算机网络通信中，TCP连接的建立是一个经典的三次握手过程。当用户调用connect()函数发起连接时，内核会发送SYN报文并等待对方的SYN-ACK响应。此时，调用进程通常会进入阻塞状态，暂停执行直至连接成功或超时。这一机制看似简单，但其背后的内核实现却涉及进程调度、等待队列管理和CPU资源分配等复杂操作。本文将深入探讨阻塞状态的实现原理，并解析CPU在进程阻塞期间的行为。一、进程阻塞的实
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc

GCC中SIMD指令的应用方法

你可能感兴趣的:(收藏,C,*,C++,*,ASM)

你可能感兴趣的:(收藏,C,,C++,,ASM)