东风不枉

NUMA、SMP架构下的CPU性能调优：姻亲关系、进程绑定与中断

目录：一、NUMA、SMP、MPP介绍

二、NUMA、SMP下CPU工作方式

三、CPU Affinity(姻亲关系)

1、硬件级别实现总体资源调度

2、软件级别实现单个进程绑定

3、中断请求的绑定

四、在调度资源时，CPU的哪些参数需要关注

一、NUMA、SMP、MPP介绍

在优化CPU资源的时候，先明白CPU有哪些架构，不同架构下的优化策略和方法是不一样的。目前商用服务器大体可分为三类，即对称对处理器结构（SMP），非一致存储访问结构（NUMA）、海量并行处理结构(MPP)。

SMP：服务器中多个cpu对称工作，无主次或从属关系。各cpu 共享相同的物理内存，每个cpu访问内存中的任何地址所需时间是相同的。也称为一致存储访问结构。它的主要特征是共享，cpu、内存、IO都共享。主要问题是扩展能力有限。内存访问冲突，因为内存控制器只有一个。一般2-4个cpu达到最佳性能。

NUMA具有多个cpu模块，每个cpu模块由多个cpu组成，具有本地内存、IO槽口等。节点之间可互通，每个cpu可以访问整个系统的内存。开发程序是尽量减少不同cpu模块之间的信息交互（但并不是绝对的，有些应用程序过大，不得不借用其它cpu模块的内存，比如mySQL）。一个物理服务器内可支持上百个cpu。缺点：访问远地内存的延时远大于本地内存，因此性能无法随cpu线性增加。8倍cpu差不多换3倍性能。

MPP，由多个SMP服务器通过一定的节点互联网络进行连接。完全无共享结构，每个节点只访问自己的本地资源，扩展性最好，目前已实现了512个节点互联，数千个cpu。节点之间的信息交互通过互联网络实现，这个过程称为数据重分配。节点信息交互与节点本身处理是并行的。

二、NUMA、SMP下CPU工作方式

明白架构之后，我们还要明白为什么要优化CPU？这根CPU的工作方式有关： cpu有三级缓存，一级缓存有两个，数据缓存和指令缓存，一级、二级独有，三级缓存共享。

在SMP对称多处理器中，内存是共享的。一个cpu完成一次内存访问要三个时钟周期。1.发出指令给内存控制器； 2.内存控制器寻址并返回给cpu；3.cpu访问内存。而内存控制器只有一个，只能处理一个cpu的请求。cpu多了就会产生资源有竞争。因此当请求很多的时候有必要做资源分配。

再说NUMA架构，由于是非一致内存访问：多模块cpu有独享内存，内核会重新平衡队列。平衡时cpu会跨模块访问内存，访问对方的内存至少需要6个时钟周期。1.先到自己的内存控制器；2.再到对方的内存控制器(这一小步需要三个时钟周期)；3.对方的控制器再去寻址并返回；4.cpu拿到地址后去访问。

NUMA服务器应尽可能地保证cpu模块只访问自己的内存（当然这不是绝对的，还要看跑什么应用了）。那么为什么会出现模块间的交叉访问？因为内核会经常平衡进程，导致进程在两个cpu间频繁切换。而频繁切换cpu是很花时间的，对于有些占内存大的应用来说当cpu切换过去的时候又要重新加载内存，这样效率很低。所以对于某些特繁忙的进程，我们可禁止切换cpu，或着采取将进程绑定到固定cpu上。

三、CPU Affinity

cpu affinity：cpu的姻亲关系。将某些进程启动后绑定到固定cpu（或cpu组或cpu的某个核心）上。从而不会被调用到其他cpu上。但其实有时候平衡进程是有必要的。关键是要找到个平衡点。一般情况，在numa结构，当cpu cache的命中率比较低时可考虑将进程与cpu绑定。（而在SMP架构下这个对性能的提升可能就比较小）

1、硬件级别实现总体资源调度

numa相关的方法：numactl（资源调度） numad（守护进程） numademo（演示） numastat（状态）

numastat -p 查看某个进程的内存分配，如果内存分配是跨节点的，可以考虑绑定进程到固定节点

NUMA、SMP架构下的CPU性能调优：姻亲关系、进程绑定与中断_第1张图片

numastat -s (不加就显示所有node情况)

NUMA、SMP架构下的CPU性能调优：姻亲关系、进程绑定与中断_第2张图片

参数解释：numa_hit 内存命中次数

numa_miss 内存未命中次数。未命中太多就要考虑绑定了。一般看看这两个就好

numa_foregin 内存被非本地cpu使用

numactl，cpu策略控制。主要参数：

--cpunodebind=nodes: 把执行的command全部绑到节点上，节点有可能包括多个cpu

--physcpubind=cpus:把执行的进程全部绑定到对应cpu上，cpu号根据/proc.cpuinfo里显示

--membind=nodes:只在对应的节点上分配内存

这是一个全局策略，并不能绑定一个具体的进程，并且开机重启后又没有啦。

http://blog.csdn.net/jollyjumper/article/details/17168175 这篇文章做了性能测试，可参考。

numad，用户空间级的守护进程，可限定监控某些进程，自动分配进程到cpu。

这些都是硬件级别。

2.软件级别实现单个进程绑定

命令taskset：绑定进程到cpu上。先讲一下以掩码的方式表示cpu，很多地方都会用到。

用制掩码mask表示绑定到哪颗cpu上：比如0x0000 0001 表示第0颗cpu， 0x0000 0003表示第0颗cpu和第1颗cpu（转换成二进制，1位表示绑定的cpu，0003转二进制是0011），再例如，0x0000 0005表示0号和2号cpu（0005转二进制是0101）

#taskset -p mask pid:把某进程绑定到某些cpu上

比如 taskset -p 0x00000003 101 把101进程绑定到0号和1号cpu上。

#taskset -p -c 3 101 把101绑定在第三号cpu上。

这个命令有点不给力，重新开机后会失效，而且因为进程id每次都变，又不能写到脚本里。

cpu虽然绑定了进程，但是仍然会跑其他的进程（因为中断），于是有另一个话题：cpu隔离。

启动操作系统时，在 /etc/grub.conf里传递个参数：isolcpus=cpu number,...,cpu number 表示内核启动后，不会让进程使用这些cpu的。然后开机后再用taskset。

插一句，在nginx里面，可以在配置文件里设置将worker绑定到固定cpu：worker_cpu_affinity=，用的是掩码表示。

3.中断请求的绑定

中断允许让设备，如键盘，串口卡，并口等设备表明它们需要CPU。由硬件或软件所发送称为IRQ（中断请求）的信号给CPU，一旦CPU接收了中断请求，CPU就会暂时停止执行正在运行的程序，并且调用一个称为中断处理器或中断服务程序（interrupt service routine）的特定程序。

相关的信息文件主要有/proc/interrupts 、/proc/stat 、/proc/irq//

/proc/interrupts文件中可查看关于哪些中断正在使用和每个处理器各被中断了多少次的信息。一般查看中断信息都看这个。第一列是irq号，第二列以后是cpu及其对应的中断数（具体看你的服务器上有几个cpu），倒数第二列表示中断类型，最后一列表示中断名称。

NUMA、SMP架构下的CPU性能调优：姻亲关系、进程绑定与中断_第3张图片

/proc/stat包含了系统内核的统计信息和中断信息。

中断概念不再赘述，详细参考 http://www.linuxidc.com/Linux/2014-03/98012.htm ，本文也有部分引用来自次出处。

文件/proc/irq//smp_affinity中的cpu以掩码表示，中断服务由哪个cpu处理的表示方法同上文是一样的，比如0000 0101表示cpu0、cpu2

处理该irq。所以，要指定中断请求由哪个cpu处理只需要修改这个文件就可以了。

比如：echo 00000101 > /proc/irq//smp_affinity

可在/proc/interrupts中查看中断分布。

四、在调度资源时，CPU的哪些参数需要关注

先关注两个概念：

上下文切换：当一个进程用完时间片或者被更高优先级的进程抢占后，它会备份到CPU的运行队列中，同时其他进程在CPU上运行。这个进程切换的过程被称作上下文切换。过多的上下文切换会造成系统很大的开销。

运行队列：每个CPU都会维持一个运行队列，理想情况下，调度器会不断让队列中的进程运行。进程不是处在sleep状态就是run able状态。

可以理解为运行队列是并行操作（所以队列长度一般要小于3），上下文切换是并发操作。

查看cpu的命令有很多，常用sar、top、mpstat、iostat、vmstat、dstat、ps等等，很多文章也会单独去讲某个命令的用法，本文就不赘述命令用法了，只讲cpu要做绑定优化时需要注意的参数。

我们会比较关注的有：

sar -q: 采样过去的队列长度和负载平均值

参数：runq-sz:队列长度，每颗cpu最好不要长期超过3, 超过了cpu该升级了。

plist-sz:等待运行的tasks

ldavg-1:一分钟内负载

NUMA、SMP架构下的CPU性能调优：姻亲关系、进程绑定与中断_第4张图片

mpstat -P 0：第0号cpu使用率，这个命令看的比较全。irq是硬中断，soft是软中断，steal是虚拟机偷走的资源

cat /proc/stat:cpu中断信息，上文提过

dstat --top-cpu:哪个进程最耗cpu。这个命令很强大，--top参数可以看很多“最消耗”，比如--top-cputimes, --top-mem, --top-io, --top-latency等等，可以组合使用。

NUMA、SMP架构下的CPU性能调优：姻亲关系、进程绑定与中断_第5张图片

sar -w:每秒创建的进程数和上下文切换次数

NUMA、SMP架构下的CPU性能调优：姻亲关系、进程绑定与中断_第6张图片

ps -e -o psr,pid,cmd：显示进程、命令跑在哪个cpu上。ps本身也可以看某个进程所占cpu使用率和内存使用率。

NUMA、SMP架构下的CPU性能调优：姻亲关系、进程绑定与中断_第7张图片

针对进程的分析命令pidstat：

pidstat -u，查看进程、cpu之间的使用情况。

NUMA、SMP架构下的CPU性能调优：姻亲关系、进程绑定与中断_第8张图片

pidstat -p 查看某一进程的使用情况。

有错误的地方或者没说清楚的地方，欢迎雅正！

你可能感兴趣的:(性能优化)

Node.js系列（2）--性能优化指南一进制ᅟᅠ ‌‍‎‏ Node.js node.js 性能优化
Node.js性能优化指南⚡引言Node.js应用的性能优化是确保应用高效运行的关键。本文将深入探讨Node.js性能优化的各个方面，包括内存管理、CPU优化、I/O优化等，帮助开发者构建高性能的Node.js应用。性能优化概述Node.js性能优化主要包括以下方面：内存优化：内存泄漏检测、垃圾回收优化CPU优化：代码执行效率、异步处理、工作线程I/O优化：文件操作、网络请求、数据库访问缓存优化：
HDFS相关的面试题努力的搬砖人. java 面试 hdfs
以下是150道HDFS相关的面试题，涵盖了HDFS的基本概念、架构、操作、数据存储、高可用性、权限管理、性能优化、容错机制、与MapReduce的结合、安全性、数据压缩、监控与管理、与YARN的关系、数据一致性、数据备份与恢复等方面，希望对你有所帮助。HDFS基本概念1.HDFS是什么？它的设计目标是什么？•HDFS是Hadoop分布式文件系统，设计目标是实现对大规模数据的高吞吐量访问，适用于一次
服务器虚拟化相关的面试题努力的搬砖人. java 面试服务器其他
以下是服务器虚拟化相关的面试题，涵盖了服务器虚拟化的基础概念、技术原理、应用场景、性能优化、容错与高可用性、网络与存储、管理与监控、安全与备份、与其他技术的结合等方面，希望对你有所帮助。服务器虚拟化基础概念1.什么是服务器虚拟化？它的主要目的是什么？•服务器虚拟化是指通过虚拟化技术将一台物理服务器虚拟成多台虚拟机，每台虚拟机可以独立运行操作系统和应用程序。其主要目的是提高服务器的资源利用率，降低硬
Python技术全景解析：从基础到前沿的深度探索靠近彗星 python 开发语言性能优化个人开发极限编程
目录一、Python为何成为开发者首选？1.核心优势矩阵2.性能进化史二、Python核心应用领域1.数据科学黄金三角2.AI开发新范式三、现代Python进阶技巧1.类型提示革命2.异步编程实战四、Python工程化实践1.现代项目架构2.性能优化矩阵五、Python未来生态展望1.前沿技术融合2.性能革命六、学习路线图1.技能成长路径基础阶段（1-3月）专业方向（3-6月）深度进阶（6-12月
笔记本装机系统选择指南 mmoo_python windows
笔记本装机系统选择指南在众多笔记本用户中，选择一款合适的装机系统始终是一个热门话题。不同的系统不仅影响着电脑的性能，还关乎用户的使用体验和安全性。那么，在众多装机系统中，哪款最适合你的笔记本呢？本文将为你推荐几款热门的笔记本装机系统，帮助你做出明智的选择。一、游戏本专用：Windows1064位性能优化专业版对于游戏爱好者来说，一款高性能的游戏本是必不可少的装备。而为了充分发挥游戏本的潜力，一个专
219.性能优化-内存优化-内存泄漏-本质原因：已经无用的对象未及时回收-非静态内部类我也念过晚霞性能优化
━━━━━━━━━━━━━━━━━━━━━━【第一部分：内存泄漏背景与“无用对象未及时回收”的根本原因】在Android开发中，内存资源十分有限，尤其是在手机、平板等设备上。内存泄漏就是指那些本应在不再被使用后被垃圾回收器回收，但由于某种原因任然被引用而无法释放的对象。随着内存中这些无用对象的不断累积，应用会产生以下问题：内存占用逐渐上升，导致应用响应变慢；系统频繁触发垃圾回收（GC），造成卡顿现
浏览器渲染流程前端岳大宝前端核心知识总结前端 javascript
以下是关于浏览器渲染流程的系统梳理，涵盖基础原理、关键阶段、性能优化及进阶知识，帮助我们深入理解现代浏览器如何将代码转换为用户可见的像素：一、核心渲染流程（CriticalRenderingPath）浏览器渲染流程分为六个核心阶段，决定页面首次加载和更新的性能：1.构建DOM（DocumentObjectModel）过程：解析HTML生成DOM树（逐步解析，遇到可能阻塞）。阻塞因素：未添加asyn
【软件架构系列：一文读懂数据流体系结构风格】 youngerwang 学习笔记软件系统架构系统架构架构风格数据流体系结构风格
文章目录一文读懂数据流体系结构风格一、数据流体系结构风格是什么？二、数据流体系结构风格的类型（一）批处理风格（二）连续数据流风格三、数据流体系结构风格的特点（一）数据驱动一切（二）模块化与可复用性强（三）易于并行处理四、数据流体系结构风格的优势（一）维护轻松（二）扩展容易（三）性能优化空间大五、数据流体系结构风格的局限性（一）复杂控制逻辑实现困难（二）数据一致性挑战（三）资源消耗问题六、数据流体系
Python连接StarRocks全流程实践: SQL文件调用与Pandas混合优化 ToreanonyTang python sql pandas 数据库开发语言
文章目录一环境准备与连接方法1.安装核心依赖库2.连接字符串配置3.多模式连接验证二SQL文件调用与动态执行1.外部SQL文件结构设计2.Python动态加载执行三Pandas混合使用技巧1.查询结果直接转DataFrame2.批量数据写入优化四深度性能优化策略1.StarRocks服务端优化2.Python客户端优化3.混合计算策略五完整业务场景示例1:用户转化漏斗业务场景实现代码公用表表达式(
MySQL 性能优化方向小赖同学啊大数据 mysql 性能优化数据库
MySQL性能优化是一个系统性的工作，涉及数据库设计、查询优化、索引优化、硬件配置等多个方面。以下是MySQL性能优化的主要方向和具体优化方案：一、数据库设计优化1.合理设计表结构规范化设计：避免数据冗余，确保数据一致性。适度反规范化：在查询频繁的场景下，适当冗余数据以减少连表查询。选择合适的数据类型：使用最小的数据类型存储数据，例如用TINYINT代替INT，用VARCHAR代替TEXT。2.分
TensorFlow和Pytorch在功能上的区别以及优势 Honeysea_70 #算法 tensorflow pytorch 人工智能
功能上的区别1.计算图TensorFlow：使用静态计算图（StaticGraph）。在运行模型之前，需要先构建完整的计算图，然后通过会话（Session）运行图。优点是性能优化更高效，适合大规模分布式训练和生产环境部署。缺点是调试相对复杂，因为计算图的构建和运行是分离的。PyTorch：使用动态计算图（DynamicGraph）。计算图是动态构建和执行的，每次迭代都会重新构建图。优点是调试方便，
CSS动画：性能优化指南双囍菜菜前端随记 css 性能优化前端
CSS动画性能优化指南关键词：重排重绘、硬件加速、合成层、性能分析文章目录CSS动画性能优化指南一、浏览器渲染机制：理解性能瓶颈根源1.1像素管道（PixelPipeline）全流程1.2各阶段性能损耗对比二、性能分析实战：ChromeDevTools深度使用2.1性能问题定位四步法2.2关键指标解读三、六大核心优化策略3.1硬件加速的正确打开方式3.2避免布局颠簸（LayoutThrashing
HarmonyOS Next 企业级分布式办公应用实战：构建高效协同的办公新生态 lyc233333 harmonyos 分布式华为
在数字化办公浪潮汹涌的当下，企业对于高效、便捷且协同性强的办公应用需求愈发迫切。华为鸿蒙HarmonyOSNext系统凭借其先进的分布式技术，为打造创新型企业级分布式办公应用提供了坚实的基础。本文将基于实际开发经验，深入剖析如何利用HarmonyOSNext构建企业级分布式办公应用，涵盖从需求分析到系统架构搭建，再到核心功能实现以及性能优化等关键环节。一、办公应用需求与系统架构搭建（一）企业级分布
HarmonyOS Next--实现炫酷下拉刷新与上拉加载 harmonyos-next
摘要：本文通过HarmonyOS的PullToRefresh组件，结合Canvas绘图技术，实现具有动态小球特效的下拉刷新与上拉加载功能。文章将详细解析动画绘制原理、手势交互逻辑以及性能优化要点。一、效果预览实现功能包含：弹性下拉刷新：带有透明度渐变的圆形聚合动画波浪加载动画：三个小球按序弹跳的加载效果数据动态加载：模拟异步数据请求与列表更新流畅交互体验：支持列表惯性滑动与边缘回弹二、核心实现原理
一篇文带你了解Go 1.24最新版本有趣的变化磐基Stack专业服务团队 golang spring 后端
#作者：曹付江文章目录前言1.语言特性更新1.1泛型类型别名：你的代码终于不再「绕口」了！2.工具链更新2.1引入tool指令，goget终于知道哪些是工具了2.2构建缓存优化，gorun变聪明了，不再瞎忙活2.3JSON输出改进，gobuild-json：构建日志终于能「看懂」了3.性能优化3.1运行时性能提升3.2cgo优化，cgo更快了，调用C代码更流畅3.3WebAssembly(Wasm
HarmonyOS5开发：Ark-TS 深度解析：从状态管理到性能优化，揭秘鸿蒙开发的底层逻辑 harmonyos-next
Ark-TS作为鸿蒙生态的核心开发语言，其设计哲学和技术细节值得让我们一起深入挖掘以下下。这篇文章将会带您和我们一起聚焦Ark-TS的状态管理机制、类型系统优化及声明式UI的底层实现，通过代码示例和原理分析，带您揭开Ark-TS高效开发的神秘面纱。一、状态管理：Ark-TS的“神经中枢”在Ark-TS中，状态管理是驱动UI更新的核心机制。不同的状态装饰器（如@State、@Prop、@Link）各
Vue.js 中的 Memoization：提升性能的缓存技术 vvilkim vue vue.js 前端 javascript
在现代前端开发中，性能优化是一个永恒的话题。随着应用规模的增大，复杂的计算和频繁的函数调用可能会导致性能瓶颈。Vue.js作为一个流行的前端框架，提供了多种优化手段，其中memoization（记忆化）就是一种非常有效的技术。本文将详细介绍Vue.js中的memoization，以及如何利用它来提升应用性能。什么是Memoization？Memoization是一种优化技术，通过缓存函数的结果来避
Vue.js 性能优化：虚拟 DOM 与虚拟滚动 vvilkim vue vue.js 前端 javascript
在现代前端开发中，性能优化是一个永恒的话题。Vue.js作为一款流行的前端框架，提供了许多强大的工具和技术来提升应用的性能。其中，虚拟DOM和虚拟滚动是两个非常重要的概念。本文将深入探讨它们的原理、优势以及如何在Vue.js中使用它们来优化性能。什么是虚拟DOM？虚拟DOM（VirtualDOM）是Vue.js用于提升性能的核心技术之一。它是一个轻量级的JavaScript对象树，用于表示真实DO
MySQL性能优化实战笔记 - 通俗易懂版泥潭硬拔 mysql 性能优化笔记
1.存储引擎选择-到底选哪个？InnoDBvsMyISAM通俗对比想象你开了一家银行：InnoDB就像是有保险柜的银行支持事务：比如转账，要么都成功，要么都失败行级锁：小明在存钱时，小红还能同时取钱缺点：需要更多内存和CPUMyISAM就像是简易储物柜不支持事务：操作简单直接表级锁：一个人在用时，其他人要等待优点：读取速度快，占用资源少2.实战案例：常见性能问题及解决方案案例1：查询特别慢--糟糕
【Kafka高级】Kafka性能优化与调优实践全栈追梦人 kafka 性能优化 linq
在大规模数据处理和实时消息传递场景中，Kafka的性能优化至关重要。本文将从生产者性能优化、消费者性能优化以及集群性能调优三个方面展开，结合实际代码示例和配置参数，帮助读者更好地理解和应用Kafka性能优化策略。一、生产者性能优化Kafka生产者的性能直接影响消息发送的效率和系统的吞吐量。以下是一些关键优化策略：1.1批量发送生产者会将消息批量发送到Kafka，减少网络请求次数。以下参数对批量发送
JavaScript 中的性能优化：从基础到高级技巧 lina_mua 深入 javascript 性能优化开发语言
1.引言1.1性能优化的重要性在现代前端开发中，性能优化是提升用户体验的关键。无论是页面加载速度、交互响应时间，还是内存占用，性能优化都能显著提升应用的流畅度和用户满意度。1.2本文的目标本文旨在深入探讨JavaScript中的性能优化，从基础到高级技巧，帮助开发者理解性能优化的核心概念，并掌握其在实际开发中的应用。2.性能优化的基础2.1什么是性能优化？性能优化是指通过改进代码、减少资源消耗、优
哈希表的前沿演进：从经典实现到未来潜力大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
摘要：哈希表（HashTable）作为一种基本且高效的数据结构，已广泛应用于计算机科学的各个领域。从数据库的索引、缓存系统到密码学、分布式系统中，哈希表都发挥着至关重要的作用。随着计算需求的不断增长，哈希表的性能优化及其新型变种已成为当前研究的热点。本文将探讨哈希表的经典实现方式及其优化技术，并展望未来在量子计算、分布式存储等领域的潜在应用。1.引言：哈希表作为一种具有常数时间复杂度（O(1)）的
AI 大模型应用数据中心的数据迁移架构 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
AI大模型、数据中心、数据迁移、架构设计、迁移策略、性能优化、安全保障1.背景介绍随着人工智能（AI）技术的飞速发展，大规模AI模型的应用日益广泛，涵盖了自然语言处理、计算机视觉、语音识别等多个领域。这些AI模型通常需要海量的数据进行训练和推理，因此数据中心作为AI应用的基础设施，显得尤为重要。然而，随着AI模型规模的不断扩大，数据中心面临着新的挑战：数据规模庞大:AI模型的训练和推理需要海量数据
六十天前端强化训练之第二十一天大师级详解 React Context API：从原理到实战编程星辰海 #前端前端 react.js javascript React Context API
=====欢迎来到编程星辰海的博客讲解======看完可以给一个免费的三连吗，谢谢大佬！目录一、庖丁解牛：深入理解ContextAPI1.1设计哲学与运转机制工作原理三步曲：1.2核心三剑客详解1.3性能优化要诀二、手把手实现主题切换系统2.1完整代码实现（逐行注释版）2.2配套CSS样式设计三、关键知识点拆解3.1状态初始化策略3.2CSS变量注入原理3.3性能优化实践3.4可访问性最佳实践四、
模型部署实战：PyTorch生产化指南小诸葛IT课堂 pytorch 人工智能 python
‌一、为什么要做模型部署？‌模型部署是将训练好的模型‌投入实际应用‌的关键步骤，涉及：模型格式转换（TorchScript/ONNX）性能优化（量化/剪枝）构建API服务移动端集成本章使用ResNet18实现图像分类，并演示完整部署流程。‌二、模型转换：TorchScript与ONNX‌‌1.准备预训练模型importtorchimporttorchvision#加载预训练模型model=torc
Spring Boot 性能优化：如何解决高并发下的瓶颈问题？ zhyoobo spring boot 性能优化后端
一、高并发场景的挑战与诊断方法论1.1典型性能瓶颈四层模型在2000+QPS的电商秒杀场景中，SpringBoot应用常面临四层压力传导：网络层瓶颈TCP连接耗尽导致SYN队列溢出（Linux默认仅1024个）SSL握手消耗大量CPU资源（RSA2048单次握手约需10ms）HTTP/1.1的队头阻塞问题（单个连接只能顺序处理请求）应用层瓶颈线程池配置不当引发的上下文切换风暴（默认Tomcat线程
H800核心性能优化技术智能计算研究中心其他
内容概要作为新一代AI加速卡的核心创新载体，H800通过异构计算架构与动态能效管理技术的协同设计，实现了从硬件底层到应用层的系统性优化。其技术突破聚焦于张量核心重构带来的计算密度提升、混合精度运算对资源利用率的增强，以及智能散热方案在复杂负载场景下的稳定性保障。这些创新不仅显著提升了30%以上的能效比，更通过精细化任务调度机制，解决了深度学习训练中高并发数据处理与模型参数同步的效率瓶颈。值得关注的
前端性能优化之SSR优化 xiangzhihong8 前端前端
我们常说的SSR是指Server-SideRendering，即服务端渲染，属于首屏直出渲染的一种方案。SSR也是前端性能优化中最常用的技术方案了，能有效地缩短页面的可见时间，给用户带来很好的体验。SSR渲染方案一般来说，我们页面加载会分为好几个步骤：请求域名，服务器返回HTML资源。浏览器加载HTML片段，识别到有CSS/JavaScript资源时，获取资源并加载。现在大多数前端页面都是单页面应
使用CSS3实现炫酷的3D翻转卡片效果木木黄木木 css3 3d 前端
使用CSS3实现炫酷的3D翻转卡片效果这里写目录标题使用CSS3实现炫酷的3D翻转卡片效果项目介绍技术要点分析1.3D空间设置2.核心CSS属性3.布局和定位实现难点和解决方案1.3D效果的流畅性2.卡片内容布局3.响应式设计性能优化建议浏览器兼容性总结项目介绍在这个项目中，我们使用纯CSS3技术实现了一个具有3D翻转效果的交互卡片。当用户将鼠标悬停在卡片上时，卡片会沿Y轴优雅地旋转180度，展示
【万字总结】前端全方位性能优化指南（四）——虚拟DOM批处理、文档碎片池、重排规避庸俗今天不摸鱼 Web性能优化合集前端性能优化
前言在浏览器宇宙中，DOM操作如同「时空裂缝」——一次不当的节点更新可能引发连锁重排，吞噬整条渲染流水线的性能。本章直面这一核心矛盾，以原子级操作合并、节点记忆重组、排版禁忌破解为三重武器，重构DOM更新的物理法则。通过虚拟DOM的批处理引擎将千次操作坍缩为单次提交，借助文档碎片池实现90%节点的跨时空复用，再以transform替代top等20项反重排铁律，我们将彻底终结「JavaScript线
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他