Linux阅码场

用CPI火焰图分析Linux性能问题

来源：内核月谈

关于作者

杨勇，吴一昊，Linux 系统工程师，来自阿里云系统组。

本文中若有任何疏漏错误，有任何建议和意见，请回复内核月谈微信公众号，或通过 oliver.yang at linux.alibaba.com 反馈。

阿里云系统团队，是由原淘宝内核组扩建而成，2013年淘宝内核组响应阿里巴巴集团的号召，整建制转入阿里云，开始为云计算底层系统构建完善的系统支持。阿里云系统团队是由一群具有高度使命感和自我追求的内核开发人员组成，团队中的大多数人，都是活跃的社区内核开发人员。目前的工作领域主要涉及（但不限于） Linux内核的内存管理、文件系统、网络和内核维护构建，以及和内核相关联的用户态库和工具。如果你对我们的工作很感兴趣，欢迎加入我们，请将简历发送至 tao.ma at linux.alibaba.com或者boyu.mt at alibaba-inc.com。

1. 什么是 CPI ？

本小节讲述为什么使用 CPI 分析程序性能的意义。如果已经非常了解 CPI 对分析程序性能的意义，可以跳过本小节的阅读。

1.1 程序怎么样才能跑得快？

理解什么是 CPI，首先让我们思考一个问题：在一个给定的处理器上，如何才能让程序跑得更快呢？

假设程序跑得快慢的标准是程序的执行时间，那么程序执行的快慢，就可以用如下公式来表示:

因此，要想程序跑得快，即减少程序执行时间，我们就需要在以下三个方面下功夫：

减少程序总指令数
要减少程序执行的总指令数，可能有以下手段：

算法优化；好的算法设计，可能带来更少的指令执行数。
更高效的编译器或者解释器；新的编译器或者解释器，可能对同样的源代码，生成更少的机器码。
用更底层的语言优化；这是为何 Linux 内核代码使用 C 语言，并且还喜欢内联汇编。
更新的处理器指令；新的处理器指令，对处理某类特殊目的运算更有帮助，而新版本编译器最重要的工作就是，在新的处理器上，用最新的高效指令；例如，x86 SSE，AVX 指令。

减少每 CPU 时钟周期时间

这一点很容易理解，缩短 CPU 时钟周期的时间，实际上就是要提高 CPU 的主频。这正是 Intel 过去战无不胜的法宝之一。今天，由于主频的提高已经到了制造工艺的极限，CPU 时钟周期的时间很难再继续降低了。

减少每指令执行所需平均时钟周期数

如何减少每指令执行所需平均 CPU 时钟周期数呢？让我们先从 CPU 设计角度看一下：

标量处理器 (Scalar Processor) ；一个 CPU 时钟周期只能执行一条指令；
超标量处理器 (Superscalar Processor)；一个 CPU 时钟周期可以执行多条指令。

因此不难看出，如果使用支持超标量处理器的 CPU，利用 CPU 流水线提高指令并行度，那么就可以达到我们的目的了。流水线的并行度越高，执行效率越高，那么每指令执行所需平均时钟周期数就会越低。

当然，流水线的并行度和效率，又取决于很多因素，例如，取指令速度，访存速度，指令乱序执行 (Out-Of-Order Execution)，分支预测执行 (Branch Prediction Execution)，投机执行 (Speculative Execution）的能力。一旦流水线并行执行的能力降低，那么程序的性能就会受到影响。关于超标量处理器，流水线，乱序执行，投机执行的细节，这里不再一一赘述，请查阅相关资料。

另外，在 SMP，或者多核处理器系统里，程序还可以通过并行编程来提高指令的并行度，因此，这也是为什么今天在 CPU 主频再难以提高的情况下，CPU 架构转为 Multi-Core 和 Many-Core。

由于提高 CPU 主频的同时，又要保障一个 CPU 时钟周期可以执行更多的指令，因此处理器厂商需要不断地提高制造工艺，降低 CPU 的芯片面积和功耗。

1.2 CPI 和 IPC

在计算机体系结构领域，经常可以看到 CPI 的使用。CPI 即 Cycle Per Instruction 的缩写，它的含义就是每指令周期数。此外，在一些场合，也可以经常看到 IPC，即 Instruction Per Cycle，含义为每周期指令数。

因此不难得出，CPI 和 IPC 的关系为，

使用 CPI 这个定义，本文开篇用于衡量程序执行性能的公式，如果具体到单 CPU 的程序执行性能场景，实际上可以表示为：

由于受到硅材料和制造工艺的限制，处理器主频的提高已经面临瓶颈，因此，程序性能的提高，主要的变量在 Instruction Count 和 CPI 这两个方面。

在 Linux 上，通过 perf 工具，通过 Intel 处理器提供的寄存器 (PMU)，可以很容易测量一个程序的 IPC。例如，下例就可以给出 Java 程序的 IPC，8 秒多的时间里，这个 Java 程序的 IPC 是 0.54：

那么，通过 IPC，我们也可以换算出 CPI 是 1/0.54，约为 1.85.

通常情况下，通过 CPI 的取值，我们可以大致判断一个计算密集型任务，到底是 CPU 密集型的还是 Memory 密集型的：

CPI 小于 1，程序通常是 CPU 密集型的；
CPI 大于 1，程序通常是 Memory 密集型的;

1.3 重新认识 CPU 利用率

对程序员来说，判断一个计算密集型任务运行效率的重要依据就是看程序运行时的 CPU 利用率。很多人认为 CPU 利用率高就是程序的代码在疯狂运行。实际上，CPU 利用率高，也有可能是 CPU 正在忙等一些资源，如访问内存遇到了瓶颈。

一些计算密集型任务，在正常情况下，CPI 很低，性能原本很好。CPU 利用率很高。但是随着系统负载的增加，其它任务对系统资源的争抢，导致这些计算任务的 CPI 大幅上升，性能下降。而此时，很可能 CPU 利用率上看，还是很高的，但是这种 CPU 利用率的高，实际上体现的是 CPU 的忙等，及流水线的停顿带来的效应。

Brendan Gregg 曾在 CPU Utilization is Wrong 这篇博客中指出，CPU 利用率指标需要结合 CPI/IPC 指标一起来分析。并详细介绍了前因后果。感兴趣的读者可以自行阅读原文，或者订阅内核月谈公众号，阅读我们公众号非常靠谱的译文。

至此，相信读者已经清楚，在不修改二进制程序的前提下，通过 CPI 指标了解程序的运行性能，有着非常重要的意义。对于计算密集型的程序，只通过 CPU 利用率这样的传统指标，也无法帮助你确认你的程序的运行效率，必须将 CPU 利用率和 CPI/IPC 结合起来看，确定程序的执行效率。

1.4 如何分析 CPI/IPC 指标异常？

虽然利用 perf 可以很方便获取 CPI/IPC 指标，但是想分析和优化程序高 CPI 的问题，就需要一些工具和分析方法，将 CPI 高的原因，以及与之关联的软件的调用栈找到，从而决定优化方向。

关于 CPI 高的原因分析，在 Intel 64 and IA-32 Architectures Optimization Reference Manual, 附录 B 里有介绍。其中主要的思路就是按照自顶向下的方法，自顶向下排查， 4 种引起 CPI 变高的主要原因，由于本文主要是介绍 CPI 火焰图，

对于本小节的自顶向下的分析方法，限于篇幅所限，就不详细展开了，我们稍后会有专门的文章做详细介绍。

2. CPI 火焰图

Brendan Gregg 在 CPI Flame Graphs: Catching Your CPUs Napping 一文中，介绍了使用 CPI 火焰图来建立 CPI 和软件调用栈的关联。

我们已经知道，光看 CPU 利用率并不能知道 CPU 在干嘛。因为 CPU 可能执行到一条指令就停下来，等待资源了。这种等待对软件是透明的，因此从用户角度看，CPU 还是在被使用状态，但是实际上，指令并没有有效地执行，CPU 在忙等，这种 CPU 利用率并不是有效的利用率。

要发现 CPU 在 busy 的时候实际上在干什么，最简单的方法就是测量平均 CPI。CPI 高说明运行每条指令用了更多的周期。这些多出来的周期里面，通常是由于流水线的停顿周期 (Stalled Cycles) 造成的，例如，等待内存读写。

而 CPI 火焰图，可以基于 CPU 火焰图，提供一个可视化的基于 CPU 利用率和 CPI 指标，综合分析程序 CPU 执行效率的方案。

下面这个 CPI 火焰图引用自 Brendan Gregg 博客文章。

可以看到，CPI 火焰图是基于 CPU 火焰图，根据 CPI 的大小，在每个条加上了颜色。红色代表指令，蓝色代表流水线的停顿：火焰图中，每个函数帧的宽度，显示了函数或其子函数在 CPU 上的次数，和普通 CPU 火焰图完全一样。而颜色则显示了函数在 CPU 上是运行 (running 红色) 还是停顿 (stalled 蓝色)。

火焰图里，颜色范围，从最高CPI为蓝色（执行最慢的指令），到最低CPI为红色 (执行最快的指令)。火焰图是 SVG 格式，矢量图，因此支持鼠标点击缩放。

然而，Brendan Gregg 博客中的这篇博客，CPI 火焰图是基于 FreeBSD 操作系统特有的命令生成的，而在 Linux 上，应该怎么办呢？

3. 一个小程序

让我们写一个人造的小程序，展示在 Linux 下 CPI 火焰图的使用。

这是一个最简的小程序，其中包含如下两个函数：

cpu_bound
函数主体是 nop 指令的循环；由于 nop 指令是不访问内存的最简指令之一，因此该函数 CPI 一定小于 1，属于典型的 CPU 密集型的代码。
memory_bound
函数使用 _mm_clflush 驱逐缓存，人为触发程序的 L1 D-Cache Load Miss。因此该函数 CPI 必然大于 1，属于典型的 Memory 密集型的代码。

下面是程序的源码：

在上述小程序运行时，我们使用如下命令生成 CPI 火焰图，

最后生成的火焰图如下，

可以看到，CPI 火焰图看到的结果，是符合我们的预期的：

该程序所有的 CPU 时间，都分布在 cpu_bound 和 memory_bound 两个函数里
同是 CPU 占用时间，但 cpu_bound 是红色的，代表这个函数的指令在 CPU 上一直持续运行
而 memory_bound 是蓝色的，代表这个函数发生了严重的访问内存的延迟，导致了流水线停顿，属于忙等

4. 一个benchmark

现在，我们可以使用 CPI 火焰图来分析一个略真实一些的测试场景。下面的 CPI 火焰图，来自 fio 的测试场景。

这个 fio 对 SATA 磁盘，做多进程同步 Direct IO 顺序写，可以看到：

红颜色为标记为 CPU Bound 的函数。其中颜色最深的是 _raw_spin_lock，这是自旋锁的等待循环引起的。
蓝颜色为标记为 Memory Bound 的函数。其中颜色最深的是 fio 测试程序的函数 get_io_u，如果使用 perf 程序进一步分析，这个函数里发生了严重的 LLC Cache Miss。

因为 CPI 火焰图是矢量图，支持缩放，所以以上结论可以通过放大 get_io_u 的调用栈进一步确认，

到这里，读者会发现，使用 CPI 火焰图，可以很方便地做 CPU 利用率的分析，找到和定位引发 CPU 停顿的函数。一旦找到相关的函数，就可以通过 perf annotate 命令对引起停顿的指令作出进一步确认。并且，我们可以利用 1.4 小节的自顶向下分析方法，对 CPU 哪个环节产生瓶颈作出判断。最后，结合这些信息，决定优化方向。

5. 小结

本文介绍了使用 CPI 火焰图分析程序性能的方法。CPI 火焰图不但展示了程序的 Call Stack 与 CPU 占用率的关联性，而且还揭示了这些 CPU 占用率里，哪些部分是真正的有效的运行时间，哪些部分实际上是 CPU 因某些停顿造成的忙等。

系统管理员可以通过此工具发现系统存在的资源瓶颈，并且通过一些系统管理命令来缓解资源的瓶颈；例如，应用间的 Cache 颠簸干扰，可以通过将应用绑到不同的 CPU 上解决。

而应用开发者则可以通过优化相关函数，来提高程序的性能。例如，通过优化代码减少 Cache Miss，从而降低应用的 CPI 来减少处理器因访存停顿造成的性能问题。

"Linux阅码场"是专业的Linux及系统软件技术交流社区，企业和Linux人才的连接枢纽。

查看我们精华技术文章请移步:

Linux阅码场原创精华文章汇总

求职招聘请移步:

阅码场: 连接企业和Linux/嵌入式人才的平台总线

扫描二维码关注我们

第七弹：C语言基础--标准IO编程详解三玖诶 C C语言标准IO编程
目录文章目录知识点1文件的概述1文件的定义2Linux系统中的文件定义3Linux系统中文件的访问3.1文件缓冲区概述3.2文件缓冲区具体形式4磁盘文件分类4.1磁盘文件分类说明4.2文本文件和二进制文件的区别知识点2标准IO库1FILE文件指针1.1FILE指针的概述1.2FILE结构体数据类型的定义1.3FILE指针的管理1.4FILE指针的分配2文件的IO操作2.1打开文件流-fopen2.
【Git】2.第一次推送代码到gitLab 记录测试点滴 git pycharm ide
前言：pycharm想要推送代码到git/拉取git代码1.创建git项目登录gitLab去创建项目，注意：ProjectConfiguration不要选择InitializerepositorywithaREADME进入git项目会提示想要使用SSHpull或者push需要配置SSHKey去免密登录2.设置全局用户名和邮箱gitconfig--globaluser.name"登录gitlab的用
【linux安装git+配置gitlab+推送】 hi+ git linux gitlab
【安装】$sudoaptupdate$sudoaptinstallgit$git--version【配置】A：安装Git之后，您需要做的第一件事就是配置您的git用户名和电子邮件地址。Git将您的身份与您所做的每次提交相关联。要设置全局提交名称和电子邮件地址，请运行以下命令：zly@ubuntu:~$gitconfig--globaluser.name"git用户名"zly@ubuntu:~$gi
Linux C语言中的IO--标准IO ぃ未来可期 C c语言 linux
文章目录1.IO概述系统调用和库函数有什么区别？2.标准IO2.1缓冲区/缓存区行缓冲区刷新方法全缓冲区刷新方法2.2文件指针2.3标准IO常用函数fopen()fclose()perror()errnofgetc()fputc()feof()/ferror()判断返回值EOF类型ungetc()将字符放回输入流fgets()fputs()fprintf()/sprintf()/dprintf/s
c语言标准io库,IO之标准C库buffer 抬杠小天才 c语言标准io库
在论述这个主题之前，先介绍一下标准C库和linux系统调用以及windowsAPI之间的关系。拿写文件来举个例子linux下写文件用write()windows下写文件用WriteFile()这说明不同操作系统实现同样的系统功能的接口应该是不一样的。造成这种现状是操作系统发展的历史原因造成的，无法在操作系统的层面统一系统函数接口。同样功能的程序在linux上写一套，windows上又得写另外一套，
LeetCode链表题解技巧归纳总结
最近集中刷了一批链表的题型，在这里总结一下解题技巧，以及对应题目的解题思路。解题思路并不会细致入微，主要是为了总结归类，并且希望用几句话来激发灵感，权当是没思路时的指引以及以后复习时的提纲了。还有一些重要或者总会绕晕的经典题目，也在这里记录一下代码的实现逻辑。一、链表题解的两个技巧遇到链表相关的题，无论问题是什么，先要想想是不是可以用上以下的两个技巧。哨兵节点双指针1、哨兵节点哨兵节点是一个非常常
如何把孩子的不良行为转变为有贡献的行为 yaya追风筝的人
今天继续阅读《正面管教》，其中一个老师在上课时看到一个孩子在课桌上涂鸦，老师在全班面前对孩子说：“我实在惊讶你居然会做这么愚蠢的事！现在去把课桌清洁干净！否则，我会让你的父母知道我对你是多么的失望。”这个例子中，尊重被丢掉了，老师借题发挥对孩子进行了羞辱。老师用自己的权利确保这个学生吸取教训。想当初刚做班主任时，我也是这样认为：孩子犯错后只有吃到苦头才能学到东西。或许在我们的潜意识里：我是大人，你
用 Next.js 实现静态与动态渲染的完美平衡荣华富贵8 程序员的知识储备2 程序员的知识储备3 前端
一、引言随着Web应用的复杂度不断提升，渲染性能与用户体验成为开发者与产品运营方关注的核心问题。静态站点生成（StaticSiteGeneration，SSG）与服务器端渲染（Server-SideRendering，SSR）各有优劣：前者在首屏加载速度和CDN分发方面表现卓越，而后者在动态内容更新和个性化体验上占据优势。Next.js作为React生态中领先的全栈框架，通过getStaticPr
破解 VMware 迁移难题：跨平台迁移常见问题及自动化解决方案七夜zippoe 运维自动化运维 VMware
在企业IT架构向混合云、多云演进的进程中，VMware虚拟化环境的跨平台迁移成为关键任务。无论是迁移至KVM、Hyper-V等开源虚拟化平台，还是AWS、Azure等公有云，迁移过程往往面临兼容性障碍、数据损耗、业务中断等难题。本文深入剖析跨平台迁移的核心痛点，结合自动化技术提出系统性解决方案，助力企业实现平滑迁移。一、跨平台迁移的常见痛点及根源分析VMware迁移的复杂性源于虚拟化层、硬件架构、
Linux--标准IO库 Ao_Richard 应用编程 Linux 算法
一、标准IO简介所谓标准I/O库则是标准C库中用于文件I/O操作（譬如读文件、写文件等）相关的一系列库函数的集合，通常标准I/O库函数相关的函数定义都在头文件中，所以我们需要在程序源码中包含头文件。标准I/O库函数是构建于文件I/O（open()、read()、write()、lseek()、close()等）这些系统调用之上的，譬如标准I/O库函数fopen()就利用系统调用open()来执行打
小狐狸端午节撞蛋临江寒
在我们这个三四线小城市，公立和私立幼儿园最明显区别就是过节这事儿。公立幼儿园过中国传统节日，私立幼儿园过西方节日。今年的端午节，小狐狸的老师就带着他们做香包、赛龙舟和举行撞蛋活动。小狐狸很希望在撞蛋中获得胜利，孩子爸传授了自己小时候总结的撞蛋技巧，可惜我们用早餐水煮蛋进行实践验证发现“用蛋尖去撞别人蛋屁股”技巧完全没用。小狐狸决定活动当天带着他的咸鸭蛋满场躲，以免被同学磕破。我也是护蛋心切，把咸鸭
（5/100）无戒学堂100天王牌小说课:怎样选择适合自己的网络小说平台? 紫云婵
01分类与标签选择正确的分类和标签，作品才能够被更好地展现出来，也会更加容易被认可，被推荐。02平台内容与方向了解平台内容方向1.看平台首页推荐2.看平台征文3.了解平台状况4.生存状况，福利状况，流量状况。03平台分析不同平台，有不同的特征分析。豆瓣、掌阅（女频）、书山（男频）、起点、番茄（悬，仙，奇，都，科剧）表达主题，统一人称，规范用词，精简对话，减少描写，减少口语化，不必要的书面语（免说教
【软件系统架构】系列七：系统性能——网络性能深入解析
目录一、什么是网络性能？网络性能的核心指标二、网络性能影响因素1.物理层因素2.链路质量3.网络设备性能4.协议栈影响5.应用层特性三、网络性能测试指标详解网络性能测试方法四、网络性能测试方法1.链路测试2.路径分析3.协议级分析4.大规模监控五、网络性能优化策略1.带宽优化2.延迟与抖动优化3.丢包率控制4.TCP调优5.DNS优化六、网络性能瓶颈诊断流程（实战推荐）七、不同网络环境的性能关注重
使用 CrewAI 进行股票分析：自动化投资决策的新途径 AI量化投资人工智能多智能体语言模型智能体 crewai
一、引言在当今快节奏的金融市场中，及时、准确的股票分析对于投资者做出明智决策至关重要。然而，传统的股票分析方法往往耗时且依赖人工，难以满足市场快速变化的需求。CrewAI框架的出现为股票分析带来了新的解决方案。本项目展示了如何利用CrewAI框架自动化股票分析过程，通过协调多个自主AI代理协作完成复杂任务，从而提高分析效率和准确性。二、CrewAI框架概述CrewAI旨在促进角色扮演AI代理之间的
牵牛花散书斋
牵牛花，在人们眼里没有出奇的地方，长在不起眼的地方或野外，没有人工培植，萧瑟秋天里默默开着，人们也不会打扰她，但在陈曾寿的眼中是别样的：一枝颜色费评誇，冷翠光中晕淡霞。绝世幽情容一现，能如我意是秋花。人如花，花似人，陈曾寿（1878～1949）晚清诗人。字仁先，号耐寂、复志、焦庵，家藏元代吴镇所画《苍虬图》，因以名阁，自称苍虬居士，湖北蕲水县（今浠水县）巴河陈家大岭人，状元陈沆曾孙。光绪二十九年进
红场小霞老师mn
曼宁妈妈，晚上好。⊙∀⊙！这节课主要学习了红场，介绍了俄罗斯的首都莫斯科的中心广场红场及一些著名的建筑，如克里姆林宫等，用线描去表现装饰。这幅画还没有结束，曼宁说很喜欢俄罗斯的天空，下节课还会抽半小时，带着她把颜色上了。曼宁的学习状态很好，整节课都很认真，速度也很快。下次要注意一下画面的整洁性，线条再干净一点点就完美了。继续加油(^ω^)
第六章神奇的村落科白
我实在忍受不了酷刑，一度昏厥过去，我像被关进一个幽暗的黑屋子。隐约能听到有人呼喊我的名字，我感到眼睛酸疼，艰难地睁开眼，看到了祖母略显红肿的眼睛，我猜想她一定刚哭过吧！她害怕我像父亲一样离她而去。“你醒了。”一个留着干净利落短头发的姑娘对我说。她脸颊白如雪，小小的耳垂，穿着一件红色夹克衫，高高的长筒靴，一双像火焰一样的眼睛，一张像冰雪般的面孔。这跟国王给我的画像一模一样，她就是伊曼，我支撑起身子，
楼宇自控系统是否为大型建筑刚需？多维必要性与效益分析 ctrlworks 楼宇自控康沃思物联楼宇自控系统厂家 ba系统厂商建筑管理系统厂家 ibms系统厂家
当一栋建筑面积突破10万平方米，机电设备超过500台，日均能耗达1万度时，传统的人工管理模式如同“用算盘管理数据中心”——低效、滞后且风险暗藏。在大型建筑（商业综合体、超高层写字楼、智慧园区等）的运营中，楼宇自控系统的角色已从“可选配置”逐渐变为“必备基础设施”。本文从管理复杂度、能源成本、安全风险、用户体验、政策合规五个维度，解析楼宇自控系统对大型建筑的必要性，并量化其带来的综合效益，揭示其从“
PTA数据结构与算法-第一章——褚论 ?Suki PTA习题算法数据结构 c++
文章目录第一章——褚论第二章——线性表第三章——栈与队列第四章——字符串第五章——树与二叉树第六章——图第七章——排序第八章——检索判断题单选题程序填空题第一章——褚论第二章——线性表第三章——栈与队列第四章——字符串第五章——树与二叉树第六章——图第七章——排序第八章——检索判断题(neuDS)数据的物理结构是指数据在计算机中的实际存储形式。T(neuDS)数据的物理结构是指数据在计算机中的实际
AI实战(三)：AI写的剧本VS姜文风演技指导，有送彩蛋蓝图初音不在家人工智能大数据自然语言处理深度学习
@[TOC]一、前情回顾大家好，这是我用AI打造“爆款短剧引擎”系列的最后一篇文章。在前两篇文章中，我们已经：通过“逆向工程”的方法，创造了一个名为**“多巴胺生成器”**的AI虚拟人格。分析了它生成的第一份作品——《千亿后妈不好惹》的剧本大纲，见识了其背后冷酷而精准的商业逻辑。今天，我们将迎来最终的交付物。我们来看看，当AI把那些冰冷的逻辑，转化为热气腾腾、有具体人物和对话的剧本时，效果究竟如何
React.js前端框架的性能优化的误区与解决方法前端视界前端大数据与AI人工智能前端艺匠馆前端框架 react.js 性能优化 ai
React.js前端框架的性能优化的误区与解决方法关键词：React性能优化、虚拟DOM、渲染优化、组件设计、代码分割、状态管理、性能分析工具摘要：本文深入探讨React.js应用开发中常见的性能优化误区，分析其背后的原理和影响，并提供切实可行的解决方案。文章将从React核心机制入手，剖析虚拟DOM工作原理，揭示不当优化策略可能带来的反效果，并给出基于最佳实践的优化方案。通过实际代码示例、性能对
ONNX模型使用指南：从零开始掌握跨领域模型部署
ONNX模型使用指南：从零开始掌握跨领域模型部署ONNX模型作为一种开放式的神经网络交换格式，已成为AI模型部署的行业标准。当您获得一个没有使用说明的ONNX模型时，可以通过系统化的分析和部署流程，使其在不同领域发挥作用。本文将详细阐述如何分析模型结构、配置运行环境、准备特定领域输入数据、执行推理并处理结果，同时提供图像分类、自然语言处理、医疗影像分析、金融风控和自动驾驶等领域的具体应用示例，帮助
从网页到游戏，WebSocket、Socket、TCP 和 HTTP 的真实差别云心雨禅云计算网络游戏 websocket tcp/ip http 信息与通信
前言在现代网络世界中，WebSocket、Socket、TCP和HTTP就像四位性格迥异的通信使者。它们各司其职，有的擅长短平快的交流，有的精通持久连接的深情对话。但你是否真正理解它们之间的区别？又该如何为你的项目选择最合适的“通信方式”？今天，我们就来揭开这些神秘协议的面纱，用小白也能听懂的语言，带你走进网络世界的“语言系统”。一、四位“通信使者”HTTP：礼貌周到的“前台接待员”HTTP是我们
4-Spring源码解析之this()(1)——AnnotatedBeanDefinitionReader 想当厨子的程序媛 Spring注解源码解析 spring
1.程序入口AnnotationConfigApplicationContextapplicationContext=newAnnotationConfigApplicationContext(MainConfig.class);2.AnnotationConfigApplicationContext类有参构造器其中MainConfig类是自己写的配置类，我们从这一行代码来开始分析。Spring容
全面掌握PDF编辑：使用Foxit PDF Editor 22.1.1102 IBEANI
本文还有配套的精品资源，点击获取简介：FoxitPDFEditor22.1.1102是一款专业的PDF编辑工具，专为编辑、修改和创建PDF文档而设计。拥有直观的用户界面，使得用户即使技术不熟练也能轻松上手。它提供文本编辑、图像处理、页面管理、注释与标记、表单填写与创建、安全设置、批注工具、合并与分割、转换功能和OCR识别等核心功能。软件还支持自定义工具栏，提高工作效率。为保障数据安全和个人隐私，用
k8s包管理器helm_K8S集群 Helm 包管理 weixin_39872893 k8s包管理器helm
Helm是一个Kubernetes的包管理工具，就像Linux下的包管理器，如yum/apt等，可以很方便的将之前打包好的yaml文件部署到kubernetes上。k8s之前部署要写很多的yaml文件，大型应用部署起来比较麻烦，于是helm就出现了。Helm有两个重要概念：helm：一个命令行客户端工具，主要用于Kubernetes应用chart的创建、打包、发布和管理。Chart：应用描述，一系
基于python的图像识别_基于PYTHON的图片文字识别
文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。一般包括以下几个过程：图像输入、图像前处理、预识别：1图像输入：对于不同的图像格式，有着不同的存储格式，不同的压缩方式，目前有OpenCV、CxImage等开源项目。2预处理：主要包括二值化，噪声去除，倾斜较正等。2.1二值化：对摄像头拍摄的图片，大多数是彩色图像，彩色图像所含信息量巨大，对于图片的内容，我们可以简单的分为前景与背景，为
centos linux lvm分区,linux CentOS/redhat 6.5 LVM分区使用详解文韬菌 centos linux lvm分区
1,介绍LVM是逻辑盘卷管理(LogicalVolumeManager)的简称，它是Linux环境下对磁盘分区进行管理的一种机制，LVM是建立在硬盘和分区之上的一个逻辑层，来提高磁盘分LVM区管理的灵活性。前面谈到，LVM是在磁盘分区和文件系统之间添加的一个逻辑层，来为文件系统屏蔽下层磁盘分区布局，提供一个抽象的盘卷，在盘卷上建立文件系统。物理卷(physicalvolume)物理卷就是指硬盘分区
linux /unix/centos/ubuntu/redhat命令详解
UNIX概述•UNIX历史•UNIX特点•UNIX原则UNIX历史•UNIX操作系统诞生于60年代末期的Bell实验室•美国电话电报公司(AT&T)在70年代中期开始发行UNIX的非商业许可证•从70年代末开始在市场上出现了不同的UNIX商品化版本UNIX特点•可靠性高•伸缩性强•开放性好•植根于网络•面向数据库使用UNIX基本原则•所有对象,包括硬件都是文件•配置数据以文本形式保存•由短小的单目
Android 异构计算与 OpenCL/CUDA/OpenVX 的协同方式实战解析观熵国产 NPU ×Android 推理优化 android 人工智能
Android异构计算与OpenCL/CUDA/OpenVX的协同方式实战解析关键词Android异构计算、OpenCL、CUDA、OpenVX、GPU加速、NPU调度、HSA架构、神经网络推理、计算图编排、SoC协同处理、AI芯片编程摘要随着国产SoC平台持续迭代，Android系统中异构计算模式已从传统CPU+GPU并行计算，扩展到集成NPU、DSP、ISP等多核单元的复杂协同体系。在AI推理
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc