欧德孙

测试10秒钟，分析数小时，CPU性能只看跑分可不够

写在前面

大约4年前在中科院软件所，为评估国产兆芯CPU性能，我接触到一些benchmark，涉及CPU指标的就有ubench、sysbench、c-ray、SPEC和unixbench等。

工具在手，不要动脑，跑起来就行。后来情况变了，每个月都有数个系统性能调优的kpi压在身上，你不光要知道这些性能怎么测，还得分析瓶颈在哪，最后还要不断实验去提升性能。

能力有限，很多就不会去关注，像sysbench也是个老掉牙的benchmark了，诞生到现在有15年历史，一个工具走到现在，还有它使用的场景，那肯定有它的价值。

正巧最近又需要验证虚拟化下CPU的性能，仍然利用sysbench去测试，这次既然测了，就不单单只看跑分，看看数据背后的意义。

整篇文章分以下几小章节：

一 sysbench测试CPU的过程

二计算素数对CPU性能的参考价值

三如何评估测试数据

四总结

一 sysbench测试CPU的过程

使用benchmark前，不妨先看下readme，sysbench在CPU上是这样自我定义的：

'cpu': a simple CPU benchmark

划重点：simple。工具设计之初，就不是为CPU考虑的，它最常使用场景基本在mysql等数据库评测上。所以自评为simple benchmark，必然有原因，这个后面详说。

回归正题，sysbench在大多数Linux下建议yum或apt-get安装，万一需要手动编译，需要注意2点：

l 如果你的sysbench是运行在64位CPU上，请先确保编译的是64位二进制文件；

l 万一你的环境是32位CPU，要知道在32位CPU上进行64位操作数的运算，需要使用多条32位的汇编指令来模拟其行为，随之带来的性能开销势必影响到结果。

（1）一般测试方法

事先声明，我用的是sysbench1.0.17版本，自从1.0.8版本后，一改以往使用计算达到10000内素数所用时间为测试结果，增加了events per second为输出报告。

测试方法大同小异，sysbench + 参数 + 测试项 + 命令，如下图：

以CPU为例（测试在4线程下CPU的运算速度）：

在本例测试中，只是采用最小化参数：--threads，其他常用参数还包括：

根据实际需要，可选择多种参数组合，本文只采用线程作为参数，测试结果如下所示：

测试输出清晰，数据一目了然，benchmark轻度用户重点关注2个数据就好，一是Prime numbers limit，二是events per second。

以上面为例，最终结果就是计算10000个素数，4线程平均每秒完成event个数为549.36，数值越大代表性能越好。

如果只简单衡量云主机CPU性能，以上2个结果足够了，明白了在什么样的基数下测试，并且知道每秒完成的events，可以获得1个基准数据。

（2）sysbench的实现方式

工具run了起来，数据也拿到了，但是离马放南山还早。这时候你还不知道数据准确与否，如果是准确的，是不是你想要的最优结果。

在评估数据之前，先了解下sysbench是怎么去测试CPU的，做到知己知彼后，再去看测试结果，说不定会有更多体会，特别是把测试中观察到的性能问题跟系统原理关联起来。

sysbench作为一个多用途开源benchmark，按照框架设计惯例，其CPU、thread、io、memory和数据库也遵循着松耦合的设计，CPU的源码有独立的模块。

简约不简单的cpu module

采用农村包围城市，先从CPU测试源码入手，源码见/src/tests/cpu/sb_cpu.c

图1：sb_cpu.c 头文件声明

你不熟悉sysbench的代码结构也没关系，仅从sb_cpu.c中简单几行头文件声明，就可以得到很多信息，抛开前面2个config.h、sb_win.h不谈（测试环境在Linux上），真正用到的就2个类库路径里面的头文件：、和1个内部实现函数声明的"sysbench.h"。

重点关注"sysbench.h"，但具体实现还要看sysbench.c，暂且不表，继续看/src/tests/cpu/sb_cpu.c

图2：初始化的CPU测试参数

图2中，定义了一个cpu默认参数，如果不特别指定，cpu-max-prime默认以10000作为上限。这里工具采用static函数声明的方式，直接引用/src/sb_options.h中的sb_arg_t结构体，简单声明测试设置的name、desc、value和type，在以后的sysbench.c会多次调用，如图3所示：

图3：sb_arg_t结构体

沿着/src/tests/cpu/sb_cpu.c代码继续看，是对CPU测试的函数声明和静态变量定义，在cpu_test中通过变量可看到CPU性能测试流程，如下图4中：

图4：cpu_test静态变量的定义

图4中，基于sb_test_t的结构体变量cpu_test，ops下所有变量在sb_test_t中引用了sb_operations_t。cpu_test完全依据sb_test_t结构体中包含的数据项，从名称设置开始，到初始化操作，再到定义核心event函数执行、报告输出，最后到结束后的动作。短短10几行，就把CPU测试场景描述清楚了，剩下要做的只是代码依次执行罢了。

图5：cpu-max-prime取值判断

图5中，cpu-max-prime在/src/tests/cpu/sb_cpu.c代码中有单独实现，其他类似time、event、threads的实现全都放在sysbench.c中。

sb_get_value_int()函数在sb_options.c中已完成定义，很多参数都要sb_get_value_int去获取。

图6：CPU测试的主要执行环节

cpu_execute_event是sysbench在CPU性能评估最主要环节，之前代码多次提到prime字眼，知道是素数，通过百度也知道它的计算原理，但在cpu_execute_event函数中详细定义了具体计算方式。在这种模式下，每个请求都由素数计算组成，由cpu-max-primes选项指定的值为上限，所有的计算使用64位整数执行。

图7：CPU报告实现

图7中，cpu_report_cumulative是最后的实现环节，采集、统计及打印是一连串的处理过程，如果要实时打印report，要停止运行计时器。具体代码实现在sysbench.c中sb_report_cumulative()，这是个复杂的处理流程。

管中窥豹看框架
sysbench测试CPU的代码没那么复杂，素数原理摆在明面，算法固定，自身实现代码比较清晰，单看素数计算的部分，任何语言都能实现，自己写个脚本都能直接用，难点主要在events和cumulative处理上，这也是基准工具的魅力所在。
前文对CPU模块有了粗略分析，这里我用一张图将整个流程贯穿起来，如下图所示：

图8：CPU TEST 关系图

图8中，除了能看到代码之间的调用链，有一点值得注意，就是几个struct：sb_test_t、sb_operations_t，前文提过，基于sb_test_t的结构体变量cpu_test，ops下所有变量在sb_test_t中引用了sb_operations_t。
阿里云性能专家西邪在他的《sysbench的框架实现介绍》文章中提到一段话：

sysbench是一个总体框架，它用来操作各个测性能的计算，那各个部门只需要做的一件事情是声明需要的实现。只要理解三个struct就可以了

文中所提到的三个struct，就是指sysbench.h中的sb_test_t、sb_operations_t和sb_builtin_cmds_t，见下图9：

图9：sysbench case的主要结构体

从CPU入手看sysbench的实现，3个struct定框架，实现了从测试场景结构到操作结构，再到命令实现结构。

写到这里，对sysbench的框架在本文只是粗略了解，有些地方并未深入，比如thread的设计。

二计算素数对CPU性能的参考价值

一直觉得数据必须要产生价值，价值就是对外能够给用户带来实际意义，比如帮助用户虚拟机选型，对内能够推动研发不断优化提升用户体验等。

有一段时间，因工作需要，我验证了很多操作系统的CPU性能，跑了很多次sysbench，最快只要10秒钟出结果，立等可取。但是跑分不是比大小的game，测的越多越迷茫，甚至都怀疑基准测试是不是认真的，进而对数据打上问号，这样得出的数据有没有参考价值？

sysbench去评估cpu性能，打个比方就像田径赛事，对cpu的运算测试，包括素数计算，整数，还是浮点数，好比100米、110米栏等比赛，赛道是测试对象，而裁判就是benchmark，都是看谁跑的快。

（1）为啥要使用计算素数的方式

在前文第一章节讲sysbench readme时说过，评估CPU性能，sysbench只是一个“a simple CPU benchmark"，再结合/src/tests/cpu/sb_cpu.c源码，可清晰看到它就是通过执行64位整数相加、整除等操作来获取素数，直到满足设定最大值，这个过程用来评估CPU运算速度。

所谓素数就是质数，一个大于1的自然数，除了1和它自身外，不能被其他自然数整除的数。

为啥要采用素数相加计算来判断cpu性能？这个可追溯不到历史，也许当年工具开发者看了电视节目，节目正好讲什么人机大战、数学猜想等，诸如此类，who care？

（2）素数运算衡量的是CPU什么能力？

在讲CPU源码时，提到/src/tests/cpu/sb_cpu.c中cpu_execute_event函数，如下源码所示：

利用计算最大素数来衡量CPU运算速度，在代码中主要使用到的是整数计算（加法），cpu整数能力就是cpu执行加法指令的能力，cpu一秒能执行多少条加法指令，整数运算是cpu最基本能力。

通过sysbench得到的CPU事务数，能一定程度上反映CPU整数运算性能，但不完整（只涉及加法），相加是衡量CPU整数能力，但是相除就是浮点运算能力（但涉及不多），实际上日常大多数应用（包括sysbench）都是整数计算为主的程序(会包含少量浮点指令)。

总结一下，利用sysbench计算素数获取CPU运算速度，比较接近实际应用CPU场景（不包括GPU），具有代表性。如果想独立评估CPU整数或浮点运算能力，建议尝试别的工具。

三如何评估测试数据

到了现在，sysbench测试方法熟悉了，结果也有了，把数据填进excel中呈交上去，来杯咖啡可以悠闲的等待下班开黑打野了。不过还没开心多久，同事就来问你：

你不得不重新打开电脑，运行工具，试图从数字中找到其中的奥秘，可是很快就发现除了从sysbench获取一组孤零零数字外，空荡荡的脑子里好像啥也没有留下。是不是白算了？并没有，CPU不会白算，每一步都算数，测试结果只是空洞的一串数字，还需要人为赋予价值。

（1）磨刀不误砍柴工

无论是基准测试，还是性能测试，在执行过程中有一个很容易做到，但很多人都忽略的现象：不会做笔记。不是不会做，是压根不记录过程中任何输出，没有这些记录，会给后续跟踪性能问题带来麻烦，产生问题原因从手指间溜走，时间浪费不说，还容易带给你负能量。

我个人使用OneNote收集过程，文字+图片任意组合，方便日后追踪，如果遭遇环境重装、时间不允许等客观因素不至于老鼠拉龟，无从下手了。

（2）给测试定基调

我的同事老王说每次发布新版，都要对CPU和内存运算能力重新验证，好像没意义。

狭义上的“意义”是啥？意义=价值，就是投入时间后所得到的回报。说到价值，其实在第2章节中分析素数运算衡量CPU什么能力时已给出了答案，《学霸的黑科技系统》一书在某个章节中也曾提到“梅森素数”，你说梅森素数有什么用？好像也举不出什么实际应用的例子，通常它都是被用作考验计算机性能，IntelSkylake芯片也曾由此发现bug。

不能指望每次基准测试都能发现bug，那这个性能评估还要不要做了？在回答问题之前，先要明白基准测试的目的。

总结一下：

n 基准测试一般发生在环境变更、版本迭代、配置或参数改变的前后；

n 当为软件或系统创建性能基准后，这个数据可作为参照，用来判断任意项变更给系统带来的影响；

n 了解系统优化前后的性能提升/下降指标，获取系统整体性能趋势，及早识别系统性能风险

这么看来，我们的工作还是有做的必要性，但不妨定3个小目标：

（3）从sysbench中读懂数据

sysbench数据模板是固定的，测试结束会将数据直接嵌套进去再呈现到终端。拿到数据先做2个确认：

→确认1：Number of threads 和你发起测试参数中一致

→确认2：Prime默认为10000，除非你发起测试参数中有特别指定值

步骤正确，参数没错，我们从上到下依次看下sysbench输出的测试数据。

测试结果中最重要的就是CPU speed，即：所有线程每秒完成的events数，这个数值越大代表性能越好，如下图10：

图10：cpu speed结果

每秒完成的events数可以理解成跑分，在手机领域每当手机厂商发行新手机产品，各种发布会上毫不例外的都会附上跑分。但是单看跑分还不够，还要重视延时。

图11：Latency结果

上图11中， sysbench给出了Latency的结果，包括min、avg、max和95%时延，类似jmeter输出，这个数值越小代表性能越好。在分布式存储（如ceph）领域，很多指标都将延时作为重要参考，但在计算能力上，对CPU运算延时重视度并不够，由于CPU和内存、硬盘不公平的进化规律，很多场景下CPU可能会消耗在IO等待中。

（4）不同工具齐上阵，寻找蛛丝马迹

众所周知在Linux上，应用是不能直接访问底层硬件，当进程需要访问硬件时，必须由用户态模式切换至内核态（暂不考虑KVM虚拟化，在虚拟世界还要借助intel硬件虚拟化辅助），再通过系统调用访问硬件。so，在Linux中有一个放之四海皆准的应用负载模式，如下图12所示：

图12：linux应用负载模式

这里把sysbench当成一个普通应用，和其他同样运行在虚拟机linux系统上的程序没什么两样，当它run起来后，会发生什么？

任何应用进程，哪怕复杂度很低，也是依赖Linux库来执行操作，sysbench测试CPU中一定需调用os库函数，通过ltrace可以跟踪进程调用库函数的情况，如下图13所示：

图13：ltrace库函数调用情况

库函数调用开销是一个可能存在性能瓶颈的地方，这就要看进程在需要的库中花费的时间开销了，先从调用哪些库函数入手，看看他们分别做了什么。

图14：sysbench库函数调用矩阵

l clock_gettime贯穿整个sysbench过程，在库函数调用中占了半数，调用了65563次，开销时间随着sysbench 的--time参数改变而改变。有一点值得注意的是，sysbench进程已结束，但clock_gettime仍持续长达10秒+调用；

l log、floor函数调用一直维持在17%左右，这是评估CPU运算所使用的算法核心函数，从时间开销来看，此处并未发生明显瓶颈；

l futex是对内核的调用，主要就是管理进程挂起时的等待队列以及锁的睡眠与唤醒操作（即futex_wait、futex_wake）

ok，通过ltrace定位到进程具体调用库函数，并且也知道哪些函数调用次数最多，下一步就是要在代码中找出clock_gettime在哪里被调用。我们利用sysbench执行测试，自然要在sysbench源码中去寻找。下图15是clock_gettime在代码中的调用位置，只是简单列出，不包含调用链。

图15：sysbench代码中clock_gettime调用位置

同样log、floor在sysbench代码也有相应调用关系，在本文不再详述。

至此，毋庸置疑的是clock_gettime在sysbench调用过于频繁，这是跟sysbench的架构设计有关系，如果通过修改源码让其少调用库函数的次数，或者尝试修改库的源代码，是不是能够再提高性能？

醒醒吧，性能真有那么简单就下结论？首先修改库源代码并不实际，牵一发而动全身；其次库函数调用频繁并不代表此处遭遇瓶颈，需要和资源开销综合观测。

1）CPU使用率和平均负载

CPU使用率人人都会查，这是首先能想到CPU监控指标，下图16是sysbench执行中CPU实时监控情况，可以看到4线程同时在跑，平均分配到4个vCPU上，都满负荷运行，过去1分钟的平均负载达到4.06，并且持续在这负载线上。

结论1：平均负载最理想的情况是等于CPU 个数，4.06代表系统并未发生过载现象

图16：CPU使用率

2）用户/内核消耗CPU的时间，有无io等待

下图17是实时top监控，us100%，内核无CPU消耗，至始至终CPU没有出现iowait状态，内存也无开销，这是一个CPU基准测试工具该有的表现，只针对CPU检测，不牵连无辜。

结论2：CPU占用时间片正常，无等待I/O

图17：us/sy/wa的监控

3）系统、线程上下文切换

图18是vmstat实时监控，看到随着sysbench的运行，in次数增加明显，上下文切换短时增加，后趋于减小到正常水准。

结论3：sysbench运行中，中断次数明显增加，但不能确定是软中断，还是硬中断；系统上下文切换无异常

图18：系统上下文切换/中断次数

图19是利用pidstat监测到的线程开销，可看到4个sysbench线程均存在非自愿的上下文切换，次数维持在5-20之间，上下文切换必然产生性能开销，但如果超过1万或者切换次数出现很大增长，就可能出现性能问题。

结论4：sysbench在多线程运行下会存在非自愿的上下文切换，在单线程下则不会发生。整体上下文切换稳定在个位数，不会对性能结果造成明显影响。

图19：线程上下文切换

4）软硬件中断

之前vmstat监控到中断次数明显增加的情形，但无法判断中断类型，用mpstat继续排查后，发现4个vcpu并没有明显的中断发生，如下图20中%irq、%soft所示：

图20：mpstat监控CPU中断

先排除掉sysbench运行时性能瓶颈导致的中断增加，再监控下硬中断/proc/interrupts信息，找到中断发生的地方。图21中，通过测试前后对比，找到硬中断产生的位置，都是由LOC产生的Local timer interrupts，LOC是LInxu使用的驱动，用户无法访问和配置，这些都属于时间中断。

结论5：Local timer interrupts的发生，与频繁调用clock_gettime有关

图21：interrupts实时信息

（5）学会对比

从资源视角转了一圈，依次分析了load average、上下文切换、CPU使用、io等待和软硬件中断等，除了clock_gettime现象，其他并没发现明显性能瓶颈的位置，掉转船头，再回到sysbench调用库函数问题上。

ltrace是跟踪系统函数调用好工具，不过精准力度欠缺了些，下面使用perf看一看sysbench在运行中的热点函数是哪些。

在图22中，perf top实时看到当前系统上所有函数执行情况，不过什么鬼，在虚拟机中perf居然未能定位本地符号表对应的symbol和地址对应关系，有些符号不能解析为函数名，只能用地址表示，这谁看的懂。

图22：虚拟机上perf追踪各级函数执行情况

不能解析函数名，猜测是KVM虚拟化问题，找一个物理机用同样测试参数试下，可以看到sysbench 100%执行的是哪个函数，如图23所示：

图23：物理机上perf实时追踪

cpu_execute_event是sysbench评估最主要实现，在前文代码解读中已详细讲到。为了得到更细粒度分析，还可执行annotate，在C和汇编混合显示下获取热点函数下cpu指令，如图24所示：

图24：annotate获取更详细的热点指令

100%时间开销在执行cpu_execute_event操作上，分析运行代码，其中72.08%的时间占用%rcx一项指令上，这属于64位汇编参数传递的知识范围。

我曾经遇到一个奇怪现象，在64位linux系统上，素数运算速度反而低于32位，通过查找指令延迟表发现64位整数除法指令在某国产CPU上的执行时间远长于32位执行时间。这就解释了64位操作数编译成64位可执行程序为什么会发生性能异常。

后来我在cenots 7.2 64位系统上做过对比实验，确定相同的处理器下，64位系统素数运算速度是高于32位的，CPU64位指令集可以运行64位数据指令，一次可以提取64位数据，比32位提升一倍。

在64位系统中，增加了比32位系统多的寄存器。当sysbench调用函数时，传递参数会发生改变。一般参数都放在寄存器中传递，回过头看下sysbench在参数传递的代码，可以看到一个函数在调用时，前四个整型值依次传给寄存器 rbx、rax、rcx和rdx。

因为涉及知识盲区，这里不好评价是否存在问题，底层约定的通用参数传递方式，硬件层是无法改变，sysbench代码倒是可以变动，但效果未知。

如果从主动寻找性能问题无果，可以试试被动对比。所谓被动，是通过对比方式找到可能存在的问题。

1）不同物理CPU的性能表现

手上正好有2套不同CPU物理环境，试下物理cpu主频、核心进程的不同对性能的影响程度。

图25：:不同物理CPU下的性能对比

从图25折线图看到，在Intel Xeon E5-2680 V4上执行sysbench基准测试得到的数据优于Intel Xeon E5-2620 v2。

如果站在普通用户的角度看，这个结果差强人意，性能领先幅度也就45%左右，要知道从价格上看Intel Xeon E5-2680 V4可是甩E5-2620 v2几条街的。

不过考虑到sysbench只是对CPU的部分指标考量，并不能代表全部，慎重起见，需要综合CPU的架构、主频、L3缓存、线程数和总线规格一起分析。

图26：E5-2680/E5-2620对比

上图26是E5-2680 V4和E5-2620 V2对比，E5-2680单个线程实际使用主频虽只有1292MHZ，但实际性能胜过频率更高的E5-2620。

怎么回事，难道E5-2680装上了涡轮增压？1.2T的发动机爆发出超过2.0L自然吸气的动力？这里引出新的问题，对于普通云计算使用者或企业上云用户，开通一个虚拟机，是关心高主频，还是看多核心？

小朋友才做选择，让我选，我两个都要，高主频多核心都是王道。不过现实啪啪啪打脸，你不得不考虑成本，贵的东西自然好，但浪费资源也没必要。所以你需要先明确在虚拟机上要部署什么应用、什么使用场景、处理负载多大、是否计算密集型等，还有种特殊情况，有的应用或业务对CPU指令集有要求，比如有的软件要求AVX指令集支持，这样IvyBridge架构的CPU就不能选择了，必须选择Broadwell以后的CPU。

除了主频，CPU的性能还和CPU的架构、工作频率、Cache大小、支持指令系统等有重要的影响，单一看CPU主频不准确。

现代计算或标准型虚拟机大多数使用场景可能是多核多线程并行处理，需要CPU更快更大的缓存来暂存海量数据，这个时候CPU频率反而其次。

总之一句话，CPU性能先看架构，再看主频，然后对比核心线程，最后再看缓存。

2）不同线程数的性能对比

我曾经看过一些利用sysbench测试CPU的错误例子，操作者会把测试参数中的--threads不断加大，甚至远超过虚拟机CPU总核数。

图27：threads超过CPU线程数后的表现

多核CPU在多线程运用下，CPU的运算能力线性提高，如上图27所示，但当thread超过cpu核数后，CPU运算速度不会再增加。

通常在实际使用场景中，如果是单核CPU运行多线程技术，执行多线程运算是没有效果的，而当云主机需要执行其他IO操作的任务, 比如读取文件、网络通讯等, 多线程技术才能发挥作用，因此多核CPU在多线程运用下，CPU运算能力会明显提高。就好比你就两条腿怎么跑的过四条腿，你又不是美国队长。

threads不断增加，远超过虚拟机CPU总核数后，性能不会提升，只会增加这个CPU平均负载，如下图28，load average可以看到，在4核CPU虚拟机中，运行8个线程sysbench，导致sysbench线程互相争抢CPU使用权，负载达到8以上，造成严重负载，影响操作系统运行速度。

图28：超线程运行导致平均负载增加

3）和公开数据对比

很多时候在调查性能过程中，利用别人的经验，参考别人的数据不安全是坏事，自己闭门造车也要不得，当然这个过程需要慎重进行。

基于PM测试的全球CPU天梯榜，该排名是基于数千个PerformanceTest基准测试得出的评分，相对公正，如下图29所示：

图29：CPU天梯榜

除此之外，推荐1个基准测试网站：openbenchmarking.org，这是1个测试结果数据的公共和私有存储网站，用于共享结果和有效比较多个测试结果集的有效协作。在这个网站有来自全球各地主动推送上来的测试数据。

4）虚拟机的cpu性能损耗

虚拟机cpu性能相比宿主机硬件的损耗程度，也是一个用户关心的：我们创建的KVM虚拟机能实现“零损耗”么？

这是一个比较“庞大”的话题，无论使用哪种flavor（规格）创建虚拟机，它的vCPU在宿主机上物理CPU不同核之间调度。在虚拟机上，执行sysbench，命令请求下去后，先经过vCPU到虚拟机os，再调度到物理机CPU上，vCPU在物理机系统上就是1个线程调用，有调度就会产生开销，有了开销必然带来性能上的影响。

图30：物理CPU、云主机vcpu性能对比

参考上图30中的数据，在同等硬件环境、相同工具下，虚拟机cpu素数运算性能与物理节点的CPU性能几乎“一致”，但这里的“一致”，是有前提的，需要保证在执行测试过程中不会受到其他虚拟机干扰，因为通常虚拟机 vCPU 是随机共享，vCPU 的共享方式会根据节点宿主机上其他主机的负载，将 vCPU 调度到不同核心上，当然也可能在同一核心上。

不过这样对比并不公平，过于理想化。因为一个宿主机资源不可能只提供给1台虚拟机使用，绝大多数的情况下，单个计算节点上同时有多台虚拟机存活，他们互相争抢CPU的使用权，另外，宿主机所在Linux系统还可能会将内存交换、软中断等进程调度到虚拟机正在使用的物理核上，这些因素叠加必然会导致虚拟机相对于宿主机CPU性能产生抖动（性能抖动又是另外一个话题了）。

四总结

测试10秒钟，分析数小时，一个sysbench测试CPU的过程，看起来不起眼，但很多地方仍然存在疑惑，还需再挖掘。

从工具执行原理，到操作系统内核影响，涉及编译器，再到cpu指令集，还有vcpu或qemu-kvm在宿主机的进程调度带来的性能开销。各个环节，每一个单独拿出来都是长篇大论。

就目前已知的性能问题发现或瓶颈看，可以尝试四个方向的性能调优方案：

（1）CPU独占

这是目前各大云计算厂商常用的方法，前文也提到同一个宿主机节点的cpu资源被多个虚拟机争抢，且因为cpu的抖动，增加cpu切换，导致虚拟机计算能力的不稳定。如果使云主机机独占物理CPU，虚拟机的vCPU能够固定绑定到宿主机的指定CPU上，在整个运行期间，避免CPU浮动，减少CPU切换开销，能够一定程度上提高虚拟机CPU计算性能。

（2）编译器优化

不久前华为发布最新产品P30，这款手机因为各种段子火了，另一个火的就是他家的方舟编译器，号称可以实现 Android 性能革命。

不要小看编译器，它是应用程序和CPU硬件（指令集）之间的桥梁。GCC是目前广泛应用的Linux系统的默认编译器，在很多Linux桌面发行版、服务器版上都能看到它的身影，但是在各硬件平台上却并不是性能最优的编译器。

这里有2个方向：

n 取消GCC自动编译，采用人工编译，开启GCC全部优化项

n 直接用intel自家开发的ICC取代GCC， Intel基于x86架构CPU开发出ICC，能够最大程度发挥x86架构CPU的真实性能

（3）bios调优，启用睿频

曾经有过启用睿频大幅提升存储io性能的经历，那时对io请求进程做了频率上限导致性能被压制。开启睿频，可以让CPU根据实际运行程序的需求，动态增加运行频率用来提高处理器的性能。

（4）sysbench库函数clock_gettime调用

sysbench对clock_gettime调用频繁，这虽然与它本身设计有关系，但如果通过修改源码让其调用更少库函数的次数，也是未来的调优方向。

你可能感兴趣的:(国产芯片,性能,虚拟化,性能)

嵌入式环境下的C++最佳实践 is0815 c++开发语言
目标：学习嵌入式环境下的C++最佳实践内存管理优化：避免动态分配为什么避免动态分配？堆内存分配（如malloc,new）开销大，速度慢。堆内存容易导致碎片化，增加内存压力。动态分配增加内存泄漏、使用后未释放等风险。实时、高性能系统（嵌入式、游戏引擎）尤其需要优化内存管理。栈vs堆的性能对比特性栈(stack)堆(heap)分配/释放速度极快(O(1))较慢(需管理分配表，O(logn)或更慢)生命
分布式系统ID生成方案深度解析：雪花算法 vs UUID vs 其他主流方案可曾去过倒悬山算法后端
分布式系统ID生成方案深度解析：雪花算法vsUUIDvs其他主流方案在分布式系统中，如何高效生成全局唯一ID是一个关键挑战。本文将深入剖析雪花算法、UUID及多种主流ID生成方案，帮助开发者根据业务场景选择最佳方案。一、为什么需要分布式ID？在分布式系统中，传统数据库自增ID存在明显瓶颈：单点故障：依赖单数据库实例扩展困难：分库分表时ID冲突安全风险：连续ID暴露业务量性能瓶颈：高并发下成为系统瓶
Python HTTP日志分析：Nginx/Apache日志的Python解析华科℡云网络协议负载均衡运维
Web服务器日志是监控流量模式、性能瓶颈及安全威胁的关键数据源。Python凭借其丰富的库生态，可高效解析Nginx与Apache的日志格式，实现结构化数据提取与分析。日志格式解析基础Nginx默认采用combined格式，字段包括：$remote_addr（客户端IP）、$time_local（时间戳）、$request（请求方法+URL+协议）、$status（HTTP状态码）、$body_b
Python HTTP服务监控：Prometheus与自定义Exporter开发指南
在微服务架构中，HTTP服务的高效监控对保障系统稳定性至关重要。Prometheus作为云原生监控标杆，通过其Pull模型与灵活的指标体系，结合Python开发的自定义Exporter，可实现HTTP服务性能、可用性及业务指标的全面观测。Prometheus监控核心机制Prometheus采用时间序列数据库存储指标数据，每条数据由指标名称（如http_requests_total）、标签（如met
0X JavaSE-- 并发编程（并发容器、ThreadLocal、线程池） SunsPlanter JavaSE java
线程池什么是线程池线程池其实是一种池化的技术实现，池化技术的核心思想就是实现资源的复用，避免资源的重复创建和销毁带来的性能开销。线程池可以管理一堆线程，让线程执行完任务之后不进行销毁，而是继续去处理其它线程已经提交的任务。使用线程池的好处降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。提高线程的可管理性。线程是
提升异地网络性能的全面指南：QoS策略、CDN加速与WAN优化技术北极光SD-WAN组网网络
一、网络延迟与带宽优化：QoS策略与带宽聚合技术1.1QoS（服务质量）策略的核心功能QoS（QualityofService）是网络性能优化的核心技术，通过对网络流量进行分类和优先级分配，确保关键业务（如视频会议、语音通话）的低延迟和高可靠性。关键策略包括：流量分类与优先级分配：通过策略规则对不同种类的流量进行标记，将高优先级分配给实时性要求高的业务。拥塞管理：利用队列技术如CBWFQ（基于类的
Java 中 LinkedList 的排序方法与性能比较 Java大师兄学大数据AI应用开发 AI人工智能与大数据应用开发 AI实战 java 开发语言 ai
Java中LinkedList的排序方法与性能比较关键词：JavaLinkedList、排序方法、性能比较、双向链表、时间复杂度、Collections.sort、Stream.sorted摘要：LinkedList是Java集合框架中常用的双向链表结构，适合频繁插入/删除操作，但排序时却常因特性限制导致性能问题。本文将从“火车车厢”的生活类比出发，逐步拆解LinkedList的排序原理，对比Co
DTO、VO、POJO转换性能测试 ZuuuuYao Java 开发语言 java
PO、DTO、VO、BO对象转换性能测试一、Java对象转换性能测试（一）测试对象mapstruct（二）测试对象modelmapper二测试代码(1)准备UserEntity(2)准备UserVO(3)编写mapstruct的映射器UserStructMapper(4)准备测试类(5)输出结果三、测试报告四、结论一、Java对象转换性能测试（一）测试对象mapstructMapstruct是一个
SQLite 数据库在大数据分析中的应用潜力数据库管理艺术数据库 sqlite 数据分析 ai
SQLite数据库在大数据分析中的应用潜力关键词：SQLite、大数据分析、轻量级数据库、嵌入式数据库、数据仓库、OLAP、性能优化摘要：本文深入探讨了SQLite这一轻量级嵌入式数据库在大数据分析领域的应用潜力。我们将从SQLite的核心架构出发，分析其在大数据场景下的优势和限制，并通过实际案例展示如何通过优化策略和扩展技术使SQLite能够处理大规模数据集。文章包含性能对比测试、优化技巧和实际
鸿蒙线程池全揭秘：让你的应用快、稳、省资源 harmonyos
摘要在现代应用开发中，多线程已经成为提升程序性能、优化用户体验的关键手段。尤其是在HarmonyOS（鸿蒙系统）这种强调分布式、并发处理的系统架构中，合理使用多线程不仅可以让程序运行更高效，还能帮助我们处理复杂的后台任务，比如文件下载、数据库操作、网络请求等。引言鸿蒙系统作为面向多设备融合的新一代操作系统，其支持的多线程模型与传统Android十分类似。很多Java的线程操作方法在鸿蒙中依然适用。
鸿蒙关系型数据库实战：高效数据存储与管理数据库harmonyos
在鸿蒙应用开发中，关系型数据库（RDB）是结构化数据存储的核心方案。通过深度实践，其基于SQLite的轻量级实现不仅性能出色，更提供了强大的事务支持和类型安全。以下是关键经验总结：三大核心优势：SQL兼容：完整支持SQL92标准语法线程安全：内置多线程读写锁机制加密存储：支持AES-256加密敏感数据关系型数据库实战封装及使用：在Utils目录下新建一个RdbUtils文件//./src/main
docker网络_docker之间的网络协议 2401_89224733 网络 docker 网络协议
一、docker网络模式docker0网络docker容器的虚拟网关loopback:回环网卡、TCP/IP网卡virtualbridge:linux自身继承了一个虚拟化功能(kvm架构)，是原生架构的一个虚拟化平台，安装了一个虚拟化平台之后就会系统就会自动安装虚拟网卡。安装workstation(虚拟化平台)之后，会在网络适配器中会多出VMnet1VMnet8VMnet0)docker0:容器的
如何在 Windows 11 或 10 任务管理器中查看后台运行的应用程序或服务山岚的运维笔记 windows 使用技巧 windows
监控在Windows中后台运行的应用程序并非难事，也无需任何第三方应用程序。无论是Windows10还是11，两者都内置了一个名为【任务管理器】的应用程序。它的作用是允许用户识别和查看后台运行的应用程序以及服务。它有助于用户排查性能问题或确保高效分配资源。然而，如果你不知道如何操作，那么本文将帮助你了解如何访问和使用Windows任务管理器。打开任务管理器第一步是访问【任务管理器应用程序】，打开它
Cadence Design Systems EDA介绍（五）--Innovus 小蘑菇二号笔记
目录Innovus的主要功能1.初始布局规划（Floorplanning）2.详细布局（Placement）3.布线（Routing）4.时序分析与优化（TimingAnalysisandOptimization）5.功耗分析与优化（PowerAnalysisandOptimization）6.面积优化（AreaOptimization）7.签核（Sign-off）Innovus的特点1.高性能2
FPGA和嵌入式系统的核心区别 2301_82243800 fpga开发
灵活性：FPGA具有高度的灵活性，可以根据需要重新编程以实现不同的功能。嵌入式系统的硬件功能通常是固定的，无法进行大规模的硬件级别的修改。开发周期：FPGA的开发周期相对较短，因为它可以通过重新编程来实现新功能，快速原型设计和迭代能力可以缩短开发周期。嵌入式系统的开发周期相对较长，因为它需要进行硬件设计、芯片制造和软件开发等多个环节。性能：FPGA芯片具有并行处理的能力，可以实现高性能计算和数据处
论文阅读：2025 arxiv Qwen3 Technical Report
https://arxiv.org/pdf/2505.09388https://www.doubao.com/chat/9918384373236738文章目录论文翻译Qwen3技术报告摘要1引言论文翻译Qwen3技术报告Qwen团队摘要在这项工作中，我们介绍了Qwen模型家族的最新版本Qwen3。Qwen3包含一系列大型语言模型（LLM），旨在提升性能、效率和多语言能力。Qwen3系列包括密集型
specpu2017安装/编译/运行测试总结 So_shine linux调试工具和性能量化 linux
目录前言一、源码镜像获取二、安装三、配置修改四、编译五、运行测试六、结果查看七、遇到的问题前言SPEC是标准性能评估公司（StandardPerformanceEvaluationCorporation）的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织，这个组织的目标是建立、维护一套用于评估计算机系统的标准。SPECCPU测试中，测试系统的处理器、内存子
hmc7044时钟芯片调试笔记 So_shine Linux驱动总结分享 linux内核驱动时钟芯片
目录前言一、依赖文档、工具二、运行linux内核驱动的平台1、代码、文件列表2、适配、编译3、调试三、无os的mcu平台1、代码、文件列表2、适配、编译3、调试前言本笔记基于运行linux操作系统的SOC芯片平台、linux内核版本linux5.10.xxx和无操作系统的mcu平台记录调试；一、依赖文档、工具文档名说明获取方式hmc7044.pdf数据手册adi官网或者国内采芯网GUI配置工具通过
specpu2017在arm64环境下的部署/测试 So_shine specpu 性能测试 arm64 环境部署
目录前言一、源码镜像获取二、安装三、配置修改四、编译五、运行测试六、结果查看七、遇到的问题前言SPEC是标准性能评估公司（StandardPerformanceEvaluationCorporation）的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织，这个组织的目标是建立、维护一套用于评估计算机系统的标准。SPECCPU测试中，测试系统的处理器、内存子
基于均值偏移算法的动态目标跟踪研究 Zoiny_楠算法均值算法目标跟踪
摘要：目标跟踪技术是计算机视觉领域中重要研究课题之一,在人类生活、军事侦察、工业生产、医疗诊断、交通管理等多方面,都有广泛的应用,研究目标跟踪对人类生活、工程应用等具有现实的指导意义。在基于视觉的目标跟踪算法中,经典的Mean-Shift算法以其理论科学有效、操作简单易实现,跟踪性能较好等优势,一直是众多学者研究的热点。可算法也存在着许多缺陷。例如目标模型中混有背景信息的干扰,给目标定位带来了偏差
如何在 Manjaro Linux 上安装 Docker 容器
在ManjaroLinux上通过DockerHub安装、创建和运行Docker容器的简单步骤，以便在虚拟环境中使用各种应用程序。使用虚拟机有其自身的优势，它能够更好地利用硬件资源，节省成本和空间。然而，在传统虚拟机上运行每一个应用程序不仅耗时，还需要更多的资源。为了解决这一问题，Docker应运而生。它使我们能够在名为容器的虚拟化环境中即时运行应用程序。这些容器可以相互构建并相互通信……例如，这些
鸿蒙线程池全揭秘：让你的应用快、稳、省资源前端世界 harmonyos harmonyos 华为
摘要在现代应用开发中，多线程已经成为提升程序性能、优化用户体验的关键手段。尤其是在HarmonyOS（鸿蒙系统）这种强调分布式、并发处理的系统架构中，合理使用多线程不仅可以让程序运行更高效，还能帮助我们处理复杂的后台任务，比如文件下载、数据库操作、网络请求等。引言鸿蒙系统作为面向多设备融合的新一代操作系统，其支持的多线程模型与传统Android十分类似。很多Java的线程操作方法在鸿蒙中依然适用。
AI原生应用性能优化：混合推理的7个最佳实践 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据 AI-native 性能优化 ai
AI原生应用性能优化：混合推理的7个最佳实践关键词：AI原生应用、性能优化、混合推理、最佳实践、推理效率摘要：本文主要探讨了AI原生应用性能优化中混合推理的相关内容。首先介绍了文章的背景、目的、预期读者和文档结构等信息，接着对混合推理的核心概念进行了通俗易懂的解释，并阐述了各核心概念之间的关系，给出了核心概念原理和架构的文本示意图以及Mermaid流程图。详细讲解了核心算法原理和具体操作步骤，用数
使用vllm部署 Nanonets-OCR-s 没刮胡子软件开发技术实战专栏 Linux服务器技术人工智能AI ocr python 深度学习
使用vLLM部署Nanonets-OCR-s模型的完整指南Nanonets-OCR-s作为基于Qwen2.5-VL-3B的多模态OCR模型，结合vLLM的高效推理引擎可显著提升部署性能。一、环境准备与依赖安装1.安装vLLM与多模态依赖#安装vLLM（含CUDA加速）pipinstallvllm==0.3.21#建议使用稳定版本pipinstalltransformers==4.35
C++中对象传参的几种方式递归书房 c++
在C++中传递对象作为函数参数有多种方式，每种方式都有不同的语义、性能特点和适用场景。以下是全面的分析和最佳实践指南：1.按值传递(PassbyValue)voidprocessObject(MyClassobj){//操作obj的副本}MyClassoriginal;processObject(original);//复制构造新对象特点：创建对象的完整副本函数内修改不影响原始对象调用时发生复制构
道路交通标志检测数据集-智能地图与导航交通监控与执法智慧城市交通管理-2,000 张图像 cver123 数据集智慧城市人工智能目标跟踪计算机视觉目标检测
道路交通标志检测数据集已发布目标检测数据集合集（持续更新）道路交通标志检测数据集介绍数据集概览包含类别应用场景数据样本展示YOLOv8训练实战1.环境配置安装YOLOv8官方库ultralytics2.数据准备2.1数据标注格式（YOLO）2.2文件结构示例2.3创建data.yaml配置文件3.模型训练关键参数补充说明：4.模型验证与测试4.1验证模型性能关键参数详解常用可选参数典型输出指标4.
干货！大模型时代一定要收藏的 20 个LLM 中文数据集 OpenBayes 资源上新人工智能语言模型数据库机器学习
自ChatGPT重磅推出以来，大语言模型(largelanguageModel,LLM)以其卓越的学习能力在各个领域引起轰动。大模型的训练和调优离不开优质庞大的数据支撑，精心构建的数据集不仅为大模型提供了充分的燃料，还为大模型在垂直领域的应用和性能提升提供了可能。本文整理了一些适用于大模型训练调优的热门中文公开数据集（按照首字母A-Z顺序排列），以供大家了解和使用。温馨提示：本文列举的所有数据集，
Mysql回表查询：深入解析与实战应用需要重新演唱 mysql mysql 数据库
Mysql回表查询：深入解析与实战应用今天，我们将深入探讨Mysql中的回表查询。回表查询是Mysql索引机制中的一个重要概念，理解它的工作原理和优化方法，对于提升数据库查询性能至关重要。让我们一起揭开回表查询的神秘面纱。1.什么是回表查询？回表查询（LookupQuery）是指在使用非聚集索引（Non-ClusteredIndex）进行查询时，如果需要获取的数据不在索引页中，就需要根据索引页中的
基于UC3845B的72V转12V DC-DC电源模块设计资料包
本文还有配套的精品资源，点击获取简介：本资料包详细介绍了使用UC3845B芯片实现从72V到12V的DC-DC电源转换的设计过程，涵盖了电源转换技术、UC3845B芯片的应用、电路设计原则，并提供了Altiu1.UC3845B芯片应用概述1.1UC3845B芯片简介UC3845B是一款经典的脉宽调制（PWM）控制器，广泛应用于开关电源的设计中，特别是在反激式和正激式转换器中。它集成了多种保护功能，
UC3842控制器在flyback反激电源设计与仿真中的应用 Jacob Piao
本文还有配套的精品资源，点击获取简介：UC3842作为电流模式控制的集成控制器，在设计反激式转换器中有着广泛应用。本文档提供了使用UC3842进行flyback反激电源电路设计的详细案例，并通过Multisim14进行仿真。包含了电路设计的源文件、仿真参数设置及UC3842芯片的详细资料，旨在为工程师提供从理论到实践的完整学习平台。1.UC3842控制器特点与应用1.1UC3842控制器简介UC3
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache