腾讯云开发者

Go和C++通用性能优化黑魔法——PGO！

导读

我们在进行性能优化的时候，往往会应用各种花式的优化手段：优化算法复杂度（从 O(N) 优化到 O(logN) ），优化锁的粒度或者无锁化，应用各种池化技术：内存池、连接池、线程池、协程池等。压缩技术、预拉取、缓存、批量处理、SIMD，内存对齐等等手段后，其实还有一种手段就是 Profile-Guided Optimization （PGO）。本文会介绍 PGO 的原理，以及 Go/C++ 语言进行 PGO 的实践。

1 Profile-Guided Optimization (PGO)原理

2 Go 的 PGO 实践

3 C++的 PGO 时间

4 总体实践和规划

通常情况下，核心系统的性能优化往往是一个研发毕生所学，十八班武艺全管上的持久性项目。但老板从来不管质量、速度、成本只能三选其二的真理，老板永远是全都要。在穷尽性能优化的种种方式以后，老板问：性能还能不能再快一点时，你怎么办？别急，PGO 可以帮你。

Profile-guided optimization (PGO)又称 feedback-directed optimization (FDO) 是指利用程序运行过程中采集到的 profile 数据，来重新编译程序以达到优化效果的 post-link 优化技术。它是一种通用技术，不局限于某种语言。

01

Profile-Guided Optimization (PGO)原理

PGO 首先要对程序进行剖分(Profile)，收集程序实际运行的数据生成 profiling 文件，根据此文件来进行性能优化：通过缩小代码大小，减少错误分支预测，重新组织代码布局减少指令缓存问题等方法。PGO 向编译器提供最常执行代码区域，编译器知道这些区域后可以对这些区域进行针对性和具体的优化。

PGO 大体都可以由如下3个步骤，具体细节可能稍微有点差异，后面会讲：

步骤1：

编译的时候添加编译或者链接选项以便在步骤二运行的时候可以生成 prof 文件。例如 clang 的-fprofile-instr-generate、-fdebug-info-for-profiling、-funique-internal-linkage-names 选项等。

步骤2：

该步骤是根据步骤1生成的可执行程序，运行生成 prof 文件。这种通常有两种方法，第一种方法是如上面 clang 的-fprofile-instr-generate 选项，该参数相当于在编译时插桩，运行时自动生成 prof 文件。另外一种称之为 AutoFDO，才运行时候动态采集，C++等可以用 perf，Go 的话更方便 runtime/pprof or net/http/pprof 都可以采集到。

步骤3：

步骤3是根据步骤2的 prof 重新编译，同时有必要的话去掉步骤1中添加的编译参数，重新编译生成新的可执行文件。

1.1 错误分支预测优化

下面用简单的一个 if 判断语句来说明为什么减少错误分支预测可以实现正优化。看下面示例代码：

if condition {
  // 执行逻辑1
} else {
  // 执行逻辑2
}

在编译时，由于编译器并不能假设 condition 为 true 或者 false 的概率，所以按照定义的顺序：如果 condition 为 true 执行逻辑1，如果条件不满足跳跃至 else 执行逻辑2。在 CPU 的实际执行中，由于指令顺序执行以及 pipeline 预执行等机制，因此，会优先执行当前指令紧接着的下一条指令。上面的指令如果 condition 为 true 那么整个流水线便一气呵成，没有跳转的开销。相反的，如果 condition 为 false，那么 pipeline 中先前预执行的逻辑1 计算则会被作废，转而需要从 else 处的重新加载指令，并重新执行逻辑2，这些消耗会显著降低指令的执行性能。

如果在实际运行中，condition 为 true 的概率比较大，那么该代码片段会比较高效，反之则低效。借助对程序运行期的 pprof profile 数据进行采集，则可以得到上面的分支判断中，实际走 if 分支和走 else 分支的次数。借助该统计数据，在 PGO 编译中，若走 else 分支的概率较大（相差越大效果越明显），编译器便可以对输出的机器指令进行调整，使其生成的指令从而对执行逻辑2更加有利。其实很简单比如汇编指令 je （等于就跳转）等价替换成 jne（不等于就跳转）。

02

Go 的 PGO 实践

Go 语言从 Go1.20 开始就支持 PGO 优化，不过默认是关闭的 -pgo=off，从 Go1.21 开始 -pgo=auto 默认打开。从我测试的几个 case 来看 Go.1.20 的优化效果并不明显，Go1.21 的优化效果更明显，现在 Go1.21 已经发布建议大家用 Go1.21 及其以上版本。

2.1 Profile 文件采集

Go 的 PGO 需要一个 cpu pprof profile 文件作为一个输入，可喜的是 Go profile 文件的生成已经集成到了运行时：（ runtime/pprof and net/http/pprof)可以直接采集获取。当然其他的格式的文件比如上述 Linux perf 的满足一天基本的前提条件可以可以转换成 pprof format 为 Go PGO 所用。最简单的方法是：curl -o cpu.pprof "http://localhost:8080/debug/pprof/profile?seconds=30" 从服务的任意实例获取 30s 的数据。由于下述的原因 30s 的数据可能不具有代表性：

该实例在执行分析时候比较空闲，尽管它平时可能比较忙。
该实例的流量某天发生了变化导致实例行为也发生了变化。
在不同的时间段执行不同的操作类型，可能该 30s 的采样间隔只能覆盖单一的操作类型。
该实例有异常流量。
其他。

比较稳健的做法是不同时间收集不同实例的 profile 文件，然后合并成一个文件给 PGO 使用，以限制单个 profile 文件的影响。

go tool pprof -proto a.pprof b.pprof > merged.pprof

需要注意的是，profile 文件的收集都是要从生成环境获得实际最真实的运行情况，这样的优化效果才最好。单元测试或者部分的基准测试不适合 PGO 优化，因为它支持程序的一小部分收效甚微。

2.2 PGO 的迭代构建

正如上面所说，建议采用 Go 1.21 以上版本，标准的构建方法是将 default.pgo 文件放在 main package 所在的目录，Go 编译器探测到 default.pgo 自动开启 PGO 优化。除了这种方式外，也可以指定 profile 文件路径。

go build -pgo=/pprof/main.pprof

由于程序一直在开发迭代，所以步骤2和步骤3是一个循环过程。步骤2中的 profile 文件对应的源代码跟最新的源代码可能是不一样的，Go PGO 的实现对此具有鲁棒性，称之为源稳定性。同样在经过一次迭代后，二进制的版本也是使用上次 profile 文件已经优化后的版本，Go PGO 的实现同样对此具有鲁棒性，称为迭代鲁棒性。

2.2.1 PGO 源鲁棒性

源稳定性是通过使用启发式方法将配置文件中的示例与编译源进行匹配来实现的。因此，对源代码的许多更改（例如添加新功能）对匹配现有代码没有影响。当编译器无法匹配更改的代码时，一些优化会丢失，但请注意，这是一种优雅的降级。单个函数未能匹配可能会失去优化机会，但总体 PGO 收益通常会分布在多个函数中。

Go 的 PGO 尽最大努力继续将旧配置文件中的样本与当前源代码进行匹配。具体来说，Go 在函数内使用行偏移（例如：调用函数的第10行），总的来说存在两种情况：一种是破坏匹配，另外一种没有破坏匹配。

许多常见的修改不会破坏匹配：

在热函数之外更改文件（在函数上方或下方添加/更改代码）。
将函数移动到同一包中的另一个文件（编译器完全忽略源文件名）。

还有一些修改会破坏匹配：

热函数内的更改（可能会影响行偏移）。
重命名函数（和/或方法的类型）（更改符号名称）。
将函数移动到另一个包（更改符号名称）。

如果 profile 相对较新，则差异可能只会影响少数热门函数，从而限制了无法匹配的函数中错过优化的影响。尽管如此，随着时间的推移，profile 慢慢变旧，性能下降会慢慢累积，因为代码很少被重构回旧的形式，因此定期收集新的 profile 以限制生产中的源偏差非常重要。

profile 文件匹配度可能显著降低的一种情况是大规模重构，即重命名许多函数或在包之间移动它们。在这种情况下，您可能会受到短期性能影响，直到新的 profile 文件构建生效。

2.2.2 迭代鲁棒性

迭代稳定性是为了防止连续 PGO 构建中的可变性能循环（例如，构建 1 快，构建 2 慢，构建 3 快，等等）。我们使用 CPU profile文件来识别要优化的热门函数调用。理论上，PGO 可以大大加快热函数的速度，使其在下一个 profile 中不再显示为热函数，并且不会得到优化，从而使其再次变慢。Go 编译器对 PGO 优化采取保守的方法，他们认为这可以防止出现重大差异。

2.2.3 总结

假如 Go PGO 不能保证源稳定性和迭代稳定性，那我们就需要采样二阶段构建的方式发布我们的服务。第一阶段构建一个未启用 PGO 优化的版本，灰度发布到生产环境，然后采集对应的 profile 文件。第二阶段根据采集的 profile 文件启用 PGO 优化，再次全量发布到生成环境。

2.3 实践结果

在我们的辅助 sidecar 程序采用 Go 1.21 开启 PGO 优化后，大概有5%性能提升，Go 官方给的数据大概是2～7%提升。业务程序也部分开始应用 PGO 进行优化。Go 未来 PGO 会继续迭代优化，我们可以持续关注下。

2.4 Go PGO 未来

关于这个问题 Go 语言 member @aclements 在 PGO 的一个 issue 里有提到过 PGO 可以优化的非完全列表：

内联（这个已经很常规了）。
函数块排序，对函数块进行排序，聚焦热块改进分支预测。
寄存器分配，目前寄存器分配采用启发式确定热路径和移除，PGO 可以告知真正的热路径。
函数排序，在整个二进制的级别对函数进行排序和聚集，以后更好的局部性。
全局块排序，超越函数排序的一步，其集中形式可能是冷热分离，也有可能比这更激进。
间接调用去虚拟化，这里后面跟 C++ 的类似（后面 C++ 会详细讲下这里）。
模版化，基于 profile 将模版化热通用函数。
map/slice 的预分配。
生命周期分配，将具有相似生命周期的分配放在一起。

03

C++ 的 PGO 实践

根据 profile 可以优化寄存器的分配，优化循环的矢量化（针对只有少数几个迭代的循环不做 vectorize，vecrorize 会增加而外的运行成本），提升分支预测的准确性等。C++ 中虚函数的 Speculative devirtualization 优化技术就依赖于分支预测的准确性，下面会重点讲下。

3.1 虚函数优化

C++的虚函数使用起来非常方便，代码的抽象层次也非常好，但是他还是有一定的开销相比普通函数，如果大量使用虚函数在性能要求非常高的场景对性能还是有一定的影响，主要体现在如下的方面：

空间开销：由于需要为每一个包含虚函数的类生成一个虚函数表，所以程序的二进制文件大小会相应的增大。其次，对于包含虚函数的类的实例来说，每个实例都包含一个虚函数表指针用于指向对应的虚函数表，所以每个实例的空间占用都增加一个指针大小（32位系统4字节，64位系统8字节）。这些空间开销可能会造成缓存的不友好，在一定程度上影响程序性能。

虚函数表查找：虚函数增加了一次内存寻址，通过虚函数指针找到虚函数表，有一点点开销但是还好。

间接调用（indirect call）开销：由于运行期的实际函数（或接口）代码地址是动态赋值的，机器指令无法做更多优化，只能直接执行 call 指令（间接调用）。对于直接调用而言，是不存在分支跳转的，因为跳转地址是编译器确定的，CPU 直接去跳转地址取后面的指令即可，不存在分支预测，这样可以保证 CPU 流水线不被打断。而对于间接寻址，由于跳转地址不确定，所以此处会有多个分支可能，这个时候需要分支预测器进行预测，如果分支预测失败，则会导致流水线冲刷，重新进行取指、译码等操作，对程序性能有很大的影响。

无法内联优化：由于 virtual 函数的实现本身是多态的，编译中无法得出实际运行期会执行的实现，因此也无法进行内联优化。同时在很多场景下，调用一个函数只是为了得到部分返回值或作用，但函数实现通常还执行了某些额外计算，这些计算本可以通过内联优化消除，由于无法内联，indirect call 会执行更多无效的计算。

阻碍进一步的编译优化：indirect call 相当于是指令中的一个屏障，由于其本身是一个运行期才能确定的调用，它在编译期会使各种控制流判断以及代码展开失效，从而限制进一步编译及链接的优化空间。

3.2 Basic devirtualization

我们通过下面一个例子来简单说明编译器是如何去虚拟化的：

class A {
public:
    virtual int foo() { return ; }
};


class B : public A {
public:
    int foo() { return 2; }
};


int test(B* b) {
    return b->foo() + ; }

当调用 test(B *b) 里面的 b->foo() 函数时，编译器并不知道 b 是一个真正的 B 类型，还是 B 的子类型，所以编译生成的代码会包含间接调用（indirect call 行：19）针对虚函数调用(b->foo())。gcc 9 生成的汇编代码如下（裁剪后）：

12     subq    $16, %rsp
 13     movq    %rdi, -8(%rbp)
 14     movq    -8(%rbp), %rax
 15     movq    (%rax), %rax
 16     movq    (%rax), %rdx
 17     movq    -8(%rbp), %rax
 18     movq    %rax, %rdi
 19     call    *%rdx
 20     addl    $3, %eax

我们把上面 class B 的代码改一下，增加关键词 final ：

class B : public A {
public:
    int value() final { return 2; }
};

这样编译器知道 class B 不可能有子类，可以进行去虚拟化优化(-fdevirtualize )，汇编代码如下：

6 _ZN1B3fooEv:
  7 .LFB1:
  8     .cfi_startproc
  9     pushq   %rbp
 10     .cfi_def_cfa_offset 16
 11     .cfi_offset 6, -16
 12     movq    %rsp, %rbp
 13     .cfi_def_cfa_register 6
 14     movq    %rdi, -8(%rbp)
 15     movl    $2, %eax
 16     popq    %rbp
 17     .cfi_def_cfa 7, 8
 18     ret
 19     .cfi_endproc
 20 .LFE1:
 21     .size   _ZN1B3fooEv, .-_ZN1B3fooEv
 22     .text
 23     .globl  _Z4testP1B
 24     .type   _Z4testP1B, @function
 25 _Z4testP1B:
 26 .LFB2:
 27     .cfi_startproc
 28     pushq   %rbp
 29     .cfi_def_cfa_offset 16
 30     .cfi_offset 6, -16
 31     movq    %rsp, %rbp
 32     .cfi_def_cfa_register 6
 33     subq    $16, %rsp
 34     movq    %rdi, -8(%rbp)
 35     movq    -8(%rbp), %rax
 36     movq    %rax, %rdi
 37     call    _ZN1B3fooEv
 38     addl    $3, %eax
 39     leave
 40     .cfi_def_cfa 7, 8
 41     ret
 42     .cfi_endproc

可以看到间接调用已经修改成直接调用，当然这里可以进一步优化成一条指令：

6 .LFB2:
  7     .cfi_startproc
  8     movl    $5, %eax
  9     ret
 10     .cfi_endproc

3.3 Basic devirtualization

根据实际运行情况，去推导去虚拟化。还是举一个简单的例子来说明下：A* ptr->foo()，ptr 是一个指针，他可以是 A 也可以是 B，甚至是他们的子类，编译器在编译无法确定其类型。假设在实际的生产环境中的，ptr 大概率是 A 对象，而不是B对象或者其子类对象，speculative devirtualization，gcc 的编译参数（-fdevirtualize-speculatively）优化就会尝试进行如下的转换：

if (ptr->foo == A::foo)
  A::foo ();
else
  ptr->foo ();

经过此转换后，将间接调用转换成直接调用，就可以进行直接调用优化，比如说 inline 等。

3.4 实践结果

最近正在进行 envoy 的性能优化测试，测试详情如下。

硬件设施为 V8 的虚拟机（母机为 M6 的机器），参数如下：

model name	: Intel(R) Xeon(R) Platinum 8255C CPU @ 2.50GHz
cpu MHz		: 2494.140
cache size	: 36608 KB

envoy 版本为 V1.26.0，未开启熔断和限流配置，开启了 tracing 采样率为万分之一，测试数据 playload 1k，rpc 协议为 srf 协议。

编译器为 clang14，具体结果如下：

基础参数	连接数	单核 qps	平均延时（ms）
未开启 PGO	100	20k	4.87
开启 PGO	100	23.7k	4.28

可以看出在开启 PGO 优化的情形下，平均时延减少14%～18%，QPS 提升15%～18%左右。

-End-

原创作者｜黄欣欣

关于性能优化你还有什么小妙招？欢迎分享。我们将选取1则最有意义的评论，送出腾讯云开发者-手机支架1个（见下图）。10月26日中午12点开奖。

欢迎加入腾讯云开发者社群，社群专享券、大咖交流圈、第一手活动通知、限量鹅厂周边等你来~

（长按图片立即扫码）

（PS：后台回复1019获取本期封面表情包）

常用图像增强算法原理及 OpenCV C++ 实现埃菲尔铁塔_CV算法 opencv 计算机视觉人工智能 c++算法机器学习
一、引言图像增强是数字图像处理中的一个重要分支，其目的是改善图像的视觉效果，突出图像中的重要信息，或者将图像转换为更适合人或机器分析处理的形式。在实际应用中，图像增强技术广泛应用于医学影像、遥感图像、安防监控等领域。本文将详细介绍常用的图像增强算法原理，并给出基于OpenCVC++库的实现代码。二、图像增强算法分类图像增强算法可以分为空间域增强和频域增强两大类。空间域增强是直接对图像的像素值进行操
【OpenCV C++】存图，如何以时间命名，“年月日-时分秒“产生唯一的文件名呢？“年月日-时分秒-毫秒“ 自动检查存储目录，若不存在自动创建存图 R-G-B OpenCV C++C/C++opencv c++人工智能
文章目录1生成文件名（格式:"年月日-时分秒"格式）2生成文件名（格式:"年月日-时分秒-毫秒"）3多模式存图函数4综合调用实例5注意：默认参数只能在头文件中定义，不能在实现中重复默认参数mode==1→“年月日-时分”→YYYYMMDD-HHMM的文件名；例如：20250310-1647mode==2→"年月日-时分秒-毫秒"→YYYYMMDD-HHMMSS-MMM（适用采集存储帧率搞得图片，增
C++：const和constexpr两个关键字壹十壹 C++c++
在C++中，constexpr和const是两个关键字，用于定义常量，但它们有不同的语义和用途。以下是它们的详细对比和示例：1.const含义：表示变量是只读的，其值在程序运行期间不能被修改。初始化：可以在运行时（run-time）进行初始化。用法：通常用于修饰变量、函数参数或返回值。不能保证变量在编译期求值。示例constintx=10;//编译时常量inty=20;constintz=y;//
HarmonyNext实战：基于ArkTS的高性能音视频播放器开发 harmonyos-next
HarmonyNext实战：基于ArkTS的高性能音视频播放器开发引言在HarmonyNext生态系统中，音视频播放是一个复杂且具有挑战性的领域。本文将深入探讨如何利用ArkTS语言开发一个高性能的音视频播放器，涵盖从基础播放功能到高级控制与优化的完整流程。我们将通过一个实战案例，详细讲解如何实现一个支持多种格式、流畅播放的音视频播放器，并确保其性能优化。1.环境准备与项目初始化首先，确保你的开发
Yarn：包管理优化与工作空间的最佳实践
在现代前端开发中，包管理工具是不可或缺的工具之一。Yarn作为一个快速、可靠且安全的包管理工具，相对于npm，提供了一些独特的功能和优化，尤其是在工作空间管理和性能优化方面尤为突出。本文将深入探讨Yarn的专业使用，包括其工作空间的强大功能、性能优化技术以及在大型项目中的最佳实践。Yarn简介Yarn是由Facebook开发的一个JavaScript包管理工具，它旨在解决npm的一些关键问题，如安
qt c++线程中的同步和异步我要进步！ qt c++
一、线程同步用于协调多个线程对共享资源的访问，避免竞态条件。常用工具：QMutex（互斥锁）保护临界区，确保一次仅一个线程访问资源。QMutexmutex;intsharedData=0;voidThread::run(){mutex.lock();sharedData++;//安全操作mutex.unlock();}QMutexLocker自动管理锁生命周期：{QMutexLockerlocke
有趣的学习Python-第十篇：Python的“魔法宝库”：标准库之旅王盼达有趣的学习Python 学习 python 开发语言
Python不仅是一门强大的编程语言，更像是一座充满宝藏的“魔法宝库”，里面装满了各种各样的“魔法工具”（标准库）。这些“魔法工具”可以帮助你轻松地完成各种任务，从文件操作到网络编程，从数据处理到性能优化。接下来，让我们一起探索Python的“魔法宝库”，看看这些“魔法工具”到底有多神奇！10.1操作系统接口：与“魔法世界”互动os模块就像是一个“魔法接口”，可以帮助你与操作系统进行互动。你可以用
C++ time(0)函数宁玉AC c学习
time(0)函数返回当前格林尼治标准时间与格林尼治标准时间1970年0分0秒的时间间隔。头文件#include//问题：得到当前时间。#include#includeusingnamespacestd;intmain(){inttotalSeconds=time(0);intcurrentSeconds=totalSeconds%60;inttotalMinutes=totalSeconds/6
C++随机数宁玉AC c学习 c++开发语言
目录一、名著参考二、详解1.rand()函数2.time(0)3.srand(time(0))4.获取指定范围内的随机数（含指定位数）一、名著参考可以使用cstdlib头文件中的rand()函数来获得随机整数；这个函数返回0~RAND_MAX之间的随机整数；rand()函数生成的是伪随机数。即每次在同一个系统上执行这个函数的时候，rand()函数生成同一序列的数。rand()函数的算法使用一个叫种
C++11之列表初始化 Octopus2077 c++学习笔记
发展历史C++11是C++的第⼆个主要版本，并且是从C++98起的最重要更新。它引⼊了⼤量更改，标准化了既有实践，并改进了对C++程序员可⽤的抽象。在它最终由ISO在2011年8⽉12⽇采纳前，⼈们曾使⽤名称“C++0x”，因为它曾被期待在2010年之前发布。C++03与C++11期间花了8年时间，故⽽这是迄今为⽌最⻓的版本间隔。从那时起，C++有规律地每3年更新⼀次。列表初始化（注意区分列表初始
基于HarmonyNext的ArkTS高级实战：构建高性能跨平台应用 harmonyos-next
基于HarmonyNext的ArkTS高级实战：构建高性能跨平台应用引言随着HarmonyOSNext的发布，ArkTS作为其核心开发语言，为开发者提供了更强大的工具和更高效的开发体验。ArkTS基于TypeScript，结合了HarmonyOS的分布式能力，使得开发者能够轻松构建高性能、跨平台的应用。本文将深入探讨如何使用ArkTS在HarmonyNext平台上进行高级开发，通过实战案例讲解如何
HarmonyNext实战：基于ArkTS的分布式数据同步应用开发 harmonyos-next
HarmonyNext实战：基于ArkTS的分布式数据同步应用开发引言在HarmonyNext生态系统中，分布式数据同步是一个核心特性，它允许设备之间无缝共享和同步数据。本文将深入探讨如何利用ArkTS语言开发一个高性能的分布式数据同步应用，涵盖从基础数据存储到跨设备同步的完整流程。我们将通过一个实战案例，详细讲解如何实现一个支持多设备数据同步的任务管理应用，并确保其性能优化。1.环境准备与项目初
MySQL进阶—— 视图（详解） 1加1等于 MySQL sql mysql
本文全面介绍Mysql视图相关的核心知识。包括介绍视图定义，基于查询结果的虚拟表，有简化查询、保障安全、解耦逻辑等作用。讲解创建、修改、删除视图的操作，以及及视图可更新条件、安全性控制及性能优化方法。本文目录一、视图的定义与作用定义作用二、视图的创建与管理创建视图修改视图方式1：覆盖原有视图方式2：ALTERVIEW删除视图三、视图两种算法MERGE（默认）TEMPTABLE四、视图的可更新性可更
基于llama_cpp 调用本地模型（llama）实现基本推理月光技术杂谈大模型初探 llama llama.cpp python LLM 集成显卡本地模型 AI
零基础实践本地推理模型基本应用：基于llama_cpp的本地模型调用。本文先安装llama_cpppython库，再编写程序，利用其调用llama-2-7b-chat.Q4_K_M.ggu模型。背景llama_cpp是一个基于C++的高性能库（llama.cpp）的Python绑定，支持在CPU或GPU上高效运行LLaMA及其衍生模型（如LLaMA2），并通过量化技术（如GGUF格式）优化内存使用
动态规划双剑合璧：C++与Python征服洛谷三大经典DP问题三流搬砖艺术家动态规划 c++python
动态规划核心思想状态定义→转移方程→边界处理→时空优化本文精选洛谷动态规划题单中三大经典问题，通过C++与Python双语言对比实现，彻底掌握DP精髓！题目一：P1048采药（01背包模板）题目描述在限定时间T内采集草药，每株草药有采集时间time[i]和价值value[i]，求最大总价值。解题思路状态定义：dp[j]表示时间j能获得的最大价值转移方程：dp[j]=max(dp[j],dp[j-t
C语言_数据结构总结7:顺序队列（循环队列） *.✧屠苏隐遥(ﾉ◕ヮ◕)ﾉ*.✧ C语言—数据结构数据结构 c语言开发语言算法 visual studio visualstudio
纯C语言实现，不涉及C++队列简称队，也是一种操作受限的线性表。只允许表的一端进行插入，表的另一端进行删除特性：先进先出针对顺序队列存在的“假溢出”问题，引出的循环队列概念。循环队列将顺序队列臆造为一个环状的空间，即把存储队列元素的表从逻辑上视为一个环。当队首指针Q->front=MaxSize-1后，再前进一个位置就自动到0，这可以利用除法取余运算（%）来实现。循环队列中的判空和判满条件分析：显
Apache Doris中都用了哪些开发语言，编译过程中用到了哪些编译器，以及用到了哪些成熟的技术框架 fzip Doris apache 开发语言
ApacheDoris作为一款高性能的实时分析型数据库，其技术栈涉及多语言开发、多种编译器支持以及多个成熟技术框架的集成。以下是综合多个来源的详细分析：一、开发语言Java•应用场景：主要用于开发Frontend（FE），负责元数据管理、查询解析、集群管理等模块。•关键模块：◦FE的元数据持久化通过BDBJE（BerkeleyDBJavaEdition）实现。◦MySQL协议兼容和HTTP服务分别
C++：入门详解（关于C与C++基本差别）梅茜Mercy c++c语言 java
目录一.C++的第一个程序二.命名空间（namespace）1.命名空间的定义与使用：（1）命名空间里可以定义变量，函数，结构体等多种类型（2）命名空间调用（：：）与展开（3）命名空间的嵌套（4）具体使用场景三.缺省参数1.基本定义：2.几个注意：四.函数重载1.定义与使用：五.引用1.定义：2.引用的特性：3.引用的使用（区别传值返回和传引用返回）：4.const引用：六.inline内联一.C
C++开源库大全大王算法 C/C++开发实战365 C++入门及项目实战宝典 c++开源
程序员要站在巨人的肩膀上，C++拥有丰富的开源库，这里包括：标准库、Web应用框架、人工智能、数据库、图片处理、机器学习、日志、代码分析等。标准库C++StandardLibrary：是一系列类和函数的集合，使用核心语言编写，也是C++ISO自身标准的一部分。
C++11使用mutex和condition_variable实现线程同步追烽少年x C++基础 c++
C++11使用mutex和condition_variable实现线程同步在实现项目的过程中，突然有一个问题：C++中A、B、C三个线程模拟购买100张车票，A输出99，B输出98，C输出97,然后又循环A输出96，B95,C94,直到0，使用线程同步，如何实现？这是一种按顺序执行线程的问题，应该实现？代码如下：#include#include#include#include#include//共
c++计算n的阶乘（用循环和递归） Absinthe_苦艾酒 c/c++c++算法数据结构
1.循环//计算阶乘#includeusingnamespacestd;intfct(int*p){intsum=1;while(*p>=2){sum*=((*p)--);}returnsum;}intmain(){cout>n;coutusingnamespacestd;//使用递归计算阶乘intfct(intn){if(n==1)return1;elsereturnn*fct(n-1);}in
树莓派-C++之异常 lalalaouhei c++开发语言后端
2021SC@SDUSCC++异常用官方的话来说就是程序在执行过程中产生的问题，换句通俗的话来讲就是程序执行的出现的异常，比如程序崩了、内存泄漏了、数组越界以及其他异常信息的出现，又如运行时耗尽了内存或遇到意外的非法输入。一个简单的例子就是尝试除以零的操作。异常存在于程序的正常功能之外，并要求程序立即处理。不能不处理异常，异常是足够重要的，使程序不能继续正常执行的事件。一、异常处理所谓“处理”，可
C++中map和set的详解 jiajia651304 c++算法开发语言
C++中map和set的介绍与使用一、map的介绍与使用二、set的介绍与使用三、总结在C++编程中，map和set是标准模板库（STL）中两种非常重要的关联容器。它们基于平衡二叉搜索树（通常是红黑树）的数据结构来实现，提供了高效的数据存储和检索功能。本文将详细介绍map和set的特点、用法以及一些常见的操作示例。一、map的介绍与使用1.map的基本概念map是一个键值对容器，其中每个键都是唯一
Qt基础之四十一：记一次QVector的bad alloc问题追踪草上爬 Qt那些事儿 qt QVector vector bad alloc
目录一.QVector的特点二.QVector的内存分配策略三.badalloc问题追踪一.QVector的特点QVector是Qt容器类库中的一个重要组成部分，它提供了类似于C++标准库中的std::vector的功能，但同时拥有Qt独特的优势。QVector是一个动态数组，支持添加、插入和删除元素。与其他容器相比，QVector在随机访问元素时具有出色的性能，同时在尾部添加和删除元素时依然高效
C++内存操纵的艺术 longdong7889 后端学习 c++java 开发语言
C++内存操纵的艺术在C++的混沌宇宙中，指针是打开时空裂缝的密钥。本文将以全新视角解构指针的本质，揭示从堆栈穿梭到多维空间映射的进阶技法，展示现代C++赋予指针的惊人可能性。一、指针本体论：内存的波粒二象性所有指针变量都是量子化的存在，既指向具体内存位置，又携带类型信息波。通过类型系统实验可验证其双重属性：templatevoidquantum_observer(T*ptr){std::cout
C++入门之容易忽视的namespace和函数重载不会的码 c++开发语言后端
目录命名空间命名空间的定义命名空间的用法1.直接把std整个展开2.对部分常用的展开3.指定命名空间缺省参数全缺省：（所有的参数都指定一个默认值）半缺省：(只有部分被参数指定默认值，而不是一半的参数)函数重载那么为什么C语言不支持函数重载，C++支持呢？extern"C"命名空间在C/C++中，变量、函数都是大量存在的，这些变量、函数的名称将都存在于全局作用域中，可能会导致很多冲突。使用命名空间的
C++内存管理秘籍：深入解析与实战代码示例 my1121716951 编程 c++java 开发语言
C++内存管理秘籍：深入解析与实战代码示例一、内存管理的基本概念二、内存泄漏与野指针三、智能指针：现代C++的内存管理利器四、实战代码示例示例1：传统动态内存管理示例2：使用`std::unique_ptr`示例3：使用`std::shared_ptr`五、总结在C++编程的世界里，内存管理是一项既基础又核心的技能。它直接关系到程序的性能、稳定性和可维护性。不同于一些高级语言自动管理内存的特性，C
C++之list删除元素 csdn_zhangchunfeng C++VS 技术管理索引列表 c++
C++之list删除元素对容器list存储的元素执行删除操作的时候，一般都是使用其成员函数实现的：（1）clear（）：删除list容器中的所有元素（2）remove（value）：删除容器中所有为value的元素（3）remove_if（）：删除容器中满足条件的元素（4）unique（）：删除容器中相邻的重复元素，只留下一个（5）erase（）：删除list容器中指定位置处的元素，也可以删除容器
【C++基础学习笔记】C++的输入输出流及缺省参数大家好我叫张同学深入浅出学习C++c++
我要做一个好奇宝宝，带着疑问来阅读，哼~C++如何进行输入输出？和C语言何有区别？C++的缺省参数是什么？如何理解和掌握？文章目录C++的输入&输出缺省参数缺省参数的概念缺省参数的分类1.全缺省参数2.半缺省参数：C++的输入&输出婴儿降生到这个世界上时，会以自己独特的方式向这个崭新的世界打招呼。跟新生婴儿类似，C++语言刚出来后，也算是一个新事物，作为一门新的编程语言也会有自己问候这个美好世界的
C++之string类讨厌下雨的天空 c++
1.string类的重要性：C语言中，字符串是以“\0”结尾的一些字符的集合，为了操作方便，C标准库中提供了一些str系列的库函数，但是这些库函数与字符串是分离开的，不太符合OPP的思想，而且底层空间需要用户自行管理，稍不留神可能会越界访问。string是一个对象，使用字符的顺序表实现的，就是一个字符顺序表。基本构造：classstring{private:size_tsize;size_tcap
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl