wuhui_gdnt

优化C++软件(8)

8.2. 不同编译器的比较

我在7个不同品牌的C++编译器上进行了一系列实验，看它们是否能够进行各种优化。结果汇总在表8.1中。这个表展示了在我的测试例子中，不同的编译器是否成功应用了各种优化方法以及代数约简。

这个表可以给出哪些优化你可以预期一个特定的编译器会进行，哪些优化你必须手动进行的某些预示。

必须强调，在不同的测试例子上，编译器行为会不同。你不能预期编译器的行为总是符合这个表。

优化方法	Microsoft	Borland	Intel	Gnu	PathScale	PGI	Digital Mars	Watcom	Codeplay
函数内联	x	-	x	x	x	x	-	-	x
常量折叠	x	x	x	x	x	x	x	x	x
常量传播	x	-	x	x	x	x	-	-	x
指针消除	x	x	x	x	x	x	x	x	x

公共子表达式消除，整形	x	(x)	x	x	x	x	x	x	x
公共子表达式消除，浮点	x	-	x	x	x	x	-	x	x
寄存器变量，整形	x	x	x	x	x	x	x	x	x
寄存器变量，浮点	x	-	x	x	x	x	-	x	x
生命期分析	x	x	x	x	x	x	x	x	x
合并相同的分支	x	-	-	x	-	-	-	x	-
消除跳转	x	x	x	x	x	x	-	x	x
消除分支	x	-	x	x	x	x	-	-	-
删除总是true/false的分支	x	-	x	x	x	x	x	x	x
循环展开	x	-	x	x	x	x	-	-	x
循环不变代码移动	x	-	x	x	x	x	x	x	x
数组元素归纳变量	x	x	x	x	x	x	x	x	x
其他整型表达式归纳变量	x	-	x	x	x	-	x	x	x
浮点表达式归纳变量	-	-	-	-	-	-	-	-	-
自动向量化	-	-	x	x	x	x	-	-	x
去虚拟化	-	-	-	x	-	-	-	-	-
分析指引（profile-guided）优化	x	-	x	x	x	x	-	-	-
整体程序优化	x	-	x	x	x	-	-	-	-

整形代数约简：
a+b = b+a	x	(x)	x	x	x	x	-	x	x
ab = ba	x	(x)	x	x	x	x	-	x	x
(a+b)+c = a+(b+c)	x	-	x	x	-	-	x	x	-
a+b+c = c+b+a	x	-	-	x	-	-	-	-	-
a+b+c+d = (a+b)+(c+d)	-	-	x	x	-	-	-	-	-
ab+ac = a*(b+c)	x	-	x	x	x	-	-	-	x
axxx + bxx + cx + d = ((ax+b)x+c)*x+d	x	-	x	x	x	-	-	-	x
xxxxxxx*x = ((x2) 2) 2	-	-	x	-	-	-	-	-	-
a+a+a+a = a*4	x	-	x	x	-	-	-	-	x
-(-a) = a	x	-	x	x	x	x	x	x	-
a-(-b) = a+b	x	-	x	x	x	x	-	x	-
a-a = 0	x	-	x	x	x	x	x	x	x
a+0 = a	x	x	x	x	x	x	x	x	x
a*0 = 0	x	x	x	x	x	x	x	-	x
a*1 = a	x	x	x	x	x	x	x	x	x
(-a)(-b) = ab	x	-	x	x	x	-	-	-	-
a/a = 1	-	-	-	-	x	-	-	-	x
a/1 = a	x	x	x	x	x	x	x	x	x
0/a = 0	-	-	-	x	-	-	-	x	x
(-a == -b) = (a == b)	-	-	-	x	x	-	-	-	-
(a+c == b+c) = (a == b)	-	-	-	-	x	-	-	-	-
!(a < b) = (a >= b)	x	x	x	x	x	x	x	x	x
(a	-	-	-	-	-	-	-	-	-
乘以常量 = 偏移与加法	x	x	x	x	-	x	x	x	-
除以常量 = 乘法与偏移	x	-	x	x	x	(-)	x	-	-

浮点代数约简：
a+b = b+a	x	-	x	x	x	x	-	-	x
ab = ba	x	-	x	x	x	x	-	-	x
a+b+c = a+(b+c)	x	-	x	x	-	-	-	-	-
(a+b)+c = a+(b+c)	-	-	x	x	-	-	-	-	-
abc = a(bc)	x	-	-	x	-	-	-	-	-
a+b+c+d = (a+b)+(c+d)	-	-	-	x	-	-	-	-	-
ab+ac = a*(b+c)	x	-	-	-	x	-	-	-	x
axxx + bxx + cx + d = ((ax+b)x+c)*x+d	x	-	x	x	x	-	-	-	-
xxxxxxx*x = ((x2) 2) 2	-	-	-	x	-	-	-	-	-
a+a+a+a = a*4	x	-	-	x	x	-	-	-	-
-(-a) = a	-	-	x	x	x	x	x	x	-
a-(-b) = a+b	-	-	-	x	x	x	-	x	-
a+0 = a	x	-	x	x	x	x	x	x	-
a*0 = 0	-	-	x	x	x	x	-	x	x
a*1 = a	x	-	x	x	x	x	x	-	x
(-a)(-b) = ab	-	-	-	x	x	x	-	-	-
a/a = 1	-	-	-	-	-	-	-	-	x
a/1 = a	x	-	x	x	x	-	x	-	-
0/a = 0	-	-	-	x	x	-	-	x	x
(-a == -b) = (a == b)	-	-	-	x	x	-	-	-	-
(-a > -b) = (a < b)	-	-	-	x	x	-	-	-	x
除以常量 = 乘以倒数	x	x	-	x	x	-	-	x	-

布尔代数约简：
!(!a) = a	x	-	x	x	x	x	x	x	x
(a&&b) \|\| (a&&c) = a&&(b\|\|c)	x	-	x	x	x	-	-	-	-
!a && !b = !(a \|\| b)	x	x	x	x	x	x	x	x	x
a && !a = false, a \|\| !a = true	x	-	x	x	x	x	-	-	-
a && true = a, a \|\| false = a	x	x	x	x	x	x	x	x	-
a && false = false, a \|\| true = true	x	-	x	x	x	x	x	x	-
a && a = a	x	-	x	x	x	x	-	-	-
(a&&b) \|\| (a&&!b) = a	x	-	-	x	x	-	-	-	-
(a&&b) \|\| (!a&&c) = a ? b : c	x	-	x	x	-	-	-	-	-
(a&&b) \|\| (!a&&c) \|\| (b&&c) = a ? b : c	x	-	-	x	-	-	-	-	-
(a&&b) \|\| (a&&b&&c) = a&&b	x	-	-	x	x	-	-	-	-
(a&&b) \|\| (a&&c) \|\| (a&&b&&c) = a&&(b\|\|c)	x	-	-	x	x	-	-	-	-
(a&&!b) \|\| (!a&&b) = a XOR b	-	-	-	-	-	-	-	-	-

比特向量代数约简：
~(~a) = a	x	-	x	x	x	x	x	-	-
(a&b)\|(a&c) = a&(b\|c)	x	-	x	x	x	x	-	-	x
(a\|b)&(a\|c) = a\|(b&c)	x	-	x	x	x	x	-	-	x
~a & ~b = ~(a \| b)	-	-	x	x	x	x	-	-	-
a & a = a	x	-	-	x	x	x	-	-	x
a & ~a = 0	-	-	x	x	x	x	-	-	-
a & -1 = a, a \| 0 = a	x	-	x	x	x	x	x	x	x
a & 0 = 0, a \| -1 = -1	x	-	x	x	x	x	x	x	x
(a&b) \| (~a&c) \| (b&c) = (a&b) \| (~a&c)	-	-	-	-	-	-	-	-	-
a&b&c&d = (a&b)&(c&d)	-	-	-	x	-	-	-	-	-
a ^ 0 = a	x	x	x	x	x	-	x	x	x
a ^ -1 = ~a	x	-	x	x	x	-	x	x	-
a ^ a = 0	x	-	x	x	x	x	-	x	x
a ^ ~a = -1	-	-	-	x	x	x	-	-	-
(a&~b) \| (~a&b) = a ^ b	-	-	-	-	-	-	-	-	-
~a ^ ~b = a ^ b	-	-	-	x	x	-	-	-	-
a<	x	-	x	x	x	-	-	x	x

整形XMM（向量）约简：
公共子表达式消除	x	n.a.	x	x	x	-	n.a.	n.a.	x
常量折叠	-	n.a.	-	x	-	-	n.a.	n.a.	-
a+b = b+a, ab = ba	-	n.a.	-	x	-	-	n.a.	n.a.	x
(a+b)+c = a+(b+c)	-	n.a.	-	-	-	-	n.a.	n.a.	-
ab+ac = a*(b+c)	-	n.a.	-	-	-	-	n.a.	n.a.	-
xxxxxxx*x = ((x2) 2) 2	-	n.a.	-	-	-	-	n.a.	n.a.	-
a+a+a+a = a*4	-	n.a.	-	-	-	-	n.a.	n.a.	-
-(-a) = a	-	n.a.	-	-	-	-	n.a.	n.a.	-
a-a = 0	-	n.a.	x	-	-	-	n.a.	n.a.	-
a+0 = a	-	n.a.	-	-	-	-	n.a.	n.a.	-
a*0 = 0	-	n.a.	-	x	-	-	n.a.	n.a.	-
a*1 = a	-	n.a.	-	x	-	-	n.a.	n.a.	-
(-a)(-b) = ab	-	n.a.	-	-	-	-	n.a.	n.a.	-
!(a < b) = (a >= b)	-	n.a.	-	-	-	-	n.a.	n.a.	-

浮点XMM（向量）：
a+b = b+a, ab = ba	x	n.a.	-	x	-	-	n.a.	n.a.	x
a+b+c = a+(b+c)	-	n.a.	-	-	-	-	n.a.	n.a.	-
ab+ac = a*(b+c)	-	n.a.	-	-	-	-	n.a.	n.a.	-
-(-a) = a	-	n.a.	-	-	-	-	n.a.	n.a.	-
a-a = 0	-	n.a.	-	x	-	-	n.a.	n.a.	-
a+0 = a	-	n.a.	x	-	-	-	n.a.	n.a.	-
a*0 = 0	-	n.a.	x	-	-	-	n.a.	n.a.	-
a*1 = a	-	n.a.	-	x	-	-	n.a.	n.a.	-
a/1 = a	-	n.a.	-	x	-	-	n.a.	n.a.	-
0/a = 0	-	n.a.	x	x	-	-	n.a.	n.a.	-
除以常量 = 乘以倒数	-	n.a.	-	-	-	-	n.a.	n.a.	-

布尔XMM（向量）约简：
~(~a) = a	-	n.a.	-	-	-	-	n.a.	n.a.	-
(a&b)\|(a&c) = a&(b\|c)	-	n.a.	-	-	-	-	n.a.	n.a.	-
a & a = a, a \| a = a	-	n.a.	x	x	-	-	n.a.	n.a.	-
a & ~a = 0	-	n.a.	-	x	-	-	n.a.	n.a.	-
a & -1 = a, a \| 0 = a	-	n.a.	-	-	-	-	n.a.	n.a.	-
a & 0 = 0	-	n.a.	-	x	-	-	n.a.	n.a.	-
a \| -1 = -1	-	n.a.	-	-	-	-	n.a.	n.a.	-
a ^ a = 0	-	n.a.	x	x	-	-	n.a.	n.a.	-
andnot(a,a) = 0	-	n.a.	-	x	-	-	n.a.	n.a.	-
a<	-	n.a.	-	-	-	-	n.a.	n.a.	-
表8.1. 不同C++编译器里优化的比较测试在打开所有相关优化选项时进行，包括放松浮点精度。测试了以下编译器版本： Microsoft C++ Compiler v. 14.00 for 80x86 / x64 (Visual Studio 2005). Borland C++ 5.82 (Embarcadero/CodeGear/Borland C++ Builder 5, 2009). Intel C++ Compiler v. 11.1 for IA-32/Intel64, 2009. Gnu C++ v. 4.1.0, 2006 (Red Hat). PathScale C++ v. 3.1, 2007. PGI C++ v. 7.1-4, 2008. Digital Mars Compiler v. 8.42n, 2004. Open Watcom C/C++ v. 1.4, 2005. Codeplay VectorC v. 2.1.7, 2004. 对Microsoft、Intel、Gnu与PathScale编译器，对32位与64位代码没有观察到优化能力间的差异

8.3. 编译器优化的障碍

有几个因素会阻止编译器进行我们希望它做的优化。程序员知道这些障碍并知道如何避免它们是重要的。优化的某些重要的障碍讨论如下。

不能跨模块优化

编译器没有除正在编译模块以外其他模块中的函数信息。这阻止了跨函数调用的优化。如：

// Example 8.20

module1.cpp

int Func1(int x) {

return x*x + 1;

}

module2.cpp

int Func2() {

int a = Func1(2);

...

}

如果Func1与Func2在相同的模块中，编译器能够进行函数内联与常量传播，并约简为常量5。但在编译module2.cpp时，编译器没有Func1的必要信息。

解决这个问题最简单的方法是通过#include指示，将多个.cpp模块合并为一个。这确定在所有的编译器上都能工作。某些编译器有称为整体程序优化的特性，它将启用跨模块优化（参考第82页）。

指针别名

当通过指针或引用访问变量时，编译器不能完全排除指向的变量与代码中其他某个变量相同的可能性。例子：

// Example 8.21

void Func1 (int a[], int * p) {

int i;

for (i = 0; i < 100; i++) {

a[i] = *p + 2;

}

void Func2() {

int list[100];

Func1(list, &list[8]);

}

这里，重新载入*p并计算*p+2一百次是必须的，因为p指向的值与a[]中在循环期间改变的其中一个元素相同。不允许假设*p+2是可以移出循环的循环不变代码。例子8.21确实是一个非常做作的例子，但要点是编译器不能排除理论上这样做作例子存在的可能性。因此，编译器被阻止假设*p+2是可以移出循环的循环不变表达式。

大多数编译器有用于假设没有指针别名的选项（/Oa）。克服可能指针别名障碍最简单的方法是关闭这个选项。这要求你仔细分析代码中所有指针与引用，确保在代码的同一部分没有多种方式访问变量或对象。如果编译器支持，通过使用关键字__restrict或__restrict__，告诉编译器一个特定指针不会有别名也是可能的。

我们不能确定编译器会采纳没有指针别名的暗示。确保代码被优化的仅有方式是显式进行。在例子8.21中，你可以计算*p+2，把它保存在循环外的一个临时变量中，如果你确定该指针不是数组中任何元素的别名。这个方法要求你可以预测优化的障碍的哪里。

动态内存分配

任何动态分配（使用new或malloc）的数组或对象必须通过指针访问。对程序员来说，指向不同动态分配对象的指针不会重叠或互为别名是显而易见的，但编译器通常不能看到这。它也阻止编译器最优地对齐数据，或知道对象是对齐的。最好在需要它们的函数里声明对象及固定大小的数组。

纯函数

纯函数是没有副作用，返回值仅依赖其实参值的函数。这紧密遵循“函数”的数学概念。

以相同实参多次调用一个纯函数肯定产生相同的结果。编译器可以消除包含纯函数的公共子表达式，并且可以移出包含纯函数调用的循环不变代码。不幸的是，编译器不能知道一个函数是纯函数，如果它定义在另一个模块或函数库里。

因此，在涉及纯函数调用时，手动进行比如公共子表达式消除、常量传播及循环不变代码移动的优化，是必须的。

用于Linux的Gnu编译器及Intel编译器有可应用于函数原型的一个属性，告诉编译器这是一个纯函数。例子：

// Example 8.22

#ifdef __GNUC__

#define pure_function __attribute__((const))

#else

#define pure_function

#endif

double Func1(double) pure_function ;

double Func2(double x) {

return Func1(x) * Func1(x) + 1.;

}

这里，Gnu编译器将仅对Func1进行一次调用，而其他编译器将进行两次。

其他某些编译器（Microsoft，Intel）知道标准库函数，像sqrt、pow与log是纯函数，但不幸的是，没有办法告诉这些编译器一个用户定义函数是纯函数。

虚函数与函数指针

编译器很少能确定地预测将调用虚函数的哪个版本，或者函数指针指向哪个函数。因此，它不能内联这个函数，或者跨函数调用优化。

代数约简

大多数编译器可以进行简单的代数约简，比如-(-a) = a，但它们不能进行更复杂的约简，代数约简是一个很难在编译器中实现的复杂过程。

由于数学纯粹性的原因，许多代数约简不被允许。在许多情形里，构造模糊的例子，其中约简会导致溢出或精度损失，特别在浮点表达式中，是可能的（参考第59页）。编译器不能排除一个特定约简在一个特定情形下无效的可能性，但程序员可以。因此，在许多情形里，显式进行代数约简是必须的。

整形表达式不那么容易受溢出以及精度损失的影响，原因在第70页解释。因此，对编译器，在整形表达式上，比在浮点表达式上，进行更多约简是可能的。大多数涉及整数加法、减法及乘法的约简是被允许的，而许多涉及除法与关系操作符（如>）的约简，出于数学纯粹性的原因，不被允许。例如，编译器不能将整形表达式-a > -b约简为a < b，因为溢出非常不确定的可能性。

表8.1（第62页）展示了编译器能够进行哪些约简，至少在某些情形里，以及不能执行哪些约简。所有编译器不能进行的约简必须由程序员手动进行。

浮点归纳变量

编译器不能制作浮点归纳变量，与它们不能在浮点表达式上进行代数约简的原因相同，因此，手动进行是必要的。一旦一个循环计数器函数可以根据之前值更高效计算时，这个原则是有用的。任何是循环计数器n阶多项式的表达式可以通过n个加法计算，没有乘法。下面的例子展示了用于二阶多项式的原则：

// Example 8.23a. Loop to make table of polynomial

const double A = 1.1, B = 2.2, C = 3.3; // Polynomial coefficients

double Table[100]; // Table

int x; // Loop counter

for (x = 0; x < 100; x++) {

Table[x] = A*x*x + B*x + C; // Calculate polynomial

}

这个多项式的计算可以通过使用两个归纳变量的两次加法来完成：

// Example 8.23b. Calculate polynomial with induction variables

const double A = 1.1, B = 2.2, C = 3.3; // Polynomial coefficients

double Table[100]; // Table

int x; // Loop counter

const double A2 = A + A; // = 2*A

double Y = C; // = A*x*x + B*x + C

double Z = A + B; // = Delta Y

for (x = 0; x < 100; x++) {

Table[x] = Y; // Store result

Y += Z; // Update induction variable Y

Z += A2; // Update induction variable Z

}

例子8.23b中的循环有两个循环携带依赖链，即是两个归纳变量Y与Z。每条依赖链有与浮点加法相同的时延。小到足以支持这个方法。更长的循环依赖链将使得归纳变量不再有利，除非该值从一个两个或更多迭代以前的值计算。

归纳变量的方法也可以向量化，如果考虑到从序列里r个位置之前的值计算每个值，其中r是向量中元素个数或者循环展开因子。在每个情形里，找出正确的公式要求一点数学。

具有非内联拷贝的内联函数

函数内联有相同的函数可以从另一个模块调用的复杂性。因为函数也可以从另一个模块调用的可能性，编译器必须制作内联函数的一个非内联拷贝。如果没有其他模块调用这个函数，这个非内联拷贝是死代码。这个代码片段使得缓冲效率下降。

围绕这个问题有各种方法。如果没有从其他模块援引一个函数，那么向这个函数声明添加关键字static。这告诉编译器这个函数不能被其他模块调用。Static声明使得编译器评估内联这个函数是否最优更容易，并且它阻止编译器制作一个不使用的内联函数拷贝。Static关键字也使得其他优化成为可能，因为编译器不需要遵守用于其他模块不可访问函数的任何特定的调用惯例。你可以对使用本地非成员函数添加static关键字。

不幸的是，这个方法对类成员函数不奏效，因为static关键字对成员函数有不同的含义。你可以通过在类定义中声明函数体，迫使内联成员函数。这将阻止编译器制作该函数的一个非内联拷贝，但它有该函数总是被内联，即使这样做不是最优的缺点（即，如果成员函数大且从许多不同地方调用）。

某些编译器有允许链接器删除未定义函数的选项（Windows：/Gy，Linux：-ffunction-sections）。建议打开这个选项。

8.4. CPU优化的障碍

现代CPU通过乱序执行指令，可以进行大量的优化。代码中的长依赖链阻止了CPU进行乱序执行，如第14页所述。避免长依赖链，特别是长时延的循环携带依赖链。

你可能感兴趣的:(Agner,Fog编写的优化手册)

自然语言处理（5）—— 中文分词隐私无忧人工智能 #自然语言处理自然语言处理中文分词人工智能
中文分词的基本原理及实现1.什么是词2.基本原理3.发展趋势：多数场景无需显式分词信息处理的目标是使用计算机能够理解和产生自然语言。而自然语言理解和产生的前提是对语言能够做出全面的解析。汉语词汇是语言中能够独立运用的最小的语言单位，是语言中的原子结构。由于中文缺乏类似英文的空格分隔，分词的准确性直接影响后续任务（如机器翻译、情感分析）的效果。因此，对中文进行分词就显得至关重要。中文分词（Chine
二十二.基于国民MCU 的COMP模块的比较案例悟空胆好小国民MCU mcu 单片机 stm32
二十二.基于国民MCU的COMP模块的比较案例文章目录二十二.基于国民MCU的COMP模块的比较案例0.总体功能概述1.相关开发环境2.比较器介绍2.1比较器应用之窗口模式2.2比较器应用之独立比较，生成打断信号生成2.3比较器应用之独立比较，BLANK特性3.COMP硬件独立比较案例3.1比较器输入VREF硬件连接3.2配置COMP4.总结5.参考5.参考0.总体功能概述2、端口配置：PB10选
DMDDM文档数据库学习分享合作愉快：）数据库学习
达梦新云文档数据库（简称DMDDM），是一款由达梦公司独立研发的分布式原生文档数据库产品。一、关键特性1、高性能、高可用性：DMDDM文档数据库支持快速的数据读写操作，能够满足高性能应用的需求。支持主备集群和分布式集群部署方式，单个节点故障不影响整个系统的正常运行。提供DDM-Meta、DDM-Store和DDM-Engine三个核心组件，分别负责存储数据库元数据和集群调度、存储实际的数据库数据以
数据同步基本原理及工作机制合作愉快：）数据库网络 oracle
一、数据同步的基本原理数据同步的基本原理是将源数据和目标数据进行比较，并将差异部分进行复制或更新，以达到数据一致性的目的。这个过程通常涉及以下关键步骤：数据的识别：首先需要确定哪些数据需要进行同步，以及源数据和目标数据的对应关系。这是数据同步的起点，也是确保数据准确性和一致性的基础。数据的复制：在确定了需要同步的数据后，接下来就是将源数据复制到目标位置。这个过程中，可以使用增量复制、全量复制或增量
jmeter中，上传文件的MIME类型小han的日常 jmeter jmeter
‌text/plain‌：用于纯文本文件，如.txt文件。‌text/html‌：用于HTML文档，即.html文件。‌application/msword‌：MicrosoftWord文档，即.doc和.docx文件。‌image/jpeg‌：JPEG图像，对应.jpg和.jpeg文件。‌image/png‌：PNG图像，对应.png文件。‌image/gif‌：GIF图像，对应.gif文件。‌
DM-密码含有特殊字符的登录方法合作愉快：）数据库
1.操作系统1.1WINDOWS系统（1）disql的关键字符，disql的要求对连接串的特殊字符需要使用双引号括起来”aaaa/aaaa”,操作系统的要求需要再在最外加双引号和转义”””aaaa/aaaa”””。例如：用户名为user01，密码为aaaa/aaaa，那么连接串要写成：disqluser01/”””aaaa/aaaa”””。（2）空格，需要使用双引号括起来作为一个整体（这是操作系统
基于QScriptEngine的简单解释器有追求的菜鸟 qt 解释器模式
需求：voidDataFormatPipline::DataFormatPipline(QMapdata,QStringListtarger){}data中保存元素数据，类似Fe-1.2,Cu-2.4，Mn3.5,QStringList中的为Fe/Cu，Fe/Cu-Mn，Fe*Cu+Mn，如何利用解释器或者其它简单的方法完成这个需求？解决方案：现在项目中添加scriptQT+=corescript
Qt上位机编程命名规范-执行版有追求的菜鸟 qt 开发语言
主要规范原则参考Qt上位机编程命名规范。1.文件/文件夹大小写分析考虑跨平台性，全小写是一种约定俗成的风格，在许多大型开源项目中（如Linux内核、Python标准库）被广泛使用。1.1.配合文件扩展名通常文件名小写配合小写扩展名（如.h,.cpp,.json），使整体风格统一：main.cppconfig.jsonutils.h1.2.文件夹和pri文件命名通常小写、下划线分开：control_
nginx性能优化及使用方面技巧智慧源点 nginx 性能优化 linux
优化Nginx进程数量配置参数如下：代码语言：javascript复制worker_processes1;#指定Nginx要开启的进程数，结尾的数字就是进程的个数，可以为auto这个参数调整的是Nginx服务的worker进程数，Nginx有Master进程和worker进程之分，Master为管理进程、真正接待“顾客”的是worker进程。进程个数的策略：worker进程数可以设置为等于CPU的
如何使用多向量检索文档 scaFHIO 服务器 linux 运维 python
在现代信息检索系统中，使用多个向量来检索单个文档是一个非常有用的技术。这种方法在多个应用场景中都有其优势，比如可以将文档分割为多个块，对这些块分别进行嵌入，从而提高语义检索的准确性。LangChain提供了一个baseMultiVectorRetriever类，为我们简化了这一过程。本文将详细讲解如何生成这些向量，并使用MultiVectorRetriever进行检索。1.技术背景介绍在信息检索中
CUDA 学习(3)——CUDA 初步实践哦豁灬 CUDA 学习笔记学习 CUDA
1定位threadCUDA中提供了blockIdx,threadIdx,blockDim,GridDim来定位发起thread，下面发起1个grid，里面有2个block，每个block里有5个threads。程序让每个thread输出自己的id号:#include__global__voidprint_id(){intid=blockDim.x*blockIdx.x+threadIdx.x;pr
Deepseek API 调用哦豁灬 LLM 深度学习生产工具 deepseek LLM API 大模型
1获取APIKey目前比较知名的提供了DeepSeek的推理服务商包括硅基流动、阿里云、腾讯云等等。这些推理服务商一般是提供API接口，需要安装大模型客户端并配置API。获取API密钥，以硅基流动为例：前往硅基流动官方网站（https://cloud.siliconflow.cn）注册账号。在账户管理的API密钥中点击新建API密钥并复制。安装一个本地的第三方大模型客户并配置，常见的包括Chatb
vLLM 部署大模型哦豁灬深度学习 LLM 人工智能 vLLM 大模型部署 LLM
1介绍vLLM是来自UCBerkeley的LMSYS在LLM推理方面的最新工作（没错就是搞出Vicuna的那个group），最大亮点是采用PagedAttention技术，结合ContinuousBatching，极大地优化了realtime场景下的LLMserving的throughput与内存使用。vllmgithub仓库1.1安装安装命令：pip3installvllm#vllm==0.2.
通过Bokeh实现大规模数据可视化的最佳实践【从静态图表到实时更新】步入烟尘算法指南信息可视化 Bokeh python
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
keil5 编译程序出现错误Error: L6411E: No compatible library exists with a definition of startup symbol __main 毛毛虫的爹 HI3531
Error:L6411E:Nocompatiblelibraryexistswithadefinitionofstartupsymbol__main.之前装过ADS，ADS与MDK冲突，依据网友提供的资料，最终的解决办法如下
达梦数据库学习笔记 lwq979991632 数据库
达梦数据库学习资料一、操作系统安装1、配置信息CPU：4核心内存：4G网络：NAT2.安装包选择选择带GUI的服务器，勾选Java平台、KDE二、安装前准备1.数据库远程访问：关闭防火墙systemctlstopfirewalld（禁用）systemctldisablefirewalld(停止，关闭开机自启动)systemctlstatusfirewalld（查看状态）2.安装gcc包rpm-qa
轻松帮你搞清楚Python爬虫数据可视化的流程 liuhaoran___ python
Python爬虫数据可视化的流程主要是通过网络爬取所需的数据，并利用相关的库将数据分析结果以图形化的方式展示出来，帮助用户更直观地理解数据背后的信息。Python爬虫+数据可视化步骤1.获取目标网站的数据使用`requests`或者`selenium`库从网页上抓取信息。对于动态加载内容的页面可以考虑结合JavaScript渲染引擎。2.解析HTML内容提取有用信息常见工具如BeautifulSo
找不到Jmeter历史版本下载的同学看这里（内附使用阿里镜像和腾讯镜像下载开源软件的地址）测试开发Kevin jmeter 测试工具 jmeter
最近需要在jmeter4上验证一个问题，于是就在网上各种找jmeter不同版本的下载地址，比较麻烦。为了让大家不踩坑，在这里汇总一下下载地址：下载jmeter地址汇总jmeter最新版本官网下载地址：ApacheJMeter-DownloadApacheJMeterhttps://jmeter.apache.org/download_jmeter.cgijmeter历史版本下载地址（建议收藏）In
线代往事（1.2）为什么说如果AB=I，则BA=I？ duoyasong5907 数学(vip栏目)线性代数
参考mathstackexchange的回答。对于这句话：第一句话，首先由于III里的每个列向量都相互正交，所以I的值域是n维。而由于A
达梦数据库学习之旅不是，哥们~ 数据库学习
一、开篇：走进达梦数据库的世界在当今数字化浪潮汹涌澎湃的时代，数据已然成为企业乃至国家发展的核心驱动力，而数据库作为数据存储、管理与高效运用的关键基础设施，其重要性不言而喻。达梦数据库，作为国产数据库领域的璀璨明珠，正凭借其卓越性能、高度可靠性以及强大的自主可控特性，在金融、电信、政务等诸多关键行业崭露头角，逐步打破国外数据库产品长期以来的垄断格局。对于广大技术爱好者与从业者而言，深入学习达梦数据
利用Pinecone和Hybrid Search实现高效向量检索 dgay_hua python
在当今数据驱动的世界中，快速准确的信息检索变得尤为重要。Pinecone作为一个功能强大的向量数据库，提供了广泛的功能，包括HybridSearch。本文将详细介绍如何使用Pinecone和HybridSearch构建高效的信息检索系统。1.技术背景介绍Pinecone是专为高效向量检索设计的数据库，可以处理高维数据。HybridSearch结合了密集向量和稀疏向量检索的优势，在提高检索准确性的同
Midscene.js 简介有个人神神叨叨 javascript ai 人工智能
名称：Midscene.js口号：JoyfulAutomationbyAI（通过AI实现愉悦的自动化）官网：https://midscenejs.com/项目地址：https://github.com/web-infra-dev/midscene社区链接：Twitter：https://x.com/midscene_aiDiscord：https://discord.gg/2JyBHxszE4La
抖音视频数据获取实战：从API调用到热门内容挖掘爱搞技术的猫猫 API 音视频
在短视频流量为王的时代，掌握抖音热门视频数据已成为内容运营、竞品分析及营销决策的关键。本文将手把手教你通过抖音开放平台API获取视频详情数据，并提供完整的代码实现及商业化应用思路。一、抖音API权限申请与核心接口抖音API需企业资质认证，个人开发者权限受限。以下是接入流程：企业开发者认证•登录开放平台，选择注册，提交信息等材料。•完成认证后，创建应用（如“视频数据分析工具”），获取ClientKe
python使用Bokeh库实现实时数据的可视化 Oona_01 python 信息可视化数据分析
Python语言以其丰富的数据科学生态系统而闻名,其中Bokeh库作为一种功能强大的可视化工具,为实时数据的可视化提供了优秀的支持,本文将介绍如何使用Bokeh库实现实时数据的可视化,并提供相关代码实例,需要的朋友可以参考下使用Python的Bokeh库进行实时数据可视化的实现Bokeh简介实时数据可视化的需求使用Bokeh实现实时数据可视化的步骤代码示例Bokeh的进阶应用总结使用Python的
STM32F103C8T6点灯/流水灯（指定IO，正向反向） BDXiaotianYA stm32 嵌入式硬件单片机
参加2023年电赛后，到现在上班一年多，长达两年时间内，几乎没有再碰过单片机，由于现在工作中需要接触到一些代码，先退回来复习下32单片机。本人在此做一件事情，傻瓜式代码，让代码足够简洁，足够规范，让你复制我的代码百分百能够使用。此账号仅作为分享本人复习过程中记录使用，如果无法使用，或者或者有优化的地方，欢迎留言，看到后第一时间给予回复。有空会将2023激光打靶代码开源出来。在使用本程序的时候，默认
Python解决“特定数组的逆序拼接”问题啥都鼓捣的小yao 经典算法练习 python 算法开发语言
Python解决“特定数组的逆序拼接”问题问题描述测试样例解决思路代码问题描述小U得到了一个数字n，他的任务是构造一个特定数组。这个数组的构造规则是：对于每个i从1到n，将数字n到i逆序拼接，直到i等于n为止。最终，输出这个拼接后的数组。例如，当n等于3时，拼接后的数组是[3,2,1,3,2,3]。测试样例样例1：输入：n=3输出：[3,2,1,3,2,3]样例2：输入：n=4输出：[4,3,2,
【达梦数据库学习】数据库体系架构-逻辑结构理解合作愉快：）数据库数据库架构学习
1.1数据库和实例在有些情况下，数据库的概念包含的内容会很广泛。如在单独提到DM数据库时，可能指的是DM数据库产品，也有可能是正在运行的DM数据库实例，还可能是DM数据库运行中所需的一系列物理文件的集合等。但是，当同时出现DM数据库和实例时，DM数据库指的是磁盘上存放在DM数据库中的数据的集合，一般包括：数据文件、日志文件、控制文件以及临时数据文件等。实例一般是由一组正在运行的DM后台进程/线程以
Python用Bokeh处理大规模数据可视化的最佳实践一键难忘 Bokeh python 开发语言
用Bokeh处理大规模数据可视化的最佳实践在大规模数据处理和分析中，数据可视化是一个至关重要的环节。Bokeh是一个在Python生态中广泛使用的交互式数据可视化库，它具有强大的可扩展性和灵活性。本文将介绍如何使用Bokeh处理大规模数据可视化，并提供一些最佳实践和代码实例，帮助你高效地展示大数据集中的重要信息。1.为什么选择Bokeh？Bokeh是一个专为浏览器呈现而设计的可视化库，它支持高效渲
Python 爬虫实战：社交媒体品牌反馈数据抓取与舆情分析西攻城狮北 python 爬虫媒体
一、引言在当今数字化时代，社交媒体已成为公众表达意见、分享信息的重要渠道。品牌的声誉和市场表现往往受到消费者在社交平台上的反馈和评价的影响，因此品牌舆情分析变得至关重要。本文将介绍如何使用爬虫技术爬取社交媒体上的品牌反馈数据，并通过数据分析技术，分析品牌的舆情动态。二、环境准备在开始之前，确保你的开发环境已经安装了以下必要的Python库：requests:用于发送HTTP请求。beautiful
青少年编程与数学 02-011 MySQL数据库应用 09课题、规则、约束和默认值明月看潮生编程与数学第02阶段数据库青少年编程 mysql 编程与数学
青少年编程与数学02-011MySQL数据库应用09课题、规则、约束和默认值一、规则1.规则的概念2.规则的类型3.规则的定义和应用3.1创建表3.2定义规则3.3应用规则4.规则的管理和维护5.规则的性能影响6.其他相关概念二、规则应用示例（一）、检查约束（CHECKConstraints）示例1.限制年龄范围2.限制性别取值（二）、触发器（Triggers）示例1.自动记录日志2.防止非法删除
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST