oMengHen1

程序性能与优化

概述

什么是优化？优化就是为了得到更高效的程序。换而言之，就是更快以及（或者）更小的程序。

Optimization = more efficient code = faster code and/or compact code.

优化可以在四个层面上进行：算法层(Algorithm) ，语言层(Language)，汇编层(Assembly)，处理器层(Processor)。

算法层(Algorithmic)：

时间复杂度（Order of growth，大O）可以衡量一个算法的性能，包含常数阶(constant,O(1))，对数阶(logarithmic, O(log₂n))，线性阶(linear,O(n))，线性对数阶(log-linear, O(n log₂n))，K次方阶(to the power of K, O(n^k))，指数阶(exponential, O(kⁿ))。

语言层(Language):

语言的选择——解释型语言(Interpreters)：PHP、Perl、Ruby、JS；框架式语言(Frameworks)：.Net、Java；面向对象语言(Objective)：C++、Objective-C；低级语言(Low Level)：C、fortran……；汇编(Assemblers)。语言的执行效率与开发难度都顺次递增。

利用语言的特性，比如关键字以及#pragma指令。

汇编层(Assembly)

一般交给编译器(Compiler)优化，不同的优化选项会得到不同的汇编。开发人员也可以自己编写汇编，比如在C语言中使用__asm{}直接编写汇编。不同的CPU支持不同的指令集：MMX(Pentium)、MMX2(Pentium-II)、SSE(Pentium-II、Pentium-III)、SSE2(Pentium-III、Pentium-IV)、SSE3(Pentium-IV)。开发者可以根据目标CPU选择合适的指令。

处理器层(Processor)

绝大多数情况下由CPU完成优化，对开发者透明。CPU可以通过使用缓存(Caches)、寄存器(Registers)、分支(branching)、管道(piplines)等方式优化程序。CPU也可以预取指令(pre-fetch)以及重新组织(re-organize)指令执行顺序来提高效率。因为CPU包含许多子组件，比如ALU(Arithmetic Logic Unit, 算术逻辑单元)和FPU(Float Point Unit，浮点运算单元)，各组件是可以并行工作的，所以指令执行的顺序也影响程序的性能。

大多数程序员认为程序只能通过算法来优化，并且坚信算法复杂度是最重要的因素，算法复杂度越低则程序越高效。其实这种想法有两个误区，其一是优化可以在多个层面进行；其二是复杂度只取最高指数项并省略掉前面的常数，设想n不超过1000时，一个复杂度为10000*n与复杂度为3*n²的算法哪个效率更高些？

优化的一个实例：排序(Sorting)

----------算法层-----------

首先是算法的选择：冒泡排序法(Bubble Sort)、堆排序法(Heap Sort)、基数排序法(Radix Sort)还是快速排序法(Quick Sort)?

算法	时间复杂度	空间复杂度
Bubble Sort	O(n²)	1
Heap Sort	n log₂n	1
Radix Sort	n	n
Quick Sort	n log₂n	log₂n

如果我们选择第一种冒泡排序，并用C语言实现：

void bubbleSort(void *A) {

bool swapped = false;

do {-

lastSwap = 0

for (i = 0; i <= len(n) - 2; i++) {

if (greater(A[i], A[i+1])) {

swap(A[i], A[i+1]);

swapped = true;

} /* end if */

} /* end for each */

} while (swapped);

} /* end bubbleSort */

上述代码仍然可以在算法层进行优化：

void bubbleSort(void *A) {

bool swapped = false;

n = len(A); /* Saves n operations per iteration */

do {

lastSwap = 0;

for (i = 0; i <= len(n) - 2 n - 2; i++) {

if (greater(A[i], A[i+1])) {

swap(A[i], A[i+1]);

lastSwap = i + 1; /* Optimizes 50% Iterations */

swapped = true;

} /* end if */

} /* end for each */

n = lastSwap;

} while (swapped);while(n > 1);

} /* end bubbleSort */

上述代码做了两个优化：1、把len(A)从循环中提取出来，这样可以省去n次迭代；2、用lastSwap代替swapped，这样可以省去50%的迭代。(注：每次迭代中被交换到最后的最大值不需要进行下次迭代。）

----------语言层-----------

继续对上述代码优化：

inlinevoid bubbleSort(void *A) {

register n = len(A);

do {

lastSwap = 0;

for (i = 0; i <= n - 2; i++) {

if (greater(A[i], A[i+1])) {

swap(A[i], A[i+1]);

lastSwap = i + 1;

} /* end if */

} /* end for each */

n = lastSwap;

} while(n > 1);

} /* end bubbleSort */

利用C语言的关键字inline（严格意义上是C++的关键字）和register同样可以优化程序。inline关键字可以把函数展开而省去函数调用的开销，而register关键字可以保证n的值每次都是从寄存器中读取/写入，从而省去读取内存的开销。（注：与register相对的是volatile，告诉编译器不能把这个变量放入寄存器中，必须从内存中读取。）

swap函数的传统实现方式如下：

swap (void **a, void **b) {

void *t = *a;

*a = *b;

*b = t;

}

（注：此时调用者应该这么写：swap(&A[i], &A[i+1]);）

利用C语言的特性，我们可以这样改写：

Swap (void **a, void **b)

{

*a += *b; /* sets a to be (a + b) */

*b -= *a; /* b is b-(a+b) = -a */

*b = -*b; /* b is now a */

*a -= *b; /* a is now a + b - a = b */

}

这样的改写可以省去一个局部变量的开销，但是上面的代码有一个bug：因为指针是32位的值（在32位机上），两个32位值相加可能会有overflow的情况。解决这个bug的方法如下：

Swap (void **a, void **b)

{

*a ^= *b; /* sets a to be (a xor b) */

*b ^= *a; /* b is b xor (a xor b) = a */

*a ^= *b; /* a is (a xor b) xor a = b */

}

----------汇编层-----------

使用visual studio 2010的cl.exe对函数

swap (void **a, void **b) {

void *t = *a;

*a = *b;

*b = t;

}

进行汇编。（注：栈地址向下增长。）

若选项设为/O0（不优化），得到的汇编为：

PUBLIC _swap
; Function compile flags: /Odtp
_TEXT SEGMENT
_t$ = -4      ; size = 4
_a$ = 8       ; size = 4
_b$ = 12      ; size = 4
_swap PROC
; Line 2
push ebp
mov ebp, esp
push ecx
; Line 3
mov eax, DWORD PTR _a$[ebp]  ; 把参数a放入寄存器eax
mov ecx, DWORD PTR [eax]  ; 把eax所指值(*a)放入寄存器ecx
mov DWORD PTR _t$[ebp], ecx  ; 把ecx的值(*a)放入局部变量t里，即t=*a
; Line 4
mov edx, DWORD PTR _a$[ebp]  ; 把参数a放入寄存器edx
mov eax, DWORD PTR _b$[ebp]  ; 把参数b放入寄存器eax
mov ecx, DWORD PTR [eax]  ; 把(*b)放入寄存器ecx
mov DWORD PTR [edx], ecx  ; 把ecx的值写入(*a)，即*a=*b
; Line 5
mov edx, DWORD PTR _b$[ebp]  ; 把参数b放入寄存器edx
mov eax, DWORD PTR _t$[ebp]  ; 把局部变量t放入寄存器eax
mov DWORD PTR [edx], eax  ; 把eax的值(t)写入edx所指内存(*b)，即*b=t
; Line 6
mov esp, ebp
pop ebp
ret 0
_swap ENDP
_TEXT ENDS
END

如果设置优化选项为/O1（实际上设置为/O2、/Ox得到的结果是一样的），生成的汇编为：

PUBLIC _swap
; Function compile flags: /Ogspy
; COMDAT _swap
_TEXT SEGMENT
_a$ = 8       ; size = 4
_b$ = 12      ; size = 4
_swap PROC      ; COMDAT
; Line 2
; 省略了push ebp以及mov ebp, esp
; Line 4
mov edx, DWORD PTR _b$[esp-4] ; 把参数b存入edx。因为没有把ebp压栈（需要4个字节），所以esp-4相当于优化前的ebp
mov eax, DWORD PTR _a$[esp-4] ; 把a存入eax
mov ecx, DWORD PTR [eax]  ; 把*a存入ecx
push esi

mov esi, DWORD PTR [edx]  ; 把*b存入esi
mov DWORD PTR [eax], esi  ; 把*b存入*a，即*a=*b
; Line 5
mov DWORD PTR [edx], ecx  ; 把*a（未赋值前）放入*b，即*b=*a。此处ecx充当了t的作用
pop esi
; Line 6
ret 0
_swap ENDP
_TEXT ENDS
END

可以看到优化后省略了一个ebp压栈操作，以及省略了局部变量t。生成的汇编指令更少，自然就更高效。

----------处理器层-----------

大多数情况下这层的优化是透明的，程序员很难预料CPU会作做什么优化，而且在多线程程序里CPU的一些优化可能会导致一些问题。

尽管如此，程序员仍然可以做一些优化，因为不同的CPU支持不同的指令集，所以可以根据目标CPU选择要生成的汇编指令集．如果目标CPU不定，比如某些客户用PetiumIV，而有些用PetiumII，可以生成两个不同的dll，一个专门为PetiumIV进行优化，而另一个只运行在PetiumII上而不做优化．在程序运行时，根据目标机的CPU类型（在Windows可以调用GetSystemInfo）调用合适的dll.

内存

当代计算机使用分层存储结构－－寄存器－＞CPU缓存－＞内存－＞外存．其中内存是当前程序性能最重要的资源，是程序最大的瓶颈。

计算机里运行的每个程序都拥有独立完整连续的虚拟内存，而数据实际存储在物理内存中。物理内存内的数据是不连续的，以页(Page)为最小单元，大小一般为4K。大多数情况下，物理内存要比虚拟内存小．所以并不能装下虚拟内存中的的所有数据，这时就需要把一些数据暂时存放在外存中。当数据需要被使用而不在物理内存中时（页面失效），则先把一些暂时不用的数据交换到外存中，再把需要的数据从外存中交换到物理内存中。

32位虚拟内存映射到32位物理内存和64位虚拟内存映射到64位虚拟内存的情况比较常见，但还有一种情况是32位虚拟内存映射到64位物理内存的情况。这种情况出现在当CPU寄存器为32位，而物理内存超过4G时，为了取到物理内存超过4G的部分，需要对物理内存64位取址。

当CPU执行一个从内存读取数据的指令时，它得到一个虚拟地址。虚拟地址需要通过MMU(Memory Management Unit)转换为物理内存的地址，才能从实际的内存中读取数据。32虚拟内存地址以10+10+12的形式分为三部分。前面10位用来索引PDE（Page Directory Entry)，中间10位用来索引PTE(Page Table Entry)，最后的12位用来索引页面(Page)从而得到真正的内存地址。

PDE

PDE(Page Directory Entry)是存放在内存中的一张表，通过它可以索引到PTE(Page Table Entry)。10位的PDE最多可以存放2¹⁰项PTE。PDE的地址存放在寄存器CR3中。当进程切换时，CR3的值也跟着改变，这也意味着每个进程都拥有自己的PDE，这样便保证了每个进程都有自己独立的内存空间而互不干扰。因为每项都存放一个指针(4个字节)，所以表的大小是4K。

PTE

PTE(Page Table Entry)也是存放在内存中的一张表，通过它可以索引到页面(Page)。10位的PTE最多可以存放2¹⁰项页面。PTE的大小也是4K。

Page

页面是物理内存中的最小单元，大小在32位是4K，64位下可以是4K，2M甚至是1G。每次分配的内存大小必须是页面大小的整数倍。比如4K的页面，当程序需要新的内存时，不超过4K也会以4K的大小分配，如果需要6K则会分配8K。页面是可被交换出物理内存，暂存到外存中的。（注：PDE和PTE是始终存放在物理内存中，不会被交换的。）当程序需要的数据所在的页面不在物理内存中时，就会产生页面失效(Page Fault)，继而需要把它从外存中交换进来。页面失效是非常耗时的，为了提高程序的性能，应该尽可能地避免页面失效。

利用这种分层结构，最终可以将虚拟内存映射到物理内存。这种分层结构有两个优点：一个是确保了每个进程都有自己独立的虚拟内存空间而不会互相干扰；二是节省内存空间，因为一个程序一般是不能用完所有的页面，只有需要时才会在内存创建新的页面，如果没有分层结构，则页面的索引表将会非常大，其中包含了大量的NULL项，而分层结构解决了这个问题。不仅如此，因为有些进程是可以共享一些内存的（比如同一程序的不同实例可以共享可执行代码），所以它们只要令PDE或PTE中的项中的指针值相同就行。

PAE

考虑到32位虚拟内存映射到64位物理内存的情况，需要将PTE的项扩展为64位（8字节），这时PTE的大小变为8K，在计算机里，4K是一个非常便利的大小，所以为了保持PTE4K的大小，可以将PTE的项数减半（为2⁹=512），同样的，PDE里的每项也是64位，项数减半。因为PTE和PDE只需要9位来索引，这时虚拟地址的布局变为2+9+9+12。前面多出的2位用来索引一张新表PDPT(Page Directory Pointer Table)，一共有四项，每项指向一张PDE（1G地址空间），这样虚拟内存的大小仍然是4G，但是可以映射到超过4G的物理内存中。这时寄存器CR3再存放PDE，而是PDPT的地址，这种物理内存的扩展就称为PAE(Physical Address Extensions)。

操作系统往往会共享大量的内存空间，比如Windows有2G的内存共享，而Linux有1G的内存共享，有了PAE后，只需要共享PDPT中的项就可以，从而节省了大量的内存。

PTE的后12位

注意到PTE中存放的每项的值，与虚拟内存地址的后12位合并，就得到了真实的内存地址，因此PTE每项的后12位其实是无用的。但是这12位是不会被浪费的，页面的状态，比如是否在物理内存中，是属于操作系统内核还是任何进程都能访问等信息，都可以存放在这12位里。

Flag	Meaning
Global	Page belongs to Kernel, and is thus global across all processes
Dirty	Page has been modified and cannot be reused until ommitted
Accessed	Page has been recently accessed (for LRU "clock" algorithm)
Acahe Disable	Page may not be cached
Write Through	Write this page to disk (disables write caching)
Owner	User-mode (Ring 3) page of Kernel-Mode (Ring 0) page
Writable	Is page writable or read only
Valid	Page is a valid page, mapping to a physical. Always set to "1"

64位虚拟内存

64位虚拟内存地的分布为9+9+9+9+12，即4张索引表和4K的页面；也可以是9+9+9+21，即3张索引表和2M的页面；也可以是9+9+30，即2张索引表和1G的页面。一般1G的页面不常见，因为页面太大页面失效的代价也会很大。

注意到64位地址前面的16位并没有被用到，这样做的原因是后面的48位已经足够索引现在的物理内存。就目前的内存大小来看，把虚拟内存的取址空间支持到几T是没有意义的，而且过多的分层会影响效率。正因为层数比32位多，地址映射的时间更长，所以64位机在某些情况下要比32位机慢。不要迷信64位机一定比32位机快。

Lazy Allocation

对于Lunix和Windows 7，操作系统采取了Lazy Allocation的方式分配内存。比如用户用malloc申请一块1M的内存，这时操作系统仅仅是创建了索引表，而不真正地创建页面，这样物理内存实际只增加了4K，当真正访问这块内存时，操作系统才真正地创建页面，并填充数据。但是Windows XP并不是这样，当用户申请一块内存时，它便立即分配这块内存。微软也发现这种方式的缺陷，所以在Windows 7加以改进。

动态内存和静态内存：

进程中有堆和栈，堆中动态分配内存，栈用来给局部变量分配内存，当局部变量离开它的作用域时，就会被自动释放。C语言标准里有个函数alloca，可以在栈上分配不定大小（运行时确定）的内存，同值得注意的是，用这个函数申请的内存会在函数返回时自动释放，和局部变量一样。

页面失效(Page Fault)：

页面失效的原因可以是：

Access denied: page is in memory, but is ring0 and you are in ring3;

Access delayed: page is not in memory but should be:

-> Page is declared, allocated but swapped;

-> Page is declared, allocated but unitiaiized;

-> Page is not declared (and not allocated);

对CPU而言所有类型的页面失效都是一样的，而且CPU可以从寄存器CR2中获取页面失效的地址。但是操作系统内核决定怎么处理页面失效：

if access denied -> Process is killed;

if page is not declared -> Process is killed;

if page is declared/allocated/swapped ->process is suspended, kernel page process gets control, gets page;

if page is declared/allocated/uninitialized -> kernal actully inialize.

TLB(Translation Lookaside Buffer)

大多数CPU除了MMU外，还有TLB（页表缓冲，与L1，L2缓存没有本质区别，只不过TLB存储页表数据，L1、L2缓存存储实际数据）。如果页表已经缓存在TLB中，那么CPU只要1个时钟周期就能取到实际的地址，否则通过MMU要耗用30个时钟周期，64位下MMU要耗用50+个时钟周期。

CPU的并行技术

CPU的基本架构 (Basic CPU Architecture)

CPU(Central Processing Units)其实是一个复杂的包含多个子组件的系统．

Compent	Use
ALU	Arithmetic Logical Unit: Perform integer math and conditionals
FPU	Floating Point Unit: floating point operations
Load	Reads from memory into register
Store	Writes to memory from register
Prefetch/Decoder	Instruction prefetch from memory, and decode into micor-ops
Scheduler	Schedules instructions on other components

ALU处理整型运算和逻辑运算，是CPU里最重要的组件。因为ALU最常被使用，一般CPU里会有两个ALU；

FPU处理浮点数运算。因为更昂贵，所以CPU一般只有一个FPU；

Load从内存中读取数据；

Store向内存中写入数据；

Prefetch/Decoder可以从内存中取指令，并解释为可执行的微指令(micro-ops)；

Scheduler负责调度指令，把指令发送给执行该指令的组件。

CPU对指令的操作流程为：

Fetch -> Decode -> Execute -> Memory -> Write

其实哪怕是单个CPU也存在并行。因为各个组件是独立的，所以每个组件在完成前一指令的“加工”后，可以开始“加工”下一个指令。比如Fetch从内存中取出指令交给Decode去解析后，就可以开始从内存取出下一条指令。这就是Pipelining，类似于流水线。

超线程技术(HyperThreading)

为了解决单个CPU效率低下的问题，有人提出超线程技术的解决方案。其实就是在原有基础上，加入另外的寄存器组。这样的好处是CPU可以同时指行多条指令。比如FPU使用一组寄存器进行浮点运算而同时ALU使用另一组寄存器进行整型运算。使用超线程技术时也可能同时会相应地增加ALU的数量。

尽管这样可以达到一定程度上的并行，但ALU，FPU以及Load/Store这些组件仍然是共用的，仍然可能成为瓶颈。

多核技术(Multi Core)

为了达多更大程度的并行，多核技术随之产生。CPU把ALU,FPU,Instruction fetch/decode,Scheduler这些组件看成是一个Core。而多核(Multi Core)就是在同一个CPU里同时存在多组这些组件。各个Core可以并行地执行指令，并拥有各自的一级缓存(L1 Cache)，但各个核之间仍然共享二级缓存(L2 Cache)和总线(bus)。

优点（相对于多处理器）：

共享缓存，所以可以避免从内存中装载同一数据到缓存中数次，从而更高效。而多处理器不能共享缓存；

因为时钟周期一致，所以多核访问缓存的速度更快；

更便宜、且更省电。

缺点：

因为共享缓存，别的线程可能会破坏缓存中的数据；

因为共享总线，总线带宽可能会成为瓶颈。

多处理器技术(Multi Processor)

这种技术直接使用多个CPU。各个CPU有独立的组件，包括L2缓存和总线，所以它们可以并行地对内存进行操作。不同的CPU还可以有不同的时钟周期(Clock speeds）。

多处理器的架构有两种：

Symmetric Multi Process(SMP)——它使用Uniform Memory Architecture(UMA)。在这种架构下，所有的CPU都是等同的，它们可以各自独立地对内存进行操作。

Asymmetric Multi Process(AMP)——它使用Non-Uniform Memory Architecture(NUMA)。在这种架构下，CPU0被视为地位最高的，由它来控制其它CPU的操作。

优点（相对于多核）：

各处理器完全独立，性能的瓶颈会更少；

独立的缓存，所以整体缓存空间更多；

可扩展。

缺点：

因为可以独立存取内存，需要同步。性能为因此受到很大影响；

各CPU需要数据时，即使这个数据存在另一个CPU的缓存中，它仍然不能使用那个缓存中的数据，必须从内存中读取；

更昂贵、且更耗电。

多线程

操作系统里有进程(Process)的概念。进程是一个拥有独立的虚拟空间，独一无二的id和资源(文件、socket)句柄的可以在CPU中执行的程序。操作系统为每个进程分配一个时间片(time slice)，快速地在各进程中切换，达到各程序并行的效果。

每个进程多数情况下并不能完整地用完所得到的时间片（因为中断，比如I/O）而不得不放弃对CPU的使用权，所以线程(Thread)的概念由此诞生。当进程中的某个线程等待I/O操作时，另外的线程可以继续运行，直到用完所得到的时间片。对进程来说，CPU的资源就像钱对人类一样珍贵。

随着硬件技术的发展，多核和多处理器技术可以让线程真正地并发运行。

线程共享进程中的内存空间以及资源，但拥有独立的栈。线程的实质是保存在寄存器中的一些状态——程序指针(IP)和栈指针(SP)。当线程切换时，发生改变的仅仅是这两个存放在寄存器中的指针值，被激活的线程便根据新的IP值开始执行程序，并始用当前SP所指的栈，所以线程切换是非常迅速的。相对而言，进程的切换非常慢，因为进程的切换要切换虚拟内存空间，导致页表切换。

线程在内存中只有栈是私有的，有时它需要在栈外维护一个私有存储空间(Thread Local Storage, TLS)，比如全局变量。Windows下可以调用TlsAlloc来获得这块存储区域。相关的函数分别是：TlsAlloc反回一个index，TlsGetValue(index)返回这个存储区里的值，TlsSetValue(index, value)设置存储的值，TlsFree(index)释放这个存储区（注：这个函数会释放会令这个index在所有线程中失效，所以要确保最后退出进程的线程调用该函数）。另一种在栈外存储私有数据的方式是私有堆(Private Heap)，相关的Windows函数HeapCreate, HeapAlloca, HeapFree和HeapDestory。

线程同步

Mutex：当线程获得Mutex时，其它尝试得到这个Mutex的线程都会被挂起，直到持有这个Mutex的线程释放该Mutex；

Semaphore: Mutex的进化版，通过计数允许多个线程获得这个资源，而不像Mutex一次只能被一个线程获得。当获取Semaphore的线程数达到最大值时，则尝试获取Semaphore的线程就会挂起，直到有线程释放Semaphore。

Event: 当某个Event发生时，唤醒等待该事件的线程。有两种方式：Sychronization和Notification。前者只唤醒最先等待该事件的线程，后者唤醒所有待待该事件的线程。

Waitable Timer: 相当于Time Event，当计时器时间到后，就会唤醒线程。

Critical Section: 类似于Mutex，当一个线程进入临界区(enter critical section)后，其它尝试进入的线程都会被挂起，直到该线程离开临界(leave critical section)区。与Mutex不同，进入临界区的线程再次进入临界区（在递归函数里会出现这种情况），而Lock Mutex的线程再试尝试Lock同一个Mutex，会造成死锁(Dead Lock)。

Slim Reader/Writer: 当某个线程尝试读操作，如果有别的线程正在进行写操作，则挂起；否则即使有别的线程正在进行读操作。当线程尝试写操作，只要有别的线程在进行读操作或写操作，则挂起。

Condition Variables: 这个Variable必须与Mutex或Critical Section一起使用。当一个线程获得了一个Mutex或进入了临界区，当它block住（比如等待I/O）时，可以放弃这个Mutex或离开临界区，同时挂起；当block这个线程的原因消失后（比如I/O操作完成），并且Mutex或临界区没有被其它线程占用，它可以重新获得这个Mutex或临界区。

同步造成的问题

Starvation：某一线程可能无法得到Mutex而始终无法运行。比如Priority太低Mutex总是被更高优先级的线程占据。

Dead lock：当两个线程同时占有对方想要的Mutex时，会导致死锁。比如一个线程得到了Ａ，等待Ｂ，而另一线程得到了Ｂ，等待Ａ，这时两个线程因为得不到想要的Mutex，而无法运行下去。

Live lock：解决Dead lock可以有一个timeout的方法。当一个线程等待一个Mutex超时后，释放掉自己占有的Mutex。这种方案可能会出现这种情况：线程获得A，等待B超时后释放A；而另一个线程获得B，等待A超时释放B。之后两个线程又同时获得了对方想要的Mutex，等待超时后又再次释放已获得的Mutex。如此反复。

Interlocked Operations

有些原子操作是可以在用户模式(User Mode)下完成的，从而省去了进入操作系统内核的开销，更高效：

Interlocked[In|De]crement(&a) <==> a++ 或 a--

InterlockedAdd(&a, b) <==> a += b

InterlockedExchanged(&a, b) <==> a = b

Interlocked[xor|and|or](&a, b) <==> a ^= b 或 a &= b 或 a |= b

你可能感兴趣的:(程序性能与优化)

自然语言模型（NLP）介绍 Liudef06 Stable Diffusion 自然语言处理人工智能
一、自然语言模型概述自然语言模型（NLP）通过模拟人类语言理解和生成能力，已成为人工智能领域的核心技术。近年来，以DeepSeek、GPT-4、Claude等为代表的模型在技术突破和应用场景上展现出显著优势。例如，DeepSeek通过强化学习提升推理能力，其混合专家架构（MoE）显著优化了计算效率‌。二、核心技术解析1.DeepSeek模型架构混合专家模型（MoE）：DeepSeek-V3采用Mo
20250303-代码笔记-train_n100 唐小旭代码学习笔记笔记
文章目录前言一、参数1.MachineEnvironmentConfig2.PathConfig3.Imports4.Parameters环境参数(`env_params`):模型参数(model_params):优化器参数(`optimizer_params`):训练器参数(trainer_params):加载预训练模型的设置(`model_load`):日志文件参数(`logger_param
蓝桥杯算法基础（35）贪心算法详解湖前一人对影成双蓝桥杯算法职场和发展
动态规划和贪心算法都是一种推导算法均用“局部最优解”来推导“全局最优解”是对遍历解空间的一种优化当问题具有最有子结构时，可用都动规，而贪心是动规的特例什么是贪心策略顾眼前-->长远-遵循某种规则，不断（贪心地）选取当前最优策略，最终找到最优解-难点:当前最优未必是整体最优贪心策略例1:硬币支付问题有1元，5元，10元，50元，100元，500元地硬币各c1,c5,c10,c50,c100,c500
华为OD机试 - 寻找最大价值的矿堆 - 矩阵，通过栈优化（Python/JS/C/C++ 2023 B卷 200分）哪吒华为od 矩阵 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述给你一个由’0’(空地)、‘1’(银矿)、‘2’(金矿)组成的地
【每日八股】MySQL篇（九）：优化 YGGP 数据库 mysql 数据库
目录慢查询的原因？MySQL磁盘I/O很高有什么优化的方法？总结慢查询的原因？索引不足：如果查询的表没有合适的索引，MySQL需要遍历整个表才能找到匹配的记录，这会导致查询变慢。可以通过添加索引来优化查询性能。数据库设计问题：如果数据库设计不合理，例如表过于庞大、列过多等，查询时可能需要耗费大量时间。这时可以通过优化数据库设计来解决问题。数据库服务器负载过高：如果MySQL服务器上同时运行了太多的
MySQL篇：基础知识总结与基于长期主义的内容更新 YGGP 数据库 mysql 数据库
基础知识总结前前后后花了一周左右的时间，我根据csview当中的八股文以及DeepSeek对MySQL部分的基础知识进行了总结，主要包括：概述、事务、索引、锁、存储引擎、日志以及优化部分的内容。在此我做一个目录索引，对应到每一篇总结的文章：【每日八股】MySQL篇（一）：概述【每日八股】MySQL篇（二）：事务【每日八股】MySQL篇（三）：索引（上）【每日八股】MySQL篇（四）：索引（下）【每
Python深度学习实践：神经网络在异常检测中的应用 AI天才研究院 AI大模型企业级应用开发实战 Python实战 DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
Python深度学习实践：神经网络在异常检测中的应用关键词：深度学习，神经网络，异常检测，Python，TensorFlow，PyTorch，模型优化，实战案例摘要：本文深入探讨了深度学习在异常检测领域的应用。通过Python实现的神经网络，本文介绍了深度学习的基本概念、核心算法、模型优化方法，并提供了详细的实战案例，包括数据预处理、模型训练和评估。读者将了解如何使用深度学习技术检测金融欺诈、网络
INA(In-Network Aggregation)技术一只积极向上的小咸鱼人工智能
In-NetworkAggregation（网络内聚合）是大模型分布式训练或推理中优化通信效率的一种技术，核心思想是在网络传输路径中直接完成数据聚合，而非依赖终端节点处理，从而降低通信开销、提升整体效率。核心原理在传统分布式训练中，计算节点（如GPU）需要将本地计算的梯度或中间结果发送到中心节点（如参数服务器）进行聚合，这会产生大量的网络传输。In-NetworkAggregation则是通过可编
Web Snapshot 网页截图模块代码详解魔王阿卡纳兹 Python 学习札记开源项目观察前端 Python 网页截图
本文将详细解析WebSnapshot模块的实现原理和关键代码。这个模块主要用于捕获网页完整截图，特别优化了对动态加载内容的处理。1.模块概述snapshot.py是一个功能完整的网页截图工具，它使用Selenium和ChromeWebDriver来模拟真实浏览器行为，确保能够捕获到动态加载的内容。1.1核心依赖fromseleniumimportwebdriverfromselenium.webd
急招！【Base石家庄/济南/昆明/贵阳】云和恩墨-GoldenDB/MySQL DBA mysql数据库招聘
岗位职责：1、针对客户的需求或技术问题编写技术方案和技术文档；2、现场或远程采集操作系统和数据库相关的运行数据和日志文件，对采集的信息进行上传归档；3、对客户的数据库及系统进行诊断、优化及故障处理，帮助客户尽快恢复业务正常运行；4、有计划有步骤地推进项目的实施，直到最终效果满足合同或项目计划设定的交付目标；5、根据客户满意度以及服务提供过程中暴露的问题，不断改进、调整和完善工作。有意向者添加小墨（
Flutter开发者 3.29版本关注要点
哈喽，我是老刘Flutter3.29已经发布有一段时间了，老刘写Flutter代码已经6年多，对这种例行的Flutter版本更新基本上已经是内心毫无波澜。不过最近有不少朋友问要不要更新到最新版，这里罗列一下从开发者角度看比较重要的更新，大家自己判断。一、架构与性能优化Dart代码执行线程调整Dart代码现直接在Android/iOS的主线程运行，减少了线程切换开销，但需注意可能加剧平台UI线程的负
Vivo手机的提速模式解析及编程实现雨中微步智能手机编程
随着智能手机的普及，人们对手机的性能要求越来越高。为了满足用户对手机性能的追求，各大手机厂商纷纷推出了提速模式来优化手机的性能表现。其中，vivo手机的"Boost模式"就是一种提速模式，旨在通过优化系统资源的分配和调度，提升手机的运行速度和响应能力。在本文中，我们将详细解析vivo手机的Boost模式，并提供相应的编程示例。Boost模式的原理Boost模式通过一系列的优化措施来提升vivo手机
Text2SQL之Vanna优化 ToTensor 大模型通关打怪之旅 Text2SQL 深度学习人工智能 LLM python
文章目录前言一、优化方向二、干就完了一次性生成多个Question-SQL对先生成一个问题，再根据DDL和业务数据生成SQL总结前言前阵子写了篇Text2SQL的简单介绍，发现其也是RAG只会，写下了Text2SQL之不装了，我也是RAG最近也一直在做Text2SQL的优化，于是把自己的一些心得，总结于这篇文章。一、优化方向既然本质是RAG，那顺着RAG的优化方向走，准没错。文档增强：对文档进行摘
深入解析Vue3单文件组件：原理、场景与实战念九_ysl Vue vue.js 前端 javascript
一、SFC是什么？单文件组件（Single-FileComponents，SFC）是Vue的标志性特性，以.vue为扩展名的文件将模板、逻辑和样式封装在单一文件中。Vue3的SFC在保留经典设计的同时，针对现代开发需求进行了多项优化：{{count}}+1import{ref}from'vue'constcount=ref(0)constincrement=()=>count.value++.co
DeepSeek＋Kimi xjfgkf mysql sqlite oracle json
DeepSeek与Kimi生成PPT全流程解析一、工具分工原理DeepSeek核心作用：生成结构化PPT大纲（擅长逻辑构建与内容优化）Kimi核心作用：将文本转换为视觉化PPT（提供模板库与排版引擎）二、操作步骤详解1.通过DeepSeek生成PPT大纲down输入提示词示例（需包含三要素）你是有10年经验的AI行业分析师，请为科技公司投资人制作一份30页的PPT，要求：首页包含主标题与3个核心论
非常哇塞的 SpringBoot性能优化长文！肥肥技术宅 java 大数据 java
SpringBoot已经成为Java届的No.1框架，每天都在蹂躏着数百万的程序员们。当服务的压力上升，对SpringBoot服务的优化就会被提上议程。本文将详细讲解SpringBoot服务优化的一般思路，并附上若干篇辅助文章作为开胃菜。本文较长，最适合收藏之。1.有监控才有方向在开始对SpringBoot服务进行性能优化之前，我们需要做一些准备，把SpringBoot服务的一些数据暴露出来。比如
vue使用keep-alive缓存页面优化项目 Y18. vue vue.js 缓存 javascript
概念keep-alive是Vue的内置组件，当它包裹动态组件时，会缓存不活动的组件实例，而不是销毁它们。keep-alive是一个抽象组件：它自身不会渲染成一个DOM元素，也不会出现在父组件链中。作用在组件切换过程中把切换出去的组件保留在内存中，防止重复渲染DOM，减少加载时间及性能消耗，提高用户体验性参数include字符串或正则表达式。只有名称匹配的组件会被缓存。exclude字符串或正则表达
STM32 MPU6050 六轴陀螺仪教程（HAL 库零基础入门）与光同尘大道至简 stm32 嵌入式硬件单片机
本教程将详细介绍如何在STM32微控制器上使用HAL库驱动MPU6050六轴姿态传感器，适合零基础的初学者学习。内容涵盖基础知识、硬件连接、开发环境配置、驱动编写、数据处理、示例代码以及调试与优化等方面。通过本教程，读者将了解MPU6050的工作原理，掌握STM32I2C通信的使用方法，并能够读取MPU6050的加速度、角速度和温度等数据，进而进行姿态角的计算。1.基础知识MPU6050传感器工作
一次性了解OpenAI的“草莓”（Strawberry）超强实力金融街小单纯预测模型生成式人工智能人工智能
OpenAI预计在秋季推出的代号为“草莓”（Strawberry）的新AI模型，是其在AI推理领域的一项重要突破。该项目的成功也将为人类实现通用人工智能（AGI）目标迈出重要一步。使模型不仅能够生成查询答案，还能处理复杂的科学和数学问题，进行自主可靠的“深度研究”。“草莓”项目是OpenAI在AI推理领域的一项重要突破具备高级推理能力、长任务规划、超大规模训练等核心功能与技术特点。该项目的推出将进
深入理解网络通信中的关键概念：HTTP、TCP与Socket的关系及TCP的可靠性保障 guihong004 java面试题 http tcp/ip 网络协议
在网络编程和Web开发中，了解HTTP、TCP和Socket之间的关系以及TCP如何保证数据传输的可靠性是至关重要的。这些概念不仅构成了现代互联网通信的基础，而且对于优化应用性能、确保数据安全和完整性具有重要意义。本文将详细探讨HTTP、TCP和Socket三者之间的联系，解析HTTP长连接与短连接的区别，解释为什么TCP需要三次握手而不仅仅是两次，讨论TCP粘包现象产生的原因及其解决方案，并总结
掌握 findIndex、push 和 splice：打造微信小程序的灵活图片上传功能✨ 小丁学Java 微信小程序WxMa 微信小程序小程序 js
文章目录✨掌握`findIndex`、`push`和`splice`：打造微信小程序的灵活图片上传功能示例场景：小程序图片上传认识`findIndex`定义语法在代码中的应用示例当前行为认识`push`定义语法在代码中的应用示例特点✂️认识`splice`定义语法在代码中的应用示例特点三者的协作：动态管理操作流程长度变化优化：固定4张问题优化代码效果长度变化三者的最佳实践建议总结✨掌握findIn
智能优化算法应用：基于旗鱼算法与双伽马校正的图像自适应增强算法智能算法研学社（Jack旭）智能优化算法应用图像增强算法计算机视觉人工智能
智能优化算法应用：基于旗鱼算法与双伽马校正的图像自适应增强算法-附代码文章目录智能优化算法应用：基于旗鱼算法与双伽马校正的图像自适应增强算法-附代码1.全局双伽马校正2.旗鱼算法3.适应度函数设计4.实验与算法结果5.参考文献6.Matlab代码摘要：本文主要介绍基于旗鱼算法与双伽马校正的图像自适应增强算法。1.全局双伽马校正设图像的灰度值范围被归一化到[0,1]范围之内，基于全局亮度的双伽马调整
【Elasticsearch】数据管理（Data Management） risc123456 Elasticsearch elasticsearch
Elasticsearch的数据管理（DataManagement）是其核心功能之一，旨在帮助用户高效地存储、维护和查询不同类型的数据，同时优化性能和成本。以下是结合原文内容对Elasticsearch数据管理的详细阐述：1.数据类型Elasticsearch中的数据主要分为两类：（1）内容（Content）•定义：这是用户希望进行搜索的项目集合，例如产品目录、用户信息等。•特点：•数据可能会频繁
深入浅出：UniApp 从入门到精通全指南大胖丫 uni-app
https://juejin.cn/post/7440119937644101684uni-app官网本文是关于UniApp从入门到精通的全指南，涵盖基础入门（环境搭建、创建项目、项目结构、编写运行）、核心概念与进阶知识（组件与开发、页面路由与导航、数据绑定与响应式原理、生命周期钩子）、电商应用开发（商品展示、购物车、订单结算等功能）、项目优化与部署（性能、安全优化及不同平台部署）、案例分析及总结
怎么做好备件管理？备件管理系统都包括哪些功能模块？沃丰科技低代码人工智能系统架构
数字化转型成为大趋势，在全球供应链面临挑战的背景下，备件仓储、备件管理的数字化升级对企业、对行业有着至关重要的意义。如何借助售后服务系统，加强整个备件管理链条清晰程度，沉淀管理数据，通过数据挖掘明确备件的损坏规律，对未来设备管理流程进行优化成为各大企业的关注点。进一步来说，备件是设备修理的主要物质基础，做好备件管理，及时供应备件，可以缩短修理时间、减少损失，供应质量优良的备件，可以保证修理质量和修
verilog练习：HRPWM 模块设计啄缘之间 Verilog 项目练习学习资料总结 fpga开发学习 sv uvm verilog 测试用例
文章目录前言1.HRPWM代码示例：1.1关键设计说明：2.HRPWM温度补偿和动态校准2.1关键增强功能说明：2.2校准流程验证方法：2.3性能优化建议：前言需要考虑如何用SystemVerilog实现这些功能。首先，模块的输入输出端口应包括时钟、复位、占空比设置、使能信号，以及PWM输出。内部可能需要计数器、比较寄存器、MEP控制逻辑。MEP的实现可能需要一个微边沿计数器，在每个主时钟周期内生
element UI =＞ element Plus 差异化整理 CJ-杰 vue.js elementui javascript
注：文章由deepSeek生成；以下是ElementUI和ElementPlus中有变化的组件属性差异的详细对比。这些变化主要集中在Vue3的适配、API优化以及新特性的引入。1.Button组件(el-button)属性名ElementUIElementPlus差异说明iconicon="el-icon-xxx":icon="IconName"ElementPlus使用Vue3的组件化图标，需引
Delta Lake的Liquid Clustering 不确定性确定你我大数据
DeltaLake的LiquidClustering（液态聚类）是一种高效的数据布局优化技术，旨在解决传统分区和Z-Order排序的局限性。它通过自动化和增量式的数据布局优化，提升查询性能并减少存储和计算成本。以下是其原理、实现方式以及实际场景中的应用解析。LiquidClustering的核心原理动态数据布局：LiquidClustering基于树形算法，优化数据文件的大小和数量，使其均匀分布。
医院数据库优化：提升性能与响应时间的关键策略 Allen_LVyingbo 数智化医院2024 数据库 oracle
一、引言在当今数智化时代，医院信息系统不仅要追踪管理伴随人流、财流、物流所产生的管理信息，还应支持以病人医疗信息记录为中心的整个医疗、科学、科研活动，提高整个医院的运作效率。但随着信息化系统积累数据的增长，特别是病历数据、PACS影像文件相关信息和CA数字签名数据量的增大，对有限的计算机处理能力和存储容量构成了重大影响。使数据库系统容易出现死锁，从而造成客户工作站发生停顿死机，影响门诊收费、取药、
Java 大视界 -- Java 大数据机器学习模型的可解释性增强技术与应用（107）青云交大数据新视界 Java 大视界大数据 java 可解释性 AI SHAP LIME 因果推理可视化交互
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，Django@Python2.x 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f