菜=原罪

CMU 15-213 CSAPP (Ch1~Ch3)

视频链接
课件链接
该视频课程使用 64位编译器！
本文使用编译器从Ch.3.6开始换到64位，因此3.6之前地址为4字节，之后为8字节！

Ch1.计算机系统漫游

C编译(ccl)与链接(ld)
Switch是否总时比if-else高效?
while循环总比for循环高效么?
指针引用比数组高效么?
函数的本地临时变量为什么比入参的引用更高效?
算数表达式的括号也能影响运算速度?

Ch2.信息的表示和处理

Integer – 补码与符号位

负数“补码”可视化

事实上，有符号数（two’s complement，补码）的符号位，是具有权重的，只不过需要取反，如-2表示为 $1111,1110=\red {-2^7}+\sum_{\red {w=1}}^{w=6}2^w+0*2^{\red {w=0}}=-2$
“unsigned and singed numbers have same bit pattern，just a bunch of bits to computer itself.”

//sizeof return unsigned int, cast a into unsigned, you got stuck forever
for(int a=1;a-sizeof(a)>=0;a--)
//so be care of unsigned "i" used for array in case a[i]
//i=0; i--=UMAX; a[i] may cause out of bounds
int main()
{
    unsigned int a=numeric_limits<unsigned int>::max();
    int b=-1;
    unsigned int c=-3;
    cout<<(int)a<<" "<<a<<endl;  //-1 4294967295
    cout<<(b==a?"True":"Flase")<<endl; //True
    cout<<(b>a?"True":"Flase")<<endl; //Flase
    cout<<std::hex<<c<<" "<<-c<<" "<<c+(-c)<<endl; //fffffffd 3 0
    cout<<std::hex<<b<<"\n"<<numeric_limits<int>::max()<<endl; //ffffffff 7fffffff 
    cout<<b+numeric_limits<int>::max()<<endl; //7ffffffe
    return 0;
}

符号位扩展/截断

$-0\times2^{3}+1\times2^{2}+1\times2^{1}+0\times2^{0}=6$
$-1\times2^{3}+1\times2^{2}+1\times2^{1}+0\times2^{0}=-2$
$\red{-1\times2^{4}+1\times2^{3}}+1\times2^{2}+1\times2^{1}+0\times2^{0}=-2$
符号位左移填充， $\red{-1\times2^{n+1}+1\times2^{n}}=-1\times2^{n}$ “负权重”不变

Floating point – IEEE 754

Numerical Form

$(-1)^{s}M\times2^{E}$

precision	sign field	exp field	frac field
value	s	exp	frac
single	1 bit	k = 8 bit	23 bit
double	1bit	k = 11 bit	52 bit

Extended precision 英特尔特用 | 1 bit |15 bit | 64 bit
共10字节，对齐16字节，因此后6字节为空

Normalized Values

$\neq 000...0$ or $111...1$

$E = exp - bias =exp - (2^{k-1}-1)$
$M = 1.xx...x_2$

Why bias $2^{k-1}-1$ , not $2^{k-1}$ ?

Denormalized Values

$e x p = 000...0$

$E = 1 - bia s$
$M = 0.xx...x_2$

	s	exp	frac	represent
denorms	0	0000,0000	11…1	$2^{-126}\times(2^{-1}+...+2^{-23})=2^{-126}\times(1-2^{-23})$
norms	0	0000,0001	00…0	$1.0\times2^{-126}$
将"1.00…0"移位成 $0.1\times2^{1}$ ，并将 $2^1$ "隐藏"至E中，因此 $E=1-bias\red\neq 0-bias$
从而实现了从 $2^{-126}$ 到 $2^{-127}$ ，从 $DENORM_{max}$ 到 $NORM_{min}$ 的平滑过渡，使浮点数如无符号整型+1进位！
非标准化值最高精度 $=0,00000000,000...01=1\times2^{\red{-126-23}}=2^{-149}$

使用非标准化浮点可以表示更接近“0”的小数，越靠近0，E越小分辨率越高，数与数间距越小

Special Values

	exp	frac	meaning
$+\infin$	111…1	000…0	overflows
NaN	111…1	$\red\neq$ 000…0	no feasible answer

$1.0/-0.0=-\infin$
$\sqrt{-1}=\infin - \infin =\infin \times 0 =NaN$

Special Properties of IEEE Encoding

Using unsigned Integer Comparison，Except NaN
Round to fit limited “frac field”.（ especially addition and multiplication）， IEEE use Nearest Even. 二进制中，末尾0为偶，1为奇

Round to nearest $2^{-2}$ ，watch out nearsest right bit（ $2^{-3}$ in this case）

value binary Note Rounded Rounded Value

$\frac{3}{32}$ $10.00\red{0}11_{2}$ $0.00011<2^{-3}$ $10.00_{2}$ 2

$2\frac{3}{16}$ $10.00\red{1}10_{2}$ $0.00110>2^{-3}$ $10.01_{2}$ $2\frac{1}{4}$

$2\frac{7}{8}$ $10.11\red{1}00_{2}$ $0.00100=2^{-3}$
got odd (10.11) if drop >it $10.111_{2}+0.001_{2}=11.00_{2}$ $3$

$2\frac{5}{8}$ $10.10\red{1}00_{2}$ $0.00100=2^{-3}$
got even (10.10) if drop >it $10.101_{2}-0.001_{2}=10.10_{2}$ $2\frac{1}{2}$

value	binary	Note	Rounded	Rounded Value
$\frac{3}{32}$	$10.00\red{0}11_{2}$	$0.00011<2^{-3}$	$10.00_{2}$	2
$2\frac{3}{16}$	$10.00\red{1}10_{2}$	$0.00110>2^{-3}$	$10.01_{2}$	$2\frac{1}{4}$
$2\frac{7}{8}$	$10.11\red{1}00_{2}$	$0.00100=2^{-3}$ got odd (10.11) if drop >it	$10.111_{2}+0.001_{2}=11.00_{2}$	$3$
$2\frac{5}{8}$	$10.10\red{1}00_{2}$	$0.00100=2^{-3}$ got even (10.10) if drop >it	$10.101_{2}-0.001_{2}=10.10_{2}$	$2\frac{1}{2}$

Addition is Commutative but not associative（可交换，无结合）

$(3.14 + 1 e 10) - 1 e 10 = 1 e 10 - 1 e 10 = 0$
$3.14 + (1 e 10 - 1 e 10) = 3.14 + 0 = 3.14$

Additive inverse （存在相反数，带符号位相加和为0）except for infinities and NaN
Multiplication Commutative but not Associative

$(1e20*1e20)*1e-20=\infin * 1e-20=\infin$
$1 e 20 * (1 e 20 * 1 e - 20) = 1 e 20 * 1 = 1 e 20$
$d_{min}<0$ ， $d_{min}*2 =overflow < 0$ #负数溢出也小于0

[Key] keep dynamic range in your mind while adding or multiplying floating point.
类型转换改变位(值)，如浮点转整型，直接Truncates fractional part（round toward zero）.

#include 
#include 
using namespace std;
int main()
{
    int x=0x7FFFFFFF;
    float f=0.0;
    double d=0.0;
    cout<<"int(x):"<<x<<endl<<"float(x):"<<(float)x<<endl;
    cout<<((x==(int)(float)x)?"True":"False")<<endl;//返回True，可能有编译器优化
    f=(float)x;//float仅23个有效位，x中最后9位被round掉
    cout<<((x==(int)f)?"True":"False")<<endl; //返回False
    return 0;
}

Data Lab

Ch3.Machine Level Programming

3.1 x86

Intell x86（字母“x”86，不念“叉86”）

date Transistors MHz feature

8086 1978 29K 5-10 First 16-bit microprocessor,1MB addr space
Slight vatiation was a basis for IBM pc

8286

8386 1985 275K 16-33 32bit + “flat addressing”=> Unix capable
IA32（Intell Architecture 32）

Pentium 4E 2004 125M 2800-3800 First x86-64
power consumption 100W
power budget problem

Core 2 2006 291M 1060-3500 First multi-core Inter processor

Core i7 2008 731M 1700-3900 4 cores — shark machine

1980s，RISC vs. CISC.（Reduced instruction set computer）

	date	Transistors	MHz	feature
8086	1978	29K	5-10	First 16-bit microprocessor,1MB addr space Slight vatiation was a basis for IBM pc
8286
8386	1985	275K	16-33	32bit + “flat addressing”=> Unix capable IA32（Intell Architecture 32）
Pentium 4E	2004	125M	2800-3800	First x86-64 power consumption 100W power budget problem
Core 2	2006	291M	1060-3500	First multi-core Inter processor
Core i7	2008	731M	1700-3900	4 cores — shark machine
1980s，RISC vs. CISC.（Reduced instruction set computer）

Desktop Mode	Server Model
4 cores	8 cores
Integrated graphics	Integrated I/O
3.3-3.8 GHz	2~2.6 GHz
65W	45W

Advanced Micro Devices

years	Intell	AMD
2001	A little bit slower for a lot cheaper	Itanium /aɪˈteɪniəm/ 安腾Arch = IA64 too ideally， disappointing
2003	Come up with x86-64, or called “AMD64”	Insisting focus on IA64
2004		EM64T（almost identical to x86-64） lots of code still run in 32 bit mode.
Cross license allows AMD to produce x86 processors.

Acorn Risc Machine

Sufficiently simple and could be customized（个性化）.
Lower power requirement than x86 machine.
Sell companies the rights (Intellectual property) to use their designs,not chips.

Definitions

terminology	definitions	Examples
Architechture or ISA	Instruction Set Architecture The parts of a processor design that one needs to understand or write machine code.	Instruction Set Specification，Registers.
Microarchitecture	Implementation of the architecture ISA is the abstraction helps hardware people design	Cache sizes and core frequency.
Machine Code	Byte-level programs that processor executes
Assembly Code	Text version of machine code

3.2 Machine Code View

There is no way (or instructions) you can directly access or manipulate cache.

addresses data instructions

CPU

Registers

Condition Codes

Memory

Code

Data

Stack

PC：Program counter
Address of next instruction
Called “RIP”（x86-64）
Register file
Heavily used program data
Condition codes
Store status information about most recent arithmetic or logical operation
Used for conditional branching
Memory
Byte addressable array
Code and user data
Stack to support procedures

以之前的浮点实验为例
调用gcc 实际间接调用了一系列（a sequency of program）进程
Options starting with -g, -f, -m, -O, -W, or --param are automatically
【-O】Do optimization
【-Og】Use debug level optimizations to makethe code readable
【-O2】The most common optimization level

Instruction	Function	output
g++ -E *.cpp	Preprocess only	*.i
g++ -Og -S *.cpp	“Stop” after compile	*.s
g++ -c *.s	Compile to get assemblely code	*.o
g++ *.o	Link and get excutable program	*.exe、a.out
objdump -d *.exe	disassemble binary excutable program	*.s

Period indicates “not instructions” but information needs by debuger、linker and so on.

3.3 Machine-Level Programming I：Basics

Disasemble by gdb

#include 
using namespace std;
int main()
{
    cout<<"hello world\n";
    return 0;
}

>gdb .\*.exe
>(gdb) disassemble main
Dump of assembler code for function main:
   0x00401460 <+0>:     push   %ebp
   0x00401461 <+1>:     mov    %esp,%ebp
   0x00401463 <+3>:     and    $0xfffffff0,%esp
   0x00401466 <+6>:     sub    $0x10,%esp
   0x00401469 <+9>:     call   0x401a30 <__main>
   0x0040146e <+14>:    movl   $0x405065,0x4(%esp)
   0x00401476 <+22>:    movl   $0x408254,(%esp)
End of assembler dump.
>(gdb) x/3xb 0x00401466
0x401466 <main+6>:      0x83    0xec    0x10

x86-64 Integer Registers
%r* means 64bits
%e*x = %r*L （%r*x的low-order 32 bits）
why “ax，bx，ex …”? 历史沿用

Registers	Purposes
EAX	Accumulator for operands and results data
EBX	Pointer to data in the DS segment
ECX	Counter for string and loop operations
EDX	I/O pointer
ESI	Pointer to data in the segment pointed to by the DS register; source pointer for string operations
EDI	Pointer to data in the segment pointed to by the ES register; destination pointer for string operations
ESP	Stack pointer (in the SS segment)
EBP	Pointer to data on the stack (in the SS segment)，or called base pointer

详见 Intel SDM 下载地址

movq Src, Dest

“q” for “quad word” (64bits，Intell terminology)
“l” for “long word” (32bits)
“word” for 16 bits (8086)

Src Types	Example	Dest	C analog（treat reg as var）
Immediate	$0x400	Reg，Mem	temp = 0x4; *p=0x4;
Register	%rax，%r13	Reg，Mem	temp2 = temp1;*p=temp;
Memory	(%rax)	Reg	temp = *p;
Memory Dereference

Normal Form

movq (Reg)，[Reg/Mem]

location in Memory，Address = register value

C type	Machine Level

void swap(long *xp,long *yp)
{
long t0 = *xp;
long t1=*yp;
*xp=t1;
*yp=t0;
}|

swap:
movq (%rdi), %rax
movq (%rsi), %rdx
movq %rdx, (%rdi)
movq %rax, (%rsi)
ret >* [Arguments always come in (at most 6) specific registers in orders]()：rdi，rsi，... >* [Register Allocation algorithm？]()

Displacement

movq Disp(Reg)，[Reg/Mem]

location in memory，Address = value in Reg + const Disp

Most General/Elaborate Form

movq Disp(Rb，Ri，Scale)，Reg/Mem

location in memory，Address = Rb + Scale*Ri + Disp

leaq Src，Dst

Load Effective Address = ampersand(&) operation in C
Preety handy way to do arithmetic and C compiler likes to use it.
Src would be memory refrence.
Dest has to be register，store the address computed from Src， not value.

long m12(long x)
{
    return 12*x;
}

//g++ -S *.cpp
__Z3m12l:
	movl	%edx, %eax
	addl	%eax, %eax
	addl	%edx, %eax
	sall	$2, %eax
	popl	%ebp
	ret
//g++ -Og -S *.cpp
__Z3m12l:
	movl	4(%esp), %eax
	leal	(%eax,%eax,2), %edx //x+x*2 ==> dx
	leal	0(,%edx,4), %eax //(x+x*2)*4 ==> ax
	ret
//lecture
	leal	(%eax,%eax,2), %edx //x+x*2 ==> dx
	sall	$2, %edx //(x+x*2)<<2 ==> ax
	ret

Other Instructions

Two Operand

Format	Computation in C form
addq Src, Dest	Dest = Dest + Src
subq Src, Dest	Dest = Dest - Src
imulq Src, Dest	Dest = Dest * Src
salq Src, Dest	Dest = Dest << Src (=shlq)
sarq Src, Dest	Dest = Dest >> Src (Arithmetic)
shrq Src, Dest	Dest = Dest >> Src (Logical)
xorq Src, Dest	Dest = Dest ^ Src
andq Src, Dest	Dest = Dest & Src
orq Src, Dest	Dest = Dest \| Src

One Operand

Format	Computation in C form
incq Dest	Dest = Dest + 1
decq Dest	Dest = Dest - 1
negq Dest	Dest = -1 * Dest (negate 取反)
notq Dest	Dest = ~ Dest (tilde “~” not exclamation “!”)
sarq Src, Dest	Dest = Dest >> Src (Arithmetic)
shrq Src, Dest	Dest = Dest >> Src (Logical)
xorq Src, Dest	Dest = Dest ^ Src
andq Src, Dest	Dest = Dest & Src
orq Src, Dest	Dest = Dest \| Src

3.4 Machine-Level Programming II：Control

So far the registers we should know

Temporary data ：%rax…%rdx，%rsi，%rdi，%r8~%r15…
Location of runtime stack：
%rsp（stack pointer）

%rbp（base pointer）
…
Location of current control ：%rip（instruction pointer）…
Status of recent tests：CF，ZF，SF，OF…Total 8 of them

Condition codes

All of them is one bit flag, get or set not directly but as a side effect of other operation.

Registers	name to memorize	set if
CF	Carry Flag	carry out from most significant bit （unsigned overflow）
ZF	Zero Flag	Dest == 0
SF	Sign Flag	Dest<0（as signed）
OF	Overflow Flag	two’s-complement（signed）overflow a>0，b>0，a+b<0 a<0，b<0，a+b>0 a*b<0，can’t overflow
Attention！ Lea 不影响标志位！

各指令对标志位的影响

cmpq Src2，Src1

Do substraction （Src1 - Src2），and set 4 flags above，but do nothing（like store in Dest）with the result

Src1-Src2	CF	ZF	SF	OF

0|0|0|0|0
=0|0|1|0|0
(unsigned) cmpq 2，1|1|0|1|0
(signed) cmpq 2，1|1|0|1|0
(signed) cmpq INT_MAX，INT_MIN|0|0|0|1

小实验

//test.cpp
#include 
using namespace std;
int main()
{
   unsigned int ua=1;
   unsigned int ub=2;
   unsigned int uc=0;
   uc=ua-ub;
   return 0;
}

g++ -g -DEBUG test.cpp #-g 保留行号
gdb a.exe
(gdb) list #打印行号
(gdb) break 9 #在return前设置断点
(gdb) run #运行并停在第一个断点
(gdb) info registers eflags
eflags 0x297 [ CF PF AF SF IF ] #中括号内Condition Code被置1

个人理解，只要符号位进位，CF便会 set

Src1+Src2|binary form|result|flags
-|-|-|-|-
$\frac {INT\_MIN}{2} + \frac {INT\_MIN}{2}$ |1100…00
+1100…00|(1)10…00|CF=1，SF=1，OF=0
$\frac {INT\_MIN}{2} + \frac {INT\_MIN}{2} - 1$ |1100…00
+1100…00
+1111…11|(1)011…1|CF=1，SF=0，OF=1
负+负=正 overflow

testq Src2，Src1

Like computing a & b without setting destination.
testq Src1, Src2 = Computing（Src1 & Src2） set eflags

SetX Instructions

Set low-order byte of destination to 0 or 1 based on combinations of condition codes，without changing remaining 7 bytes.

Setx	Condition	set True if last result
sete	ZF	=0
setne	~ ZF	$\neq 0$
sets	SF	<0
setns	~ SF	>=0
setg	~ （SF ^ OF）& （~ ZF）	> (signed)
setge	~ （SF ^ OF）	>= (signed)
setl	（SF ^ OF）	< (signed)
setle	（SF ^ OF）\| ZF	<= (signed)
seta	~CF & ~ZF	Above (unsiged)
setb	CF	Below (unsigned)

举例：

bool mycmp(long a,long b)
{
    return a>b;
}

mycmp:
	movl	8(%esp), %eax
	cmpl	%eax, 4(%esp)
	setg	%al
	#movzbq	%al, %eax	#move with zero extension byte to quad
	ret

x86-64’s（AMD）weird quirks
If result is 32 bits，remaining 32 bits will be zeroed，but other-length data type instruction won’t.

Jumping

jmp、je、jne、js、jns、jg、jge、jl、jle、ja、jb, same as setX.
举例：

 long abs(long x,long y)
 {
		long result;
		if(x>y)
			result = x-y;
 		else
 			result = y-x;
 		return result;
}

>gcc -Og -S -fno-if-conversion test.cpp
abs: # only exist in assembly code，changing into address in object code
	movl	4(%esp), %edx #x
	movl	8(%esp), %eax #y
	cmpl	%eax, %edx # y, x
	jg	L14
	subl	%edx, %eax # y-x
	ret
L14:
	subl	%eax, %edx # x-y
	movl	%edx, %eax
	ret

Conditional Moves

指令重排：if-else两个分支结果都计算，最后再选择结果返回.

形如 if(test) Dest = Src，straightly simple computations.
95后 x86 processors支持.
safe and no side effects.

>gcc -Og -S test.cpp #去掉-fno-if-conversion，gcc 默认允许指令重排
abs:
	movq	%rdi, %rax #x
	subq	%rsi, %rax #x=x-y
	movq	%rsi, %rdx #y
	subq	%rdi, %rdx #y=y-x
	cmpq	%rsi, %rdi #x-y
	cmovle	%rdx, %rax #if(x<=y)ret(y-x)
	ret				   #result in %rax

Why：Branches are very disruptive to instruction flow through pipelines，Wasteful but more efficient.
See：pipelining、branch prediction.
只要branch prediction足够准确（98%），“管线“执行效率就会很高（提前20条指令）。
预测错误，回头重算，最多花费40时钟周期。
（gcc主动）避免进行指令重排的情况

Expensive Computations in either branch.（如找质因数）
Risky Computations.（value = p ? (*p) : 0 ; //如判断合法性）
Computations with side effects. （value = x>0 ? x*=7 : x+=3; //如都会改变X本身的值）

Loops

“Do-While” Loop

long popcount(unsigned long x)
{
 	long res=0;
    do
    {
        res += x & 0x1;
        x >>= 1;
    }while(x);
    return res;
}

popcount:
	movl	4(%esp), %edx
	movl	$0, %eax
L12:
	movl	%edx, %ecx
	andl	$1, %ecx
	addl	%ecx, %eax
	shrl	%edx
	jne	L12
	ret

“While” Loop
Test at the very beginning and skip the loop if condition doesn’t hold.

long popcount(unsigned long x)
{ ... while(x){...} ... }

popcount:
	movl	4(%esp), %edx # x
	movl	$0, %eax
L13:
	testl	%edx, %edx
	je	L11
	movl	%edx, %ecx
	andl	$1, %ecx
	addl	%ecx, %eax
	shrl	%edx
	jmp	L13
L11:
	ret

“For” Loop
for( Init; Test; Update)
body;
Semantics =
Init;
while(Test)
{ Body; Update; }

long popcount(unsigned long x)
{
 	size_t i=0;
    long res=0;
    for(i=0;i<32;i++)
    {
        res += x & 0x1;
        x >>= 1;
    }
    return res;
}

>g++ -Og -S test.cpp
popcount:
	pushl	%ebx
	movl	8(%esp), %ecx 	# x
	movl	$0, %eax		# res=0
	movl	$0, %edx 		# i=0
L13:
	cmpl	$31, %edx 		# i>31
	ja	L11 				# return
	movl	%ecx, %ebx		
	andl	$1, %ebx		# x & 1
	addl	%ebx, %eax		# res += i
	shrl	%ecx			# x >>= 1
	addl	$1, %edx		# i += 1
	jmp	L13
L11:
	popl	%ebx
	ret

提升编译优化等级-O1，无需initial test，转换为"do-while"循环。

>g++ -O1 -S test.cpp
popcount:
	...
	movl	$32, %edx
	movl	$0, %eax
L4:
	movl	%ecx, %ebx
	...
	shrl	%ecx
	subl	$1, %edx
	jne	L4
	...

首次test非真，无循环。

popcount:
	movl	$0, %eax
	ret

Switch Statements

条件变量必须是“整型“.
通过“Jump Table”的形式，将分支入口地址，按Case-Value大小排序，记录成表.
较紧凑随机访问，时间复杂度O(1).

long switch_try(unsigned long x)
{
    long res=0;
    switch (x)
    {
        case 1:
            res += 1;
            break;
        case 2:
            res += 2;
        case 3:
            res *= 3;
            break;
        case 5:
        case 4:
            res -=1;
            break;
        case -1:
            res *= -1;
            break;
        default:
            res = 100; 
    }
    return res;
}

switch_try:
	movl	4(%esp), %eax 	# x
	leal	1(%eax), %edx 	# case -1负数的情况，通过+偏置1转化为无符号数
	cmpl	$6, %edx		# case 中最大值5，偏置后为6
	ja	L12					# 小技巧
							# 用ja比较，小于-1的负数，偏置后仍为负数
							# 在无符号数格式下，大于有符号数的正数范围，从而归属 defult
	jmp	*L14(,%edx,4)		# Indirect jump，L14+4*(x+偏置) 的单元存储的值，作为jump地址
	.section .rdata,"dr"
	.align 4
L14:						# Jump Table，compiler给结构，assembler(汇编器)填地址
	.long	L13				# need a long type value as address x=-1
	.long	L12				# x=0
	.long	L11				# x=1
	.long	L16				# x=2
	.long	L17				# x=3
	.long	L18				# x=4
	.long	L18				# x=5
	.text
L17:
	movl	$0, %eax		# x=3，res=0*3=0
L16:						# x=2，res+=2，res==x，因此res用%eax表示 有优化
	leal	(%eax,%eax,2), %eax 	# res=2*3=6
	ret						
L13:						# x=-1
	movl	$0, %eax		# res=0*(-1)=0，compiler直接优化赋值0
	ret
L18:						# x=4
	movl	$-1, %eax
	ret
L12:						# default case
	movl	$100, %eax
L11:						# x=1
	rep ret					# ja前已偏置+1，故直接返回%eax

稀疏（如 case [0、100]）退化为if-else形式，时间复杂度O(n).

long switch_try(long x)
{
    long res=0;
    switch (x)
    {
        case 1:
            res=0;
            break;
        case 100:
            res=99;
            break;
        default:
            res = -1; 
    }
    return res;
}

switch_try:
	movl	4(%esp), %eax
	cmpl	$1, %eax
	je	L13
	cmpl	$100, %eax
	je	L15
	movl	$-1, %eax
	ret
L13:
	movl	$0, %eax
	ret
L15:
	movl	$99, %eax
	ret

较稀疏使用二叉树，时间复杂度O( $log_2^{n}$ ).

Switch是否总时比if-else高效？
根据以上分析，答案是否定的
We are never happy with a simple explanation. We want to understand how we could actually implement it as a program if we ever had to do so.

3.5 Machine-Level Programming II：Procedures

ABI，Application Binary Interface，一种机器码层面的二进制程序接口协定。

Passing control
- Beginning of procedure code
- Back to return point
Passing data
- Procedure arguments
- Return value
Memory management
- Allocate during procedure
- Deallocate upon return
  One of main targets is doing whatever is omly absolutely needed.

Stack Structure

Adress	Values Meaning
High Adress	（%rbp）Stack Bottom
…
Low Adress	（ %rsp ）Stack Top

pushq Src
step 1：Fetch operand at Src（imediate or registers）.
step 2：Decrement %rsp by 8.
step 3：Write operand at address given by %rsp.

popq Dest
step 1：Read value at address given by %rsp.
step 2：Increament %rsp by 8.
step 3：Store value at Dest（must be register）.
Data at top of stack is stll there in the memory，but is no longer part of stack.

passing control

call label
step1：Push return address on stack，sp=sp-sizeof(address)
step2：Jump to label //%rip是不允许被显式操作的
ret
step1：Pop address（of next instruction right after call）from stack，sp=sp+sizeof(address)
step2：Jump to address

long sub_try(long x)
{
    return x+1;
}
long call_try(long x)
{
    return sub_try(x+1);
}

sub_try:
	movl	4(%esp), %eax
	addl	$1, %eax
	ret
call_try:
	subl	$4, %esp
	movl	8(%esp), %eax
	addl	$1, %eax
	movl	%eax, (%esp)
	call	sub_try 		# sp=sp-4; *sp=addr after call
	addl	$4, %esp
	ret

passing data

ABI规定
前6个整型入参用寄存器{ %rdi、%rsi、%rdx、%rcx、%r8、%r9 }，6个之后的参数适用栈，返回值用 %rax。

long incr(long *p,long val)
{
    long x=*p;
    long y=x+val;
    *p=y;
    return x;
}
long call_incr()
{
    long v1=15213;
    long v2=incr(&v1,3000);
    return v1+v2;
}

incr:
	movl	4(%esp), %edx	# dx=*(-28+4)=-4
	movl	(%edx), %eax  	# ax=*(-4)=15213
	movl	%eax, %ecx		# cx=ax
	addl	8(%esp), %ecx	# cx=cx+*(-20)=15213+3000
	movl	%ecx, (%edx)	# *(-4)=18213
	ret						# sp=sp+4=-24
call_incr:					# 设sp=0   <--- start
	subl	$24, %esp		# sp=-24 分配24字节空间 
	movl	$15213, 20(%esp)# *(-4)=15213
	movl	$3000, 4(%esp)	# *(-20)=3000
	leal	20(%esp), %eax	# ax=-4
	movl	%eax, (%esp)	# *(-24)=-4
	call	incr			# sp=sp-4=-28，4字节返回地址入栈
	addl	20(%esp), %eax  # ax=15213+*(-4)=15213+18213
	addl	$24, %esp		# sp=0 清空栈
	ret

浮点型入参使用一组特殊的寄存器。

函数的本地临时变量为什么比入参的引用更高效？
因为临时变量用寄存器，而引用需要解引用，或间接寻址，相对低效

必须给 Local Data 分配内存的几种情况：
- 寄存器不够用
- 对Local Variable 应用了 ‘&’（address operator），寄存器没有地址，只能用内存表示
- Local variable 是数组或结构体

Memory management

Code must be “Reentrant”
- Multiple simultaneous instantiations of single procedure
Need place to store state of each instantiation
- Arguments
- Local variables
- Return pointer

stack fame ：Each block we use for particular call。
发生调用时：

[Caller 栈帧 call 指令] sp = sp - sizeof( Addr )
[Caller 栈帧 call 指令] 将Return Addr 写入 sp 指向的栈帧尾部
[Callee 栈帧] sp = sp - frame size，分配 Calle 栈帧
[Callee 栈帧] 基于sp寻址，由高到低地址先后保存 Registers（即 Callee Save），局部变量等
[Callee 栈帧] sp = sp + frame size，准备返回 Caller
[Caller 栈帧 ret 指令] 将 sp 指向的 Return Addr 返回给 ip
[Caller 栈帧 ret 指令] sp = sp + sizeof( Addr )
[Caller 栈帧] ret 执行完毕，开始执行 Caller 返回点命令

P calls Q，Arguments > No.6存在P帧中。
大多数系统限制了栈的最大深度。
%rbp 作为 frame pointer。
某些情况下%rbp会用于记录 caller的栈帧底。
《CS:APP（Third.Ed）》英文版 P.286

void proc(long a1, long *a1p, int a2, int *a2p, short a3, short *a3p, char a4, char *a4p)
{
*a1p += a1;
*a2p += a2;
*a3p += a3;
*a4p += a4;
}
long call_proc()
{
long x1 = 1; 
int x2 = 2;
short x3 = 3; 
char x4 = 4;
proc(x1, &x1, x2, &x2, x3, &x3, x4, &x4);
return (x1+x2)*(x3-x4);
}

call_proc:				# callee save
	subq $32, %rsp 		# Allocate 32-byte stack frame
	movq $1, 24(%rsp) 	# Store 1 in &x1
	movl $2, 20(%rsp) 	# Store 2 in &x2
	movw $3, 18(%rsp) 	# Store 3 in &x3
	movb $4, 17(%rsp) 	# Store 4 in &x4
	leaq 17(%rsp), %rax # Create &x4
	movq %rax, 8(%rsp) 	# Store &x4 as argument 8
	movl $4, (%rsp)		# Store 4 as argument 7
	leaq 18(%rsp), %r9 	# Pass &x3 as argument 6
	movl $3, %r8d 		# Pass 3 as argument 5
	leaq 20(%rsp), %rcx # Pass &x2 as argument 4
	movl $2, %edx 		# Pass 2 as argument 3
	leaq 24(%rsp), %rsi # Pass &x1 as argument 2
	movl $1, %edi 		# Pass 1 as argument 1
	call proc
	movslq 20(%rsp), %rdx 	# Get x2 and convert to long
	addq 24(%rsp), %rdx 	# Compute x1+x2
	movswl 18(%rsp), %eax 	# Get x3 and convert to int
	movsbl 17(%rsp), %ecx 	# Get x4 and convert to int
	subl %ecx, %eax 		# Compute x3-x4
	cltq 				# Convert to long
	imulq %rdx, %rax 	# Compute (x1+x2) * (x3-x4)
	addq $32, %rsp 		# Deallocate stack frame
	ret 				# Return
proc:
	movq 16(%rsp), %rax
	addq %rdi, (%rsi) 
	addl %edx, (%rcx) 
	addw %r8w, (%r9) 
	movl 8(%rsp), %edx 
	addb %dl, (%rax) 
	ret

[ABI Conventions] 程序都约定俗成的遵守：
- “Caller Saved” 假设使用到的寄存器的值会被Callee覆写，Caller先保存
  %rax、%rdi、%rsi、%rdx、%rcx、%r8、%r9、%r10、%r11等
- “Callee Saved” 想用寄存器？先入栈保存，ret前先出栈，“物归原主”，Caller畅用寄存器
  %rbx、%12、%13、%14、special { %rbp、%rsp }

“Callee Saved” 的情况较多
《CS:APP（Third.Ed）》英文 P.288

long P(long x, long y)
{
long u = Q(y);
long v = Q(x);
return u + v;
}

P:
	pushq %rbp 		# Save %rbp 		| Callee-Saved
	pushq %rbx 		# Save %rbx
	subq $8, %rsp 	# Align stack frame
	movq %rdi, %rbp # Save x   			| Caller-Saved
	movq %rsi, %rdi # Move y to first argument
	call Q 			# Call Q(y)
	movq %rax, %rbx # Save result
	movq %rbp, %rdi # Move x to first argument
	call Q 			# Call Q(x)
	addq %rbx, %rax # Add Q(y) to Q(x), believe rbp not changed before & after Q 
	addq $8, %rsp 	# Deallocate last part of stack
	popq %rbx 		# Restore %rbx 注意先进后出，变量出栈反入栈顺序
	popq %rbp 		# Restore %rbp
ret

Illustration of Recursion

视频例题

unsigned long pcount_r(unsigned long x)
{
    if (x==0)
        return 0;
    else
        return (x & 1) + pcount_r(x >> 1);
}

pcount_r:
	pushl	%ebx 				# *sp = ebx; sp = sp-4;
	subl	$24, %esp			#  sp = sp-24;
	movl	32(%esp), %eax		# eax = *(sp+32) = x;
	testl	%eax, %eax			# 
	jne		L14					# if(eax != 0) goto L14;
L12:
	addl	$24, %esp			# sp = sp+24；
	popl	%ebx				# sp = sp+4; ebx = *sp; 
	ret
L14:
	movl	%eax, %ebx			# ebx = eax;
	andl	$1, %ebx			# ebx = ebx & 1;
	shrl	%eax				# eax >> 1;
	movl	%eax, (%esp)		# *sp = eax;
	call	pcount_r			#
	addl	%ebx, %eax			# eax = eax + { ebx = （x & 1）}
								# eax 并没有被push，最后一层callee返回时eax = 0
	jmp		L12
echo "eax即作为输入参数，最in的一层callee中变0后又作为输出暂存，实在是妙啊！！！"

栈帧让每次函数调用能够存储临时变量，寄存器，和返回地址；
栈的先进后出，call / return的变量保护原则，保证层层调用中的数据安全性，除非overflow；
相互递归（mutual recursion，P calls Q，Q calls P）同样适用；

3.6 Machine-Level Programming IV：Data

3.6.1 Array

对于复杂的数据结构，建议拆分用typedef多次嵌套定义，明晰结构

//声明大小为5的数组，元素是函数指针，函数入参为(int)，返回值为int指针
int *(*a[5])(int); 
//使用typedef简化声明
typedef int *(*pFun)(int);
pFun a[5];

//声明大小为5的数组，元素是A类函数指针，A类函数入参为B类函数指针，B类函数无入参，无返回值
int *(*b[5])(void(*)(void)); 
//使用typedef分两步简化声明
typedef void(*pVoidFunc)(void); //定义函数类型B
typedef int *(*pFunc)(pVoidFunc);
pFunc b[5];

注意typedef是存储类关键字(如 static、auto、mutable、register等)

typedef static int STCINT; 
>> 编译报错"一个以上的存储类"

汇编程序员期望一种看似高级语言，但又留有汇编层面灵活性、可玩性(技巧层面)，C语言诞生。
之前操作系统都是用汇编写的(=͟͟͞͞=͟͟͞͞(●⁰ꈊ⁰● |||))，Kernighan、Dennis Ritchie等人为实现灵活性，在创造C时引入了指针操作。
在继续探讨指针前需要注意：

int main()
{
    int *p=NULL;
    cout << sizeof(p)<<endl; // = 4
    return 0;
}

int类型的指针大小为4，说明并不是64位地址。使用 gcc -v 查看后醒悟使用的是32位编译器，赶紧切换64位

>> gcc -v
...
Target: x86_64-w64-mingw32
...

int main()
{
    int *p=NULL;
    cout << sizeof(p)<<endl;
    
    int a[8]={0};
    cout<<"\nsizeof(a)"<<sizeof(a)<<"\n"                // = 32
        <<"\nsizeof(a[0])"<<sizeof(a[0])<<"\n"          // = 4  a[0]=*(a+0)
        <<"\nsizeof(*a)"<<sizeof(*a)<<"\n"<<endl;       // = 4 

    int b[2][3]={0};
    cout<<"\nsizeof(b)"<<sizeof(b)<<"\n"                // = 24
        <<"\nsizeof(b[0])"<<sizeof(b[0])<<"\n"          // = 12 b[0]=*(b+0)
        <<"\nsizeof(*b)"<<sizeof(*b)<<"\n"              // = 12
        <<"\nsizeof(b[1][1])"<<sizeof(b[1][1])<<"\n"    // = 4  b[1][1]=*(b[1]+1)
        <<"\nsizeof(*b[1])"<<sizeof(*b[1])<<"\n"<<endl; // = 4   

    
    cout <<a<<"=?="<<&a<<endl;                          // 0x61fdf0=?=0x61fdf0
    cout <<b[1]<<"=?="<<b[0]<<":"<<b[1]-b[0]<<endl;     // 0x61fddc=?=0x61fdd0:3
                                           
    b[0][1]=1;
    b[1][0]=2;
    cout <<*b[1]<<endl;          // *b[1] = 2 = *(*(b+1))，说明 '[]' 优先级> '*'
    return 0;
}

二维数组的结构 = 数组{数组指针1、数组指针2、…}，而数组指针1指向数组{元素1、元素2、…}，且二维数组是一段地址连续的空间，视频里将这种数组称作 Nested array。

以下举例说明，非直接声明的二维数组，分配的空间地址并不连续，视频里将这种数组称作 Multi-level array。

int get_ele(int arr[3][3],size_t r,size_t c)
{
    return  arr[r][c];
}
int main()
{
    int a1[3]={1,2,3},a2[3]={4,5,6},a3[3]={7,8,9};
    int *(arr[3])={a1,a2,a3};

    cout<<arr[2]<<"\n"  							// 0x61fdfc
        <<arr[1]<<"\n"  							// 0x61fe08
        <<arr[2]-arr[1]<<"\n"   // -3
        <<(char*)(arr[2])-(char*)(arr[1])<<endl;	// -12

    int arr2[3][3]={0};
    cout<<arr2[2]<<"\n" 							// 0x61fdc8
        <<arr2[1]<<"\n" 							// 0x61fdbc
        <<arr2[2]-arr2[1]<<"\n" 					// 3
        <<(char*)(arr2[2])-(char*)(arr2[1])<<endl; 	// 12
    
    get_ele(arr2,1,2);
    return 0;
}

get_ele:
	leaq	(%rdx,%rdx,2), %rdx # rdx = rdx + 2*rdx = 3*rdx
	leaq	0(,%rdx,4), %rax	# rax = 4 * rdx 
	addq	%rax, %rcx      	# rcx = rcx + 12 * r
 	movl	(%rcx,%r8,4), %eax  # eax = *(rcx + j * 4)
	ret

Nested Array 和 Multi-Level Array 在汇编层面完全不同：

Nested Array 因为空间连续，只需要一次Memory Reference就能拿到元素：
$\cdot col \cdot sizeof(elem) + digit \cdot sizeof(elem))$

Multi-Level Array 需要两次Memory Reference，第一次拿数组指针，第二次拿元素：
$\cdot sizeof(pointer)) + digit \cdot sizeof(elem))$

3.6.2 Structure

编译器构建空间，处理（一段连续）地址，汇编代码不会体现；
定义决定"域"的先后顺序，不会因为对齐或紧凑而调换位置。

struct A
{
    int a[4];
    int i;
    struct A *next;
};
void set_val(struct A* pA, int val)
{
    while(pA)
    {
        pA->a[pA->i]=val;
        pA=pA->next;
    }
}

set_val:	# rcx := pA, rax := i, edx := val
L7:
	testq	%rcx, %rcx
	je		L5
	movslq	16(%rcx), %rax	# 4 byte value and do sign extension
	movl	%edx, (%rcx,%rax,4)
	movq	24(%rcx), %rcx  # 注意这里next相对A的起始地址偏移24
	jmp		L7
L5:
	ret

注意这里 next 相对 A的起始地址偏移24，是因为数据对齐，i 之后留4空字节(padding bytes)，对齐8字节。现代计算机内存通常一次取64个字节，如果存储对象因为地址没有对齐，横跨两个64字节块，将导致系统花费很多额外的步骤来"拼数据"。x86系统下没有对齐只会导致运行速度变慢，其他系统可能直接就内存错误。

结构体成员大小为 k Bytes，则该成员的起始地址应为 k 的整数倍
结构体“最大”成员 K Bytes，结构体总大小为 K 的整数倍（末尾补空字节）字段

与其声明__attribute__((packed))强制编译器不对齐，不如定义结构体"大"Field在前，"小"Field在后，来减少浪费的 Padding Bytes。
对齐只针对原始数据类型(char、short、int…)，汇编层面不存在“聚合类数据”(数组、结构体…)。

3.6.3 Floating Point

8087 – masterpiece of engineering，单个芯片，具备了实现IEEE浮点数所需的全部硬件，co-developed with IEEE浮点标准x87 FP，但编程模型实在糟糕因此被踢出了教材
SSE FP，special case use of vector instructions
AVX FP，Newest version，similar to SSE
XMM Register
{XXM0、…XXM15}共16个，每个16字节，按需可作为16个char，8个short，4个int，4个float，2个double，1个double long。虽然数据种类不同，但可以将作用这些数据的操作方法合并为一种高级的抽象实现。这些寄存器都是caller-saved。

Scalar Operation
addss = add for scalar single precision
SIMD（single instruction multiple data）Operation
addps = add for pack single precision

整型使用regular registers，浮点型使用XXM registers，当然也可以都使用XXM提高运算速度就是有点浪费。传参时整型与浮点型交错按规矩依次入座

double double_test(float *pd, float Val)
{
    float x=*(pd);
    if(Val>x)
        *pd=x+Val;
    return x;
}

double_test:
	movss	(%rcx), %xmm0
	comiss	%xmm0, %xmm1
	jbe	.L6
	addss	%xmm0, %xmm1
	movss	%xmm1, (%rcx)
.L6:
	cvtss2sd	%xmm0, %xmm0
	ret

3.6 Machine-Level Programming V：Advanced Topics

miscellaneous topics

3.6.1 Memory Layout

目前64位系统只使用了47位地址，约 $256 \times 10^{12}$ 字节约256 Terabytes。
Terabytes << Petabytes << Exabytes(Google累计信息总量) << Zettabyte(全人类信息总量)

HEX Address	Content	note
00007FFFFFFFFFFF	Stack	0x7FFFFFFFFFFF -0x7FFFFF7FFFFF = $2^{23}$ = 8M
00007FFFFF7FFFFF
	Shared Libraries	Executable machine instructions，read only

	Heap	Dynamically allocated as needed when malloc()、calloc()、new() Address moving up
	Data	Statically allocated data global vars、static vars、const string
	Text	Executable machine instructions，read only
400000

表格自2015年Slider，2020年Slider中，Shared Libraries 处于最高地址，高于Stack。

Cent OS 环境下可使用 ulimit -a 查看全部系统限制：

[root@VM-4-10-centos]# ulimit -a
core file size          (blocks, -c) unlimited
data seg size           (kbytes, -d) unlimited
scheduling priority             (-e) 0
file size               (blocks, -f) unlimited
pending signals                 (-i) 14819
max locked memory       (kbytes, -l) 64
max memory size         (kbytes, -m) unlimited
open files                      (-n) 100001
pipe size            (512 bytes, -p) 8
POSIX message queues     (bytes, -q) 819200
real-time priority              (-r) 0
stack size              (kbytes, -s) 8192
cpu time               (seconds, -t) unlimited
max user processes              (-u) 14819
virtual memory          (kbytes, -v) unlimited
file locks                      (-x) unlimited

观察分配地址：

#include 
using namespace std;
typedef int (*P1)(void);
typedef void (*P2)(void);
int global_arr[20]={0};
int global_var=0;
void stack_frame_obs()
{
    int local_arr[20]={0};
    int *pc=(int*)malloc(20);
    int *pc_last=&pc[20]; 
    
    cout<<"stack_local_arr:\t"<<&local_arr<<"\n"
        <<"stack_local_arr_last:\t"<<&local_arr[20]<<"\n"
        <<"stack_pc:\t"<<pc<<"\n"
        <<"stack_pc_last:\t"<<pc_last<<endl;
    return;
}
void memory_obs(void)
{
    int local_val=0;
    int local_arr[20]={0};
    //数组指针强转字符指针，计算最后元素地址
    int *local_arr_last=&local_arr[20]; 
    int *global_arr_last=&global_arr[20];

    int *pc=(int*)malloc(20);
    int *pc_last=&pc[20]; 

    stack_frame_obs();

    cout<<"local_val:\t"<<&local_val<<"\n"
        <<"local_arr:\t"<<&local_arr<<"\n"
        <<"local_arr_last:\t"<<local_arr_last<<"\n"
        <<"pc:\t"<<pc<<"\n"
        <<"pc_last:\t"<<pc_last<<"\n"
        <<"global_var:\t"<<&global_var<<"\n"
        <<"global_arr:\t"<<global_arr<<"\n"
        <<"global_arr_last:\t"<<global_arr_last<<endl;
    return;
}
int main()
{
    memory_obs();
    P1 pfunc1=main;
    P2 pfunc2=memory_obs;
    cout<<"Main:\t"<<(void *)pfunc1<<endl;
    cout<<"Memory_obs:\t"<<(void *)pfunc2<<endl;
    return 0;
}

Cent OS 结果

[root@VM-4-10-centos]# ./a.out
stack_local_arr:        0x7ffe44a783d0
stack_local_arr_last:   0x7ffe44a78420 	// 栈地址始终高于堆地址
stack_pc:       		0x8abf10       	// 地址高于pc，堆按需分配，地址递增
stack_pc_last:  		0x8abf60
local_val:      		0x7ffe44a7849c
local_arr:      		0x7ffe44a78440 	// 地址高于stack_local_arr，栈帧地址递减
local_arr_last: 		0x7ffe44a78490
pc:     				0x8abeb0       	// 堆内、栈帧内数组元素地址递增
pc_last:        		0x8abf00       	// < stack_pc= 0x8abf10
global_var:     		0x6021d0
global_arr:     		0x602180
global_arr_last:        0x6021d0
Main:   				0x400bde
Memory_obs:     		0x4009f1     	//text 可执行指令始终处于最低地址

Win64 环境下堆地址居然高于栈地址？Whatever

>>PS C:Users> .\a.exe
stack_local_arr:        0x61fcb0
stack_local_arr_last:   0x61fd00
stack_pc:       		0xec1680
stack_pc_last:  		0xec16d0
local_val:      		0x61fdac
local_arr:      		0x61fd50
local_arr_last: 		0x61fda0
pc:     				0xec1620
pc_last:        		0xec1670
global_var:     		0x408090
global_arr:     		0x408040
global_arr_last:        0x408090
Main:   				0x40182f
Memory_obs:     		0x401656

3.6.2 Buffer Overflow

Exceeding the memory size allocated for an array，potentially that risk of being a vulnerability.
Most come from (culprit)

Unchecked lengths on string inputs，worst one ⇒ gets()
Particularly for bounded character arrays on stack

gets()编写于1970s，UNIX刚发行，那时人们还不怎么考虑安全问题。

// kind of implementation of Unix function gets()
char *gets(char *dest)
{
	int c = getchar(); //EOF 应该是整型，char可能不够大
	char *p = dest;
	while(c! = EOF && c !='\n')
	{
		*p++ = c;
		c = getchar();
	}
	*p='\0';
	return dest;
}

Others like strcpy、strcat、scanf(%s)、sscanf、fscanf，they all have no idea what limit is on number of characters to read. Typically，return address should be overwrite first.

Code Injection Attacks

Input sting contains byte representation of executable code
Overwrite return address A with address of buffer B
When callee return，exploit code injected within gets() will be executed.

二进制层面的注入，与SQL数据库注入不同。

Original “Morris worm” (1988)

finger user@host
finger 命令使用 gets() 接收信息
finger “exploit-code padding new-return-address”，exploit-code = excuted root shell on victim machine with a direct TCP connection to the attacker.
CERT computer emergency response team 就此成立并安家CMU

“IM wars” (1999)

AOL 聊天软件客户端存在注入漏洞，AOL注入测试PC是不是Microsoft平台，达到 Block MS 的目的，More than 10 skirmishes between MS and AOL

Twilight hack on wii (2000s)
…

Worms and Viruses

Worm
- Run by itself
- Propagate a fully working version of itself to other computers
Virus
- Adds itself to other programs
- Does not run independently，work as changing behavior of program

Protection

Avoid overflow vulnerabilities
- fgets() instead of gets()
- strncpy() instead of strcpy()
- scanf(“%ns”) instead of scanf(“%s”)
Employ system-level protections
- ASLR，Address Space Layout Randomization，随机分配栈大小
- Nonexecutable code segments，硬件工程师配合实现，显式指定内存段可执行权限（AMD 先行，Intell跟上）
Stack Canaries (使用这种策略都可以叫 “xx金丝雀”，名字来源美国早期煤矿工人带雀下矿)
- 栈上缓冲区(Buffer)尾部接常量，ret前检查这个常量是否被改动
- GCC implementation，-fstack-protector（default，但gcc 8.4.1实验中没有发现Canary保护）

Return Oriented Programming

首先说明，这种攻击方式依旧无法破解Canary校验，但可以避开ASLR和堆栈执行权限限制。利用被攻击者代码，如stdlib库函数，地址相对确定，内容相对确定。核心思想：找 Gadget，拼接一系列 gadget 指令序列，完成完整的攻击任务。

假设 ret_orit 是一个库函数

int ret_orit(int a,int b)
{
    return a+b;
}

0000000000401596 <ret_orit>:
  401596:	8d 04 11             	lea    (%rcx,%rdx,1),%eax
  401599:	c3                   	retq

Gadget address = 0x401596，完成了 %eax = %rcx + %rdx 动作。
有趣的是，在X86架构中，ret指令以 0xc3 结尾，那就很容找到这些片段的位置了。
假设我们始终取 0xc3 的前三个字节凑指令：

void ret_orit(int *p)
{
    *p=0x11048d22;
    return;
}

0000000000401596 <ret_orit>:
  401596:	c7 01 22 8d 04 11    	movl   $0x11048d22,(%rcx)
  40159c:	c3                   	retq

Gadget address = 0x401599，三个字节0x8d、0x04、0x11同样完成了 %eax = %rcx + %rdx 。

“Just match the byte patterm of some existing code.”

有了前两种方法，剩下只需要组合这些 Gadget：

Address	Content
stack	address of Gadget n code
…	…
%rsp	address of Gadget 1 code (used to be callee return address)
通过缓冲区溢出，将callee return address 及其后的所有地址，依次替换为 Gadget 的地址，则跳转执行 Gadget 命令后，Gadget 最后的 ret 指令又使得 %rip 从 %rsp - 8 取下一条 Gadget 的地址，再 ret，再跳转 … 直到完成攻击。

3.6.3 Unions

A way to ceate an alias that will let you refrence memory in different ways.
联合体并不改变实际位，只改变解读位的方式。

#include 
#include 
using namespace std;
typedef union{
    int a;
    float b;
}i_a_f;
int main()
{
    i_a_f t;
    t.a=1;
    float b=t.a;
    cout<<"\nunion(int):"<<t.a	// union(int):1
        <<"\nunion(float):"<<t.b// union(float):1.4013e-45
        <<"\ncast:"<<b;			// cast:1
    return 0;
}

通过 Union 很容易了解到机器的 Byte Ordering
Big Endian 最大的在尾端（地址最低）
Little Endian 最小的在尾端（地址最低）x86、ARM、IOS
Bi Endian 大小端都行

你可能感兴趣的:(操作系统,操作系统,CSAPP)

有必要获得WHQL测试认证吗，有什么好处？
什么是WHQL认证？WHQL是MicrosoftWindowsHardwareQualityLab的缩写，中文意思是Windows硬件设备质量实验室，主要是对Windows操作系统的兼容性测试，检验硬件产品和驱动程序在windows系统下的兼容性和稳定性。当某一硬件或软件通过WHQL测试时，制造商可以在其产品包装和广告上使用“DesignedforWindows”标志。该标志可以证明硬件或软件已经
WHQL签名怎么申请 GDCA SSL证书 windows
WHQL（WindowsHardwareQualityLabs）签名是微软对硬件和驱动程序进行认证的一种方式，以确保它们与Windows操作系统的兼容性和稳定性。以下是申请WHQL签名的基本步骤，供您参考：1.准备阶段准备硬件设备和驱动程序：确保您的硬件设备已经准备好，并且对应的驱动程序已经经过充分的测试，能够在各种配置和环境下正常工作。获取EV代码签名证书：根据微软的要求，驱动程序进行WHQL认
上位机知识篇---SD卡&U盘镜像
常用的镜像烧录软件balenaEtcherbalenaEtcher是一个开源的、跨平台的工具，用于将操作系统镜像文件（如ISO和IMG文件）烧录到SD卡和USB驱动器中。以下是其使用方法、使用场景和使用注意事项的介绍：使用方法下载安装：根据自己的操作系统，从官方网站下载对应的安装包。Windows系统下载.exe文件后双击安装；Linux系统若下载的是.deb文件，可在终端执行“sudodpkg-
Linux操作系统磁盘管理 CZZDg linux 运维服务器
目录一.硬盘介绍1.硬盘的物理结构2.CHS编号3.磁盘存储划分4.开机流程5.要点6.磁盘存储数据的形式二.Linux文件系统1.根文件系统2.虚拟文件系统3.真文件系统4.伪文件系统三.磁盘分区与挂载1.磁盘分区方式2.分区命令3.查看与识别命令4.格式化命令5.挂载命令四.LVM逻辑卷1.概述2.管理命令五.磁盘配额1.概述usrquota:支持对用户的磁盘配额grpquota：支持对组的磁
玩转Docker | 使用Docker部署gopeed下载工具心随_风动玩转Docker docker 容器运维
玩转Docker|使用Docker部署gopeed下载工具前言一、gopeed介绍Gopeed简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署gopeed服务下载镜像创建容器检查容器状态检查服务端口安全设置四、访问gopeed应用五、测试与下载六、总结前言在当今信息爆炸的时代，高效地获取和管理网络资源变得尤为重要。无论是下载大型文件还是进行日常的数据传输，一个稳
Docker容器底层原理详解：从零理解容器化技术 Debug Your Career 面试 docker 容器 docker java
一、容器本质：一个“隔离的进程”关键认知：Docker容器并不是一个完整的操作系统，而是一个被严格隔离的进程。这个进程拥有独立的文件系统、网络、进程视图等资源，但它直接运行在宿主机内核上（而虚拟机需要模拟硬件和操作系统）。类比理解：想象你在一个办公楼里租了一间独立办公室（容器）。你有自己的桌椅（文件系统）、电话分机（网络）、门牌号（主机名），但共享整栋楼的水电（宿主机内核）和电梯（硬件资源）。办公
Python uWSGI 安装配置 AI老李 python python 开发语言
关键要点uWSGI安装和配置适合PythonWSGI应用，资源丰富，适合初学者和中级用户。推荐菜鸟教程和官方文档，涵盖Linux和Windows环境。配置需注意操作系统差异和框架（如Django、Flask）需求。安装步骤uWSGI安装通常通过pip或源码编译完成。以下是基本步骤：Linux：安装依赖（如build-essentialpython-dev），然后用pipinstalluwsgi或编
上位机知识篇---常见的文件系统
文件系统是操作系统用于管理和组织存储设备上文件的机制，它决定了文件的存储方式、命名规则、访问权限、数据结构等。以下是常见的文件系统及其应用场景、优势和劣势的详细介绍：一、Windows常用文件系统1.FAT32（FileAllocationTable32）基本特点：采用32位文件分配表，是FAT系列的升级版，支持最大单文件4GB，最大分区容量理论上为8TB（实际常用2TB以内）。应用场景：U盘、存
计算机科学与技术柳依依@ 学习前端 c4前端后端
计算机科学是一个庞大且关联性强的学科体系，初学者常面临以下痛点：-**知识点零散**：容易陷入"只见树木不见森林"的学习困境-**方向不明确**：面对海量技术栈不知从何入手-**体系缺失**：难以建立完整的知识网络1.计算机基础-计算机组成原理-冯·诺依曼体系-CPU/内存/IO设备-操作系统-进程与线程-内存管理-文件系统-计算机网络-TCP/IP模型-HTTP/HTTPS-网络安全2.编程能力
Ubuntu 服务器虚拟主机,ubuntu云服务器虚拟机 Gamer42 Ubuntu 服务器虚拟主机
ubuntu云服务器虚拟机内容精选换一换通过云服务器或者外部镜像文件创建私有镜像时，如果云服务器或镜像文件所在虚拟机的网络配置是静态IP地址时，您需要修改网卡属性为DHCP，以使私有镜像发放的新云服务器可以动态获取IP地址。本节以WindowsServer2008R2操作系统为例。其他操作系统配置方法略有区别，请参考对应操作系统的相关资料进行操作，文档中不对此进行详细说明后端虚拟机绑定EIP。登录
2.4 基于dpdk的用户态协议栈的实现百亿苍狗高性能网络设计专栏开发语言网络
操作系统PosixAPI所提供的网络接口，数据收发是基于用户态与内核态的频繁切换实现。而dpdk实现了绕过内核监管，直接在用户态访问网络硬件，避免频繁状态切换。DPDK安装与配置虚拟机环境配置检查是否支持多队列网卡cat/proc/interrupts|grepens33(获取整个机器的终端)，结果19:4202120IO-APIC19-fasteoiens33，不支持多队列网卡。虚拟机关机，修改
NVIDIA 系列之使用生成式 AI 增强 ROS2 机器人技术：使用 BLIP 和 Isaac Sim 进行实时图像字幕制作知识大胖 NVIDIA GPU和大语言模型开发教程人工智能机器人
简介在快速发展的机器人领域，集成先进的AI模型可以显著增强机器人系统的功能。在本博客中，我们将探讨如何在ROS2（机器人操作系统2）环境中利用BLIP（引导语言图像预训练）模型进行实时图像字幕制作，并使用NVIDIAIsaacSim进行模拟。我们将介绍如何实现一个ROS2节点，该节点订阅摄像头源、应用BLIP模型进行图像字幕制作，并实时显示结果。这种集成展示了生成式AI在增强人机交互方面的强大功能
STM32 CubMax 6.1.1 版本安装包姜奇惟Sparkling
STM32CubMax6.1.1版本安装包【下载地址】STM32CubMax6.1.1版本安装包本仓库提供STM32CubeMX6.1.1版本的安装包，支持Linux、macOS和Windows64位系统。STM32CubeMX是STMicroelectronics推出的一款图形化配置工具，能够自动生成适用于STM32微控制器的初始化代码，极大地简化了开发流程。用户只需根据操作系统选择相应的安装包
C语言手写一个简易 DNS 客户端（Charon）服务器 linux 网络
本文聚焦讲解如何通过C语言构造并发送一个最小化的DNS请求，特别以dns_client_commit()函数为主线，带你一步步理解DNS请求的构造过程。为什么要学习DNS报文构造？我们平时在浏览器里输入一个网址（比如www.baidu.com），浏览器其实背后会通过操作系统的DNS模块发送一个查询请求，将域名解析为IP地址。而如果我们手动用C语言自己构造DNS请求，我们可以更深刻地理解底层网络通信
操作系统级TCP性能优化：高并发场景下的内核参数调优实践 Edingbrugh.南空运维 tcp/ip 性能优化网络协议
在高并发网络场景中，操作系统内核的TCP/IP协议栈配置对系统性能起着决定性作用。本文聚焦操作系统层面，深入解析内核参数调优策略，帮助读者构建稳定高效的网络通信架构。一、连接管理参数优化：从三次握手到队列控制1.1监听队列与半连接管理1.1.1net.core.somaxconn-监听套接字队列上限作用：定义listen()系统调用的积压连接队列最大值，控制未接受连接的排队长度。默认值：128（L
ARM64+KylinOS环境下MySQL数据库的图文版安装步骤和故障排查 weixin_47690215 数据库 mysql
前言随着信息技术应用创新产业的快速发展，ARM64架构处理器与麒麟操作系统（KylinOS）已成为我国关键信息基础设施建设的核心组合。MySQL作为全球最流行的开源关系型数据库，在金融、政务等关键领域的国产化替代进程中发挥着重要作用。本文档针对ARM64架构与KylinOSV10SP2/SP3的深度适配需求，提供完整的MySQL8.0部署方案及故障排查体系。背景意义技术自主可控：基于华为鲲鹏、飞腾
玩转Docker | 使用Docker部署HomeBox家庭库存管理工具心随_风动玩转Docker docker 容器运维
玩转Docker|使用Docker部署HomeBox家庭库存管理工具前言一、HomeBox介绍Homebox简介主要特点主要使用场景二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署HomeBox服务下载HomeBox镜像编辑部署文件创建容器检查容器状态检查服务端口安全设置四、访问HomeBox服务访问HomeBox首页注册账号五、HomeBox使用体验总结前言随着智能家居和
玩转Docker | 使用Docker部署NotepadMX笔记应用程序心随_风动玩转Docker docker 笔记 eureka
玩转Docker|使用Docker部署NotepadMX笔记应用程序前言一、NotepadMX介绍工具简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署NotepadMX服务下载NotepadMX镜像编辑部署文件创建容器检查容器状态检查服务端口安全设置四、访问NotepadMX服务访问NotepadMX首页设置访问验证编辑笔记总结前言在如今快节奏的工作与学习中，一
mac下java的安装地址linux /usr/libexec/解释 Alien.L linux 服务器运维
在Linux系统中，/usr/libexec/目录通常包含一些不应由用户直接运行的系统服务和工具，而是由其他系统进程调用。这些工具和服务是由操作系统和软件包开发人员创建的，通常不是用户直接运行的。例如，一些守护进程和系统服务可能位于/usr/libexec/目录下，它们被设计为在系统启动时自动启动，以便在后台运行以提供某些功能或服务。通常，用户应该避免直接在/usr/libexec/目录下创建或修
【服务器】Ubuntu、CentOS、Debian、Alibaba Cloud Linux等操作系统有什么不同？
Ubuntu目标用户：Ubuntu适合初学者和对图形界面友好的用户，也适用于开发人员和需要最新软件的企业。更新策略：Ubuntu提供长期支持版本（LTS），每两年发布一次，并提供五年的支持。非LTS版本每六个月发布一次，但仅提供九个月的支持。包管理系统：使用APT包管理系统，拥有庞大的软件仓库。社区支持：拥有非常活跃的开发者社区，提供了丰富的文档和第三方资源。稳定性与创新性：在保持稳定的同时，Ub
Windows系统python安装教程 I`m 程序媛 windows python 开发语言
一、准备工作访问Python官网：打开浏览器，进入Python官网。选择安装包：在官网的下载页面，根据自己的操作系统位数（32位或64位）选择对应的安装包。大多数现代电脑都是64位的，因此选择64-bit的安装包。建议选择“StableReleases”（稳定发布版本），这些版本已经经过测试，相对稳定。二、下载与安装下载Python安装包：点击选定的安装包链接，下载Python的安装程序。运行安装
2023年最新Python安装详细教程_python自定义安装 2401_89213215 python 开发语言
1、选择python的稳定发布版本StableReleases点击进入windows操作系统对应的页面，显示python安装版本，这些python安装版本适合windows操作系统。图3-1python稳定与预发布版本图3-1左边是稳定发布版本StableReleases，右边是预发布版本Pre-releases，前者是经过测试，相对完善、稳定的版本，后者还处于测试中，可能不完善，因此，我们下载左
操作系统线程模型用户级线程内核级线程混合线程多对一模型一对一模型多对多模型 littleAirport~ hqyanyan 操作系统线程
根据操作系统内核是否对线程可感知，可以把线程分为内核线程和用户线程。名称描述用户级线程由应用程序所支持的线程实现,内核意识不到用户级线程的实现内核级线程内核级线程又称为内核支持的线程在只有用户级线程的系统内，CPU调度还是以进程为单位，处于运行状态的进程中的多个线程，由用户程序控制线程的轮换运行；在有内核支持线程的系统内，CPU调度则以线程为单位，由操作系统的线程调度程序负责线程的调度。对于多用户
【操作系统】线程 Brookty JavaEE linux java java-ee 学习服务器操作系统后端
JavaEE—线程一、进程与线程1.包含管理2.资源布局2.1公共资源2.2私有资源二、并发编程1.多线程优势1.1创建1.1.1多线程1.1.2多进程1.2通信1.2.1多线程1.2.2多进程1.3调度1.3.1多线程1.3.2多进程1.4销毁1.4.1多线程1.4.2多进程2.多进程优势2.1安全性2.1.1多进程2.1.2多线程2.2稳定性2.2.1多进程2.2.2多线程三、线程数量1.调度
IDEA远程联调Linux部署的Java项目
远程联调Linux部署的项目环境及工具Linux操作系统：[root@hl-db~]#cat/etc/os-releaseNAME="CentOSLinux"VERSION="7(Core)"端口开放状态：[root@hl-db~]#lsof-i:8086COMMANDPIDUSERFDTYPEDEVICESIZE/OFFNODENAMEjava32110root5uIPv44879980790t
NodeJS VM2沙箱逃逸漏洞分析【CVE-2023-29199】 R3s3arcm NodeJS漏洞分析 node.js 安全安全威胁分析
NodeJSVM2沙箱逃逸漏洞分析【CVE-2023-29199】简介Node.js是一个基于V8引擎的开源、跨平台的JavaScript运行环境，它可以在多个操作系统上运行，包括Windows、macOS和Linux等。Node.js提供了一个运行在服务器端的JavaScript环境，使得开发者可以编写并发的、高效的服务器端应用程序。Node.js使用事件驱动、非阻塞I/O模型来支持并发运行。它
使用HarmonyOS 5和CodeGenie辅助工具开发鸿蒙运动健康类应用的项目总结哼唧唧_ CodeGenie 运动健康 Harmony OS5 harmonyos 华为
一、项目背景与目标随着鸿蒙生态在穿戴设备、智能家居领域的快速扩展，我团队基于HarmonyOS5操作系统，开发了一款面向运动健康场景的智能应用——“Harmony健康伴侣”。项目采用华为官方推出的智能编程助手CodeGenie进行辅助开发，旨在验证CodeGenie在提升鸿蒙应用开发效率与质量方面的实际效果。二、核心功能实现该应用深度融合HarmonyOS分布式能力，支持跨设备无缝协同，主要功能包
万物智联时代启航：鸿蒙OS重塑全场景开发新生态黑巧克力可减脂鸿蒙开发鸿蒙系统
目录HarmonyOS简介：分布式操作系统，开启万物智联新时代HarmonyOS发展历程：从破局到引领核心特性：分布式技术三支柱应用场景：全场景覆盖的鸿蒙生态什么选择鸿蒙开发？技术红利与市场蓝海结语：拥抱鸿蒙，赢在万物智联起点HarmonyOS简介：分布式操作系统，开启万物智联新时代什么是鸿蒙？HarmonyOS（鸿蒙操作系统）是华为自主研发的面向全场景的分布式操作系统，其核心使命是打破设备孤岛，
ps2024电脑配置要求
‌Photoshop2024的电脑配置要求主要包括处理器、操作系统、内存、显卡、显示器分辨率、硬盘空间以及网络连接等方面的具体要求。‌下载地址(解锁版)：Adobe-Photoshop-2024-25.6.0.433.zip处理器‌：需要支持64位的多核Intel®或AMD处理器，具有SSE4.2或更高版本的2GHz或更快的处理器。对于Windows系统，推荐使用更快的处理器以获得更好的性能。‌操
麒麟系统离线安装docker
随着CentOS全面停服，国产操作系统会慢慢代替centos系统，在后续的项目中，项目部署的环境都必将是国产操作系统，本文就国产操作系统下如何离线安装docker,做下笔记分享一、材料准备1、国产操作系统麒麟10，arm64v82、dokcer部署包（版本：docker-18.09.tgz）3、部署docker脚本（docker.service），已经启动命令脚本（install.sh）二、编写d
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end